Úvod
Důležité pojmy
Vztahy, s nimiž procedury pracují
GUHA procedury
GUHA procedury - společné prvky
Observační kalkuly - relevantní výsledky
Důležité tématické okruhy
Úvod
Důležité pojmy
Vztahy, s nimiž procedury pracují
GUHA procedury
GUHA procedury - společné prvky
Observační kalkuly - relevantní výsledky
Důležité tématické okruhy
GUHA je původní česká metoda explorační analýzy dat. Jejím cílem je nabízet vše zajímavé, co platí v daných datech. První publikace o metodě GUHA pocházejí z roku 1966. Od devadesátých let minulého století je metoda rozvíjena a aplikována jako nástroj pro dobývání znalostí z databází, viz článek The GUHA method and its meaning for data mining.
Metoda je realizována pomocí GUHA procedur. Vstupem procedury je analyzovaná matice dat a několik parametrů definujících rozsáhlou množinu relevantních vztahů. Výstupem jsou všechny prosté vztahy, tedy vztahy pravdivé v dané matici dat a zároveň nejkratší možné.
GUHA procedury ASSOC a IMPL implementované v sedmdesátých letech minulého století pracují se vztahy, které lze chápat jako zobecnění asociačních pravidel nezávisle definovaných na počátku devadesátých let. Implementace procedur ASSOC a IMPL je založena na využití bitových řetízků, nepoužívá se známý algoritmus apriori. Nejrozsáhlejší implementací metody GUHA v současné době je pravděpodobně systém LISp-Miner.
Tato wiki je součástí systému systému tří wiki, jehož cílem je prezentovat z různých hledisek systém LISp-Miner a související výzkum spojený s metodou GUHA.
Cílem tohoto systému wiki však není prezentovat všechny aktivity spojené s metodou GUHA. To je cílem článku The GUHA method and its meaning for data mining, kde je popsán stav k roku 2010. Je zde však uveden přehled vybraných důležitých publikací o metodě GUHA.