Uživatelské nástroje

Nástroje pro tento web


Postranní lišta

Úvod

Důležité pojmy

Vztahy, s nimiž procedury pracují

GUHA procedury

GUHA procedury - společné prvky

Observační kalkuly - relevantní výsledky

Důležité tématické okruhy

start

Metoda GUHA

GUHA je původní česká metoda explorační analýzy dat. Jejím cílem je nabízet vše zajímavé, co platí v daných datech. První publikace o metodě GUHA pocházejí z roku 1966. Od devadesátých let minulého století je metoda rozvíjena a aplikována jako nástroj pro dobývání znalostí z databází, viz článek The GUHA method and its meaning for data mining.

Metoda je realizována pomocí GUHA procedur. Vstupem procedury je analyzovaná matice dat a několik parametrů definujících rozsáhlou množinu relevantních vztahů. Výstupem jsou všechny prosté vztahy, tedy vztahy pravdivé v dané matici dat a zároveň nejkratší možné.

GUHA procedury ASSOC a IMPL implementované v sedmdesátých letech minulého století pracují se vztahy, které lze chápat jako zobecnění asociačních pravidel nezávisle definovaných na počátku devadesátých let. Implementace procedur ASSOC a IMPL je založena na využití bitových řetízků, nepoužívá se známý algoritmus apriori. Nejrozsáhlejší implementací metody GUHA v současné době je pravděpodobně systém LISp-Miner.

Tato wiki je součástí systému systému tří wiki, jehož cílem je prezentovat z různých hledisek systém LISp-Miner a související výzkum spojený s metodou GUHA.

Cílem tohoto systému wiki však není prezentovat všechny aktivity spojené s metodou GUHA. To je cílem článku The GUHA method and its meaning for data mining, kde je popsán stav k roku 2010. Je zde však uveden přehled vybraných důležitých publikací o metodě GUHA.

start.txt · Poslední úprava: 2020/02/23 18:27 (upraveno mimo DokuWiki)