====== GUHA procedura ====== Východiskem je situace, kdy nás zajímá nějaká, potenciálně nekonečná množina objektů (osob, pacientů, výrobků, ...) a máme k dispozici výsledek pozorování konečné podmnožiny celé množiny. Výsledky pozorování jsou ve formě matice dat: {{ ::vychodisko_guha.png?600 |}} Naším cílem je získat z napozorovaných dat všechny zajímavé vztahy pravdivé pro celou množinu objektů. Využijeme přitom statistické testy hypotéz, které umožňují přijmout na základě platnosti vhodného tvrzení o napozorovaných datech jisté zajímavé tvrzení o celé množině dat. Tvrzení pravdivé o celých datech nazýváme v této souvislosti //verifikovaným teoretickým tvrzením//. Tvrzení o napozorovaných datech nazýváme //observačním tvrzením//. Důležité je, že mezi teoretickými a observačními tvrzeními obvykle platí vztah 1:1. Tento vztah je zprostředkován statistickými testy hypotéz. {{ ::teoreticke_observacni_1_1.png?600 |}} Chceme-li tedy znát všechna zajímavá verifikovaná teoretická tvrzení, stačí nalézt všechna vhodná observační tvrzení pravdivá v daných datech. Úkolem GUHA procedury je poskytnout všechna vhodná pravdivá tvrzení o observačních datech: {{ ::smysl_guha_procedury.png?600 |}} GUHA procedura pracuje podle následujícího schematu. {{ ::schema_guha_procedury.png |}} Na vstupu GUHA procedury jsou jednak analyzovaná data a jednak několik parametrů zadávajících rozsáhlou množinu relevantních observačních tvrzení. GUHA procedura generuje všechna relevantní observační tvrzení a verifikuje je v daných datech. Na výstupu jsou všechna prostá tvrzení. Relevantní tvrzení je prosté, je-li pravdivé v daných datech a zároveň neplyne zjevným způsobem z jiného, kratšího a ve výstupu již uvedeného tvrzení.