====== GUHA a LISp-Miner - specifické rysy ====== Řešení [[lm_guha_di_typy_uloh|typových úloh]] je umožněno specifickými rysy GUHA procedur implementovaných v systému LISp-Miner. Jedná se zejména o * možnost práce se [[lm_guha_di_typy_uloh_guha_lm#Základní booleovské atributy a literály|základními booleovskými atributy A(α) a s literály]] * bohaté možnosti [[lm_guha_di_typy_uloh_guha_lm#Množiny relevantních literálů|zadávání množin relevantních literálů]] odvozených z daného atributu * možnost práce s [[lm_guha_di_typy_uloh_guha_lm#Dílčí cedenty a skupiny atributů|dílčími cedenty - booleovskými atributy charakterizujícími skupiny atributů]] * bohaté možnosti zadávání [[lm_guha_di_typy_uloh_guha_lm#Množiny relevantních dílčích cedentů|množin relevantních dílčích cedentů]], mimo jiné i možnost využití jak konjunkcí tak i disjunkcí literálů * bohaté možnosti zadávání [[lm_guha_di_typy_uloh_guha_lm#Množiny relevantních cedentů|množin relevantních cedentů]] - konjunkcí dílčích cedentů * možnost práce s [[lm_guha_di_typy_uloh_guha_lm#Různé typy vztahů|různými typy vztahů]] - GUHA asociačními pravidly, histogramy, vztahy popsanými kontingenčními tabulkami dvojic kategoriálních atributů a akčními pravidly * možnost práce s [[lm_guha_di_typy_uloh_guha_lm#Podmíněné vztahy|podmíněnými vztahy]] týkajícími se pouze podmatic určeným konjunkcemi dílčích cedentů * bohaté možnosti zadávání [[lm_guha_di_typy_uloh_guha_lm#Pravdivost vztahů|pravdivosti vztahů]] v dané matici dat spojených s podmínkami na vhodné kontingenční tabulky * možnost využití [[lm_guha_di_typy_uloh_guha_lm#GUHA procedury typu SD| GUHA procedur typu SD]] ===== Základní booleovské atributy a literály===== GUHA procedury systému LISp-Miner pracují se [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_zakl_bool|základními booleovskými atributy]] A(α), kde α je vlastní podmnožina množiny hodnot (kategorií) atributu A. [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_literal&do=|Literál]] je základní booleovský atribut A(α) nebo jeho negace ¬A(α). Jsou k dispozici bohaté [[lm_guha_di_typy_uloh_guha_lm#Množiny relevantních literálů|možnosti, jak zadat množinu relevantních literálů]], které se mají automaticky pro vygenerovat pro daný atribut A. Výhody používání základních booleovských atributů A(α) jsou demonstrovány [[lm_guha_di_typul_4ft#Porovnání procedury 4ft-Miner a arules package v R|na porovnání procedury 4ft-Miner a algoritmu apriori]]. Algoritmus apriori pracuje pouze s booleovskými atributy - dvojicemi A(a) kde a je jedna z přípustných hodnot atributu A. Na základě uvedených příkladů lze konstatovat, že použití koeficientů poskytuje možnosti, které lze jen těžko nebo prakticky vůbec realizovat pomocí algoritmu apriori. Další podrobnosti jsou též v článku [[https://content.iospress.com/articles/intelligent-data-analysis/ida160069|Apriori and GUHA – Comparing two approaches to data mining with association rules]]. ===== Množiny relevantních literálů ===== Příklad zadání množiny relevantních literálů je v následujícím obrázku. {{ :priklad_zadani_relevantnich_literalu.png |}} Podrobnosti jsou uvedeny [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftliteral|zde]] a také v této {{ :di_typove_ulohy_literaly.pdf |prezentaci}}. ===== Dílčí cedenty a skupiny atributů ===== Při předzpracování dat je možno vytvořit skupiny atributů které často jsou důležitým nástrojem pro porozumění jak celé problematice i datům. Skupiny atributů jsou důležité i pro komunikaci s majitelem dat. Příklad skupin vytvořených pro data [[lm_guha_di_hotel_prehled_skupin|Hotel]] je v následujícím obrázku. {{ :skupiny_priklad.png |}} Tyto skupiny lze využít při zadávání parametrů procedur tak, že množiny relevantních dílčích cedentů jsou definovány jako množiny vhodných booleovských atributů charakterizujících jednotlivé skupiny atributů. Příklad takového využití skupin je v následujícím obrázku. {{ :skupiny_priklad_pouziti.png?400 |}} ===== Množina relevantních dílčích cedentů ===== Ukázka zadávání množiny relevantních dílčích cedentů je v následujícím obrázku. ´ {{ :priklad_zadani_relevantnich_dilcich_cedentu.png |}} Podrobnosti jsou uvedeny [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftpartialcedent|zde]]. ===== Množiny relevantních cedentů ===== Detailní i celkový pohled na příklad zadání množiny relevantních cedentů je v následujícím obrázku. {{ :priklad_zadani_relevantnich_cedentu.png |}} Podrobnosti jsou uvedeny [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftcedent|zde]]. ===== Různé typy vztahů ===== ===== Podmíněné vztahy ===== ===== Pravdivost vztahů ===== ===== GUHA procedury typu SD =====