====== Nárůst relativní četnosti - obecně ====== ===== Rekapitulace příkladu ===== V [[lm_guha_di_ar_aa_priklad|příkladu]] jsme řešili analytickou otázku //Jaké charakteristiky hostů, jejich bydliště a začátků jejich pobytů vedou k výraznému nárůstu relativní četnosti některé kombinace spokojenosti hostů a ceny pobytu oproti relativní četnosti této kombinace v celých datech?// Otázku jsme transformovali do zadání procedury 4ft-Miner podle těchto zásad: - Analyzovali jsme matici dat HotelPlusExterni, jejíž řádky odpovídají pobytům hostů v hotelu. - Využili jsme toho, že analytickou otázku lze formulovat tak, že nás zajímají [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_pravidlo|asociační pravidla]] s antecedentem Host(?) ∧ Host/Bydliště(?) ∧ Pobyt/Začátek(?), sukcedentem DHodnoceni(nespokojen) nebo DHodnoceni(spokojen) pro která je relativní četnost sukcedentu alespoň o 100% vyšší než relativní četnost sukcedentu v celé matici a zároveň taková, že nejméně 150 pobytů splňuje jak antecedent tak sukcedent - Tyto úvahy jsme vyjádřili pomocí parametrů ve sloupcích ANTECEDENT, QUANTIFIERS a SUCCEDENT. - Podstatným způsobem jsme využili možnosti [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftcedenthierarchy|zadávání relevantních antecedentů a sukcedentů]]. ===== Zobecnění příkladu ===== Obecný postup počínaje formulací analytické otázky a končící stanovením úlohy pro proceduru 4ft-Miner lze s využitím příkladu popsat takto: * Vycházíme z matice dat, jejíž řádky odpovídají objektům našeho zájmu. V našem příkladu nás zajímají pobyty klientů v hotelu. * Sloupce matice dat odpovídají atributům charakterizujícím objekty našeho zájmu. Jsou rozděleny do skupin **G1**,..., **GK**. * Zajímá nás analytická otázka //Pro jaké booleovské charakteristiky φ a ψ řádků matice platí, že relativní četnost řádků splňujících ψ mezi řádky splňujícími φ je výrazně vyšší, než je relativní četnost řádků splňujících ψ v celé matici dat? // * Tuto analytickou otázku formulujeme jako úlohu hledání asociačních pravidel {{::4ft_kvantifikator_aa_fundovany.png?100|}} se 4ft-kvantifikátorem [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_4ft_kvantifikatory_vybrane#kvantifikator_fundovaneho_nadprumerneho_souviseni|fundovaného nadprůměrného souvisení]]. * Tuto analytickou otázku je možno formulovat i jako úlohu hledání asociačních pravidel {{::4ft_kvantifikator_aa_s_podporou.png?80|}}se 4ft-kvantifikátorem [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_4ft_kvantifikatory_vybrane#kvantifikator_nadprumerneho_souviseni_s_podporou|nadprůměrného souvisení s podporou]]. * Úlohu hledání asociačních pravidel specifikujeme pomocí parametrů procedury 4ft-Miner. ===== Zadání procedury ===== Zadání parametrů procedury 4ft-Miner se zahajuje v okně {{ ::sablona_zadani_above_average.png?800 |}} a provádí se podle těchto zásad: * množina relevantních booleovských atributů φ se zadává ve sloupci ANTECEDENT jako [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftcedenthierarchy|množina relevantních cedentů]]. * 4ft-kvantifikátor [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_4ft_kvantifikatory_vybrane#kvantifikator_fundovaneho_nadprumerneho_souviseni|fundovaného nadprůměrného souvisení]] se zadává ve sloupci QUANTIFIERS pomocí dvojice 4ft-kvantifikátorů [[lm_guha_di_ar_hist_base_supp|BASE]] a [[lm_guha_di_ar_aa_obecne#4ft-kvantifikátor nadprůměrného souvisení| nadprůměrné souvisení]]. * 4ft-kvantifikátor [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_4ft_kvantifikatory_vybrane#kvantifikator_nadprumerneho_souviseni_s_podporou|nadprůměrného souvisení s podporou]] se zadává ve sloupci QUANTIFIERS pomocí dvojice 4ft-kvantifikátorů [[lm_guha_di_ar_hist_base_supp|support]] a [[lm_guha_di_ar_aa_obecne#4ft-kvantifikátor nadprůměrného souvisení| nadprůměrné souvisení]]. * množina relevantních booleovských atributů ψ se zadává ve sloupci SUCCEDENT jako [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftcedenthierarchy|množina relevantních cedentů]]. ===== 4ft-kvantifikátor nadprůměrného souvisení ===== Použijeme [[https://lispminer.vse.cz/wiki/doku.php?id=mft:settings:ftquantifierfnc|Statistické 4ft-kvantifikátory ]], viz první krok v okně v levé části obrázku. Toto okno otevřeme tlačítkem QUANTIFIERS. Ve druhém kroku, viz pravou část obrázku, zadáme parametr //p//. {{ ::zadavani_aa_kvantifikatoru.png?800 |}} Oblast //Primary IM settings// nebudeme měnit.