====== Pravidla s vysokou konfidencí - obecně ====== ===== Rekapitulace příkladu ===== V [[lm_guha_di_ar_konf_priklad|příkladu]] jsme řešili analytickou otázku //Jaké charakteristiky hostů, jejich bydliště a začátků jejich pobytů vedou s vysokou pravděpodobností vedou ke spokojenosti nebo naopak k nespokojenosti hostů a jaká je cena těchto pobytů?// Otázku jsme transformovali do zadání procedury 4ft-Miner podle těchto zásad: - Analyzovali jsme matici dat HotelPlusExterni, jejíž řádky odpovídají pobytům hostů v hotelu. - Využili jsme toho, že analytickou otázku lze formulovat tak, že nás zajímají [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_pravidlo|asociační pravidla]] s antecedentem Host(?) ∧ Host/Bydliště(?) ∧ Pobyt/Začátek(?), sukcedentem DHodnoceni(?) ∧ PCenaCelkem_ef5(?) s konfidencí minimálně 0.8 a taková, že nejméně 50 pobytů splňuje jak antecedent tak sukcedent. - Tyto úvahy jsme vyjádřili pomocí parametrů ve sloupcích ANTECEDENT, QUANTIFIERS a SUCCEDENT. - Podstatným způsobem jsme využili možnosti [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftcedenthierarchy|zadávání relevantních antecedentů a sukcedentů]]. ===== Zobecnění příkladu ===== Obecný postup počínaje formulací analytické otázky a končící stanovením úlohy pro proceduru 4ft-Miner lze s využitím příkladu popsat takto: * Vycházíme z matice dat, jejíž řádky odpovídají objektům našeho zájmu. V našem příkladu nás zajímají pobyty klientů v hotelu. * Sloupce matice dat odpovídají atributům charakterizujícím objekty našeho zájmu. Jsou rozděleny do skupin **G1**,..., **GK**. * Zajímá nás analytická otázka //Pro jaké booleovské charakteristiky φ řádků matice platí, že řádky splňující φ s vysokou pravděpodobností pravděpodobností splňují i některou z booleovských charakteristik ψ? // * Tuto analytickou otázku formulujeme jako úlohu hledání asociačních pravidel φ ⇒//p//,//Base//ψ se 4ft-kvantifikátorem [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_4ft_kvantifikatory_vybrane&do=#kvantifikator_fundovane_implikace|fundované implikace]]. * Tuto analytickou otázku je možno formulovat i jako úlohu hledání asociačních pravidel φ →//p//,//supp//ψ se 4ft-kvantifikátorem [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_4ft_kvantifikatory_vybrane#kvantifikator_konfidence_-_podpora|konfidence-podpora]]. * Úlohu hledání asociačních pravidel specifikujeme pomocí parametrů procedury 4ft-Miner. ===== Zadání procedury ===== Zadání parametrů procedury 4ft-Miner se zahajuje v okně {{ ::sablona_zadani_vysoka_konfidence.png?800 |}} a provádí se podle těchto zásad: * množina relevantních booleovských atributů φ se zadává ve sloupci ANTECEDENT jako [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftcedenthierarchy|množina relevantních cedentů]]. * 4ft-kvantifikátor fundované implikace se zadává ve sloupci QUANTIFIERS pomocí dvojice 4ft-kvantifikátorů [[lm_guha_di_ar_hist_base_supp|BASE]] a [[lm_guha_di_ar_konf_obecne#4ft-kvantifikátor p-Implication|p-Implication]]. * 4ft-kvantifikátor lm_guha_di_pravidlo|konfidence-podpora se zadává ve sloupci QUANTIFIERS pomocí dvojice 4ft-kvantifikátorů [[lm_guha_di_ar_hist_base_supp|support]] a [[lm_guha_di_ar_konf_obecne#4ft-kvantifikátor p-Implication|p-Implication]]. * množina relevantních booleovských atributů ψ se zadává ve sloupci SUCCEDENT jako [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftcedenthierarchy|množina relevantních cedentů]]. ===== 4ft-kvantifikátor p-Implication ===== Použijeme [[https://lispminer.vse.cz/wiki/doku.php?id=mft:settings:ftquantifierfnc|Statistické 4ft-kvantifikátory ]], viz první krok v okně v levé části obrázku. Toto okno otevřeme tlačítkem QUANTIFIERS. Ve druhém kroku, viz pravou část obrázku, zadáme parametr //p//. {{ ::zadavani_p_implikace.png?800 |}} Oblast //Primary IM settings// nebudeme měnit.