====== Pravidla s vysokou konfidencí - obecně ======
===== Rekapitulace příkladu =====
V [[lm_guha_di_ar_konf_priklad|příkladu]] jsme řešili analytickou otázku //Jaké charakteristiky hostů, jejich bydliště a začátků jejich pobytů vedou s vysokou pravděpodobností vedou ke spokojenosti nebo naopak k nespokojenosti hostů a jaká je cena těchto pobytů?//
Otázku jsme transformovali do zadání procedury 4ft-Miner podle těchto zásad:
- Analyzovali jsme matici dat HotelPlusExterni, jejíž řádky odpovídají pobytům hostů v hotelu.
- Využili jsme toho, že analytickou otázku lze formulovat tak, že nás zajímají [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_pravidlo|asociační pravidla]] s antecedentem Host(?) ∧ Host/Bydliště(?) ∧ Pobyt/Začátek(?), sukcedentem DHodnoceni(?) ∧ PCenaCelkem_ef5(?) s konfidencí minimálně 0.8 a taková, že nejméně 50 pobytů splňuje jak antecedent tak sukcedent.
- Tyto úvahy jsme vyjádřili pomocí parametrů ve sloupcích ANTECEDENT, QUANTIFIERS a SUCCEDENT.
- Podstatným způsobem jsme využili možnosti [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftcedenthierarchy|zadávání relevantních antecedentů a sukcedentů]].
===== Zobecnění příkladu =====
Obecný postup počínaje formulací analytické otázky a končící stanovením úlohy pro proceduru 4ft-Miner lze s využitím příkladu popsat takto:
* Vycházíme z matice dat, jejíž řádky odpovídají objektům našeho zájmu. V našem příkladu nás zajímají pobyty klientů v hotelu.
* Sloupce matice dat odpovídají atributům charakterizujícím objekty našeho zájmu. Jsou rozděleny do skupin **G1**,..., **GK**.
* Zajímá nás analytická otázka //Pro jaké booleovské charakteristiky φ řádků matice platí, že řádky splňující φ s vysokou pravděpodobností pravděpodobností splňují i některou z booleovských charakteristik ψ? //
* Tuto analytickou otázku formulujeme jako úlohu hledání asociačních pravidel φ ⇒//p//,//Base//ψ se 4ft-kvantifikátorem [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_4ft_kvantifikatory_vybrane&do=#kvantifikator_fundovane_implikace|fundované implikace]].
* Tuto analytickou otázku je možno formulovat i jako úlohu hledání asociačních pravidel φ →//p//,//supp//ψ se 4ft-kvantifikátorem [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_4ft_kvantifikatory_vybrane#kvantifikator_konfidence_-_podpora|konfidence-podpora]].
* Úlohu hledání asociačních pravidel specifikujeme pomocí parametrů procedury 4ft-Miner.
===== Zadání procedury =====
Zadání parametrů procedury 4ft-Miner se zahajuje v okně
{{ ::sablona_zadani_vysoka_konfidence.png?800 |}}
a provádí se podle těchto zásad:
* množina relevantních booleovských atributů φ se zadává ve sloupci ANTECEDENT jako [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftcedenthierarchy|množina relevantních cedentů]].
* 4ft-kvantifikátor fundované implikace se zadává ve sloupci QUANTIFIERS pomocí dvojice 4ft-kvantifikátorů [[lm_guha_di_ar_hist_base_supp|BASE]] a [[lm_guha_di_ar_konf_obecne#4ft-kvantifikátor p-Implication|p-Implication]].
* 4ft-kvantifikátor lm_guha_di_pravidlo|konfidence-podpora se zadává ve sloupci QUANTIFIERS pomocí dvojice 4ft-kvantifikátorů [[lm_guha_di_ar_hist_base_supp|support]] a [[lm_guha_di_ar_konf_obecne#4ft-kvantifikátor p-Implication|p-Implication]].
* množina relevantních booleovských atributů ψ se zadává ve sloupci SUCCEDENT jako [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftcedenthierarchy|množina relevantních cedentů]].
===== 4ft-kvantifikátor p-Implication =====
Použijeme [[https://lispminer.vse.cz/wiki/doku.php?id=mft:settings:ftquantifierfnc|Statistické 4ft-kvantifikátory ]], viz první krok v okně v levé části obrázku. Toto okno otevřeme tlačítkem QUANTIFIERS. Ve druhém kroku, viz pravou část obrázku, zadáme parametr //p//.
{{ ::zadavani_p_implikace.png?800 |}}
Oblast //Primary IM settings// nebudeme měnit.