Obsah

Nárůst relativní četnosti - příklad

Analytická otázka

Data Hotel zahrnují mimo jiné údaje o hostech, jejich pobytech v hotelu, i o spokojenosti hostů s pobytem. Lze tedy formulovat i analytickou otázku: Jaké charakteristiky hostů, jejich bydliště a začátků jejich pobytů vedou k výraznému nárůstu relativní četnosti některé kombinace spokojenosti hostů a ceny pobytu oproti relativní četnosti této kombinace v celých datech?

Poznamenejme, že se jedná o jinou analytickou otázku než je otázka Jaké charakteristiky hostů, jejich bydliště a začátků jejich pobytů vedou s vysokou pravděpodobností ke spokojenosti nebo naopak k nespokojenosti hostů a jaká je cena těchto pobytů? řešená v příkladu týkajícím se vysoké konfidence. Rozdíl ve formulaci vede k použití 4ft-kvantifikátoru fundovaného nadprůměrného souvisení místo 4ft-kvantifikátoru fundované implikace.

Uvidíme, že použití 4ft-kvantifikátoru fundovaného nadprůměrného souvisení povede k výsledkům, které lze jen obtížně získat pomocí 4ft-kvantifikátoru fundované implikace.

Analytická otázka - převod na asociační pravidla

Tuto otázku lze formulovat i tak, že nás zajímají asociační pravidla kde

Zadání procedury

Zadání procedury 4ft-Miner pro řešení výše naznačené úlohy je v následujícím obrázku. Ve sloupci ANTECEDENT je uvedeno zadání relevantních booleovských atributů Host(?) ∧ Host/Bydliště(?) ∧ Pobyt/Začátek(?), zadává se jako množina relevantních cedentů.

Ve sloupci QUANTIFIERS je zadáno, že nás zajímají taková pravidla, pro která je relativní četnost sukcedentu alespoň o 100% vyšší, než relativní četnost sukcedentu v celé matici a zároveň taková, že nejméně 150 pobytů splňuje jak antecedent tak sukcedent

Ve sloupci SUCCEDENT je uvedeno zadání pravé strany pravidla. Používá se, stejně jako pro sloupec SUCCEDENT zadání množiny relevantních cedentů.

Výsledky

Výsledkem běhu procedury 4ft-Miner je 10 pravidel vyhovujících zadaným podmínkám:

Čtvrté nejsilnější a zároveň nejkratší je pravidlo:

Pravidlo říká:

Detailní výstup pravidla je na následujícím obrázku.

Komentář k nárůstu relativní četnosti je v následujícím obrázku.

Konfidence tohoto pravidla je 0.31. Další podrobnosti lze zjistit na záložce TEXT.

Porovnání s úlohou na hledání pravidel s vysokou konfidencí

Poznamenejme, že nejnižší konfidence mezi deseti výslednými pravidly má hodnotu 0.31. Pokud bychom chtěli získat, tato výsledná pravidla pomocí kvantifikátoru fundované implikace jako v předchozí úloze, museli bychom zadat minimální konfidenci jako 0.31. To ale vede k 468 výsledným pravidlům a je třeba použít další třídění pravidel.