Úvod
Data Hotel
Další data
Typové úlohy
Všechny řešené příklady
Řešené příklady s detaily na wiki
Histogramy na wiki
Asociační pravidla na wiki
Kontingenční tabulky na wiki
Dvojice asociačních pravidel
Úvod
Data Hotel
Další data
Typové úlohy
Všechny řešené příklady
Řešené příklady s detaily na wiki
Histogramy na wiki
Asociační pravidla na wiki
Kontingenční tabulky na wiki
Dvojice asociačních pravidel
Data Hotel zahrnují mimo jiné údaje o hostech, jejich pobytech v hotelu, i o spokojenosti hostů s pobytem. Lze tedy formulovat i analytickou otázku: Jaké charakteristiky hostů, jejich bydliště a začátků jejich pobytů vedou k výraznému nárůstu relativní četnosti některé kombinace spokojenosti hostů a ceny pobytu oproti relativní četnosti této kombinace v celých datech?
Poznamenejme, že se jedná o jinou analytickou otázku než je otázka Jaké charakteristiky hostů, jejich bydliště a začátků jejich pobytů vedou s vysokou pravděpodobností ke spokojenosti nebo naopak k nespokojenosti hostů a jaká je cena těchto pobytů? řešená v příkladu týkajícím se vysoké konfidence. Rozdíl ve formulaci vede k použití 4ft-kvantifikátoru fundovaného nadprůměrného souvisení místo 4ft-kvantifikátoru fundované implikace.
Uvidíme, že použití 4ft-kvantifikátoru fundovaného nadprůměrného souvisení povede k výsledkům, které lze jen obtížně získat pomocí 4ft-kvantifikátoru fundované implikace.
Tuto otázku lze formulovat i tak, že nás zajímají asociační pravidla kde
Zadání procedury 4ft-Miner pro řešení výše naznačené úlohy je v následujícím obrázku. Ve sloupci ANTECEDENT je uvedeno zadání relevantních booleovských atributů Host(?) ∧ Host/Bydliště(?) ∧ Pobyt/Začátek(?), zadává se jako množina relevantních cedentů.
Ve sloupci QUANTIFIERS je zadáno, že nás zajímají taková pravidla, pro která je relativní četnost sukcedentu alespoň o 100% vyšší, než relativní četnost sukcedentu v celé matici a zároveň taková, že nejméně 150 pobytů splňuje jak antecedent tak sukcedent
Ve sloupci SUCCEDENT je uvedeno zadání pravé strany pravidla. Používá se, stejně jako pro sloupec SUCCEDENT zadání množiny relevantních cedentů.
Výsledkem běhu procedury 4ft-Miner je 10 pravidel vyhovujících zadaným podmínkám:
Čtvrté nejsilnější a zároveň nejkratší je pravidlo:
Pravidlo říká:
Detailní výstup pravidla je na následujícím obrázku.
Komentář k nárůstu relativní četnosti je v následujícím obrázku.
Konfidence tohoto pravidla je 0.31. Další podrobnosti lze zjistit na záložce TEXT.
Poznamenejme, že nejnižší konfidence mezi deseti výslednými pravidly má hodnotu 0.31. Pokud bychom chtěli získat, tato výsledná pravidla pomocí kvantifikátoru fundované implikace jako v předchozí úloze, museli bychom zadat minimální konfidenci jako 0.31. To ale vede k 468 výsledným pravidlům a je třeba použít další třídění pravidel.