Úvod
Data Hotel
Další data
Typové úlohy
Všechny řešené příklady
Řešené příklady s detaily na wiki
Histogramy na wiki
Asociační pravidla na wiki
Kontingenční tabulky na wiki
Dvojice asociačních pravidel
Úvod
Data Hotel
Další data
Typové úlohy
Všechny řešené příklady
Řešené příklady s detaily na wiki
Histogramy na wiki
Asociační pravidla na wiki
Kontingenční tabulky na wiki
Dvojice asociačních pravidel
Data Hotel zahrnují mimo jiné údaje o hostech, jejich bydlišti, a o spokojenosti hostů s pobytem. Lze tedy formulovat analytickou otázku: Jsou významné rozdíly mezi jednotlivými státy ohledně vztahů mezi charakteristikami hosta (pohlaví, věk) a typickými parametry odpovědí v dotazníku pobytu? Symbolicky můžeme otázku zapsat jako
Vzhledem k tomu, že významný rozdíl lze chápat různým způsobem, upřesníme otázku takto: Existují takové skupiny hostů, že pro nějakou dvojici států je rozdíl procentuálních podílů nějaké kombinace výsledků v dotazníku větší než daná mez?
Otázku lze formalizovat pomocí dvojice podmíněných asociačních pravidel Host(?) → Dotazník(?) / Stát(1) a Host(?) → Dotazník(?) / Stát(2), jejich čtyřpolních tabulek Uvedená podmínka znamená, že nás zajímají dvojice podmíněných asociačních pravidel takové, že Stát(1) a Stát(2) jsou dva různé státy a platí
Takovou dvojici podmíněných asociačních pravidel chápeme jako SD4ft-pravidlo
Stát(1)×Stát(2): Host(?) →[Df-Conf,0.20,25,25] Dotazník(?),
kde →[Df-Conf,0.20,25,25] je SD4ft-kvantifikátor odpovídající výše uvedené podmínce. Dále budeme předpokládat, že
Zadání procedury SD4ft-Miner pro řešení výše naznačené úlohy je v následujícím obrázku. V poli ANTECEDENT je uvedeno zadání relevantních booleovských atributů Host(?), zadává se jako množina relevantních cedentů.
V poli QUANTIFIERS je zadán SD4ft-kvantifikátor →[Df-Conf,0.25,25,25]
V poli SUCCEDENT je uvedeno zadání relevantních booleovských atributů Dotazník(?), zadává se jako množina relevantních cedentů, stejně jako pro sloupec ANTECEDENT.
V poli FIRST SET je zadání relevantních booleovských atributů Stát(1), je použit atribut HStat
V poli SECOND SET je zadání relevantních booleovských atributů Stát(2), je použit atribut HStat.
Výsledkem běhu procedury SD4ft-Miner je 33 SD4ft-pravidel vyhovujících zadaným podmínkám:
Nejsilnější je první SD4ft pravidlo:
Detailní výstup pro toto SD4f-pravidlo je:
Označme Žena(do 28) = HPohlavi(žena) ∧ HVek(pod 21, od 21 do 28. Potom je z výstupu zřejmé: