Úvod
Data Hotel
Další data
Typové úlohy
Všechny řešené příklady
Řešené příklady s detaily na wiki
Histogramy na wiki
Asociační pravidla na wiki
Kontingenční tabulky na wiki
Dvojice asociačních pravidel
Úvod
Data Hotel
Další data
Typové úlohy
Všechny řešené příklady
Řešené příklady s detaily na wiki
Histogramy na wiki
Asociační pravidla na wiki
Kontingenční tabulky na wiki
Dvojice asociačních pravidel
Součástí dat Hotel jsou atributy DHodnoceni, DPersonal_ef3, DStrava_ef3, DUbytování_ef3 a DZabava_ef3. Atribut DHodnoceni má kategorie nespokojen, průměr, spokojen, všechny zbývající atributy mají kategorie nižší, průměr, vyšší. Je tedy přirozenou otázkou pro které z atributů *_ef3 a za jakých okolností platí, že pokud má atribut DHodnocení hodnotu nespokojen, pak atribut *_ef3 má hodnotu vyšší a analogicky pro dvojice průměr-průměr a spokojen-nižší.
Jinými slovy, zajímá nás analytická otázka: Za jakých okolností existuje silná negativní ordinální asociace mezi atributem DHodnocení a některým z atributů DPersonal_ef3, DStrava_ef3, DUbytování_ef3 a DZabava_ef3?
Relevantní okolnosti budeme definovat pomocí množiny booleovských atributů
Host(?) ∧ Host/Bydliště(?) ∧ Pobyt/Začátek(?) ∧ Meteo(?),
kde
Budeme požadovat, aby booleovský atribut charakterizující relevantní okolnosti byl splněn minimálně pro 20 řádků analyzované matice dat. Nízký minimální počet počet řádků je zvolen proto, že mezi atributy, které nás zajímají neočekáváme silné negativní ordinální asociace.
Pro vyjádření silné negativní ordinální asociace použijeme Kendallův kvantifikátor s hodnotou TauB=-0.7.
Zadání procedury KL-Miner pro řešení výše naznačené úlohy je v následujícím obrázku. V okně ROW ATTRIBUTES je uvedeno, že řádky kontingenční tabulky budou odpovídat kategoriím atributu DHodnoceni. V okně QUANTIFIERS jsou zadány KL-kvantifikátory SUM a KEND. Kvantifikátor SUM specifikuje, že nás zajímají okolnosti dané booleovskými atributy zadanými v okně CONDITION, kterým vyhovuje alespoň 20 řádků analyzované matice dat. Volíme tak nízkou hodnotou, protože neočekáváme silné negativní závislosti pro rozsáhlejší množiny řádků. Kvantifikátor KEND udává, že nás zajímají negativní závislosti mezi atributy s hodnotou TauB maximálně -0.7. V okně COLUMN ATTRIBUTES je uvedeno, že sloupce kontingenční tabulky budou postupně odpovídat kategoriím atributů DHodnoceni, DPersonal, DStrava, DUbytovani a DZabava.
Výsledkem běhu procedury KL-Miner je šest vztahů silné negativní ordinální asociace: Ze čtyř nejsilnějších vztahů je zvýrazněn vztah, který se týká atributů DHodnoceni a DZabava a pobytů hostů z ČR, přijíždějících v pátek roce 2012, přičemž je zatažená obloha a teplo. Hodnota TauB je -0.772: Vztah se týká atributů DHodnoceni a DZabava a hostů z ČR ve věku od 28 do 60 let kteří přijeli v pátek v roce 2012, přičemž byla obloha zatažená a bylo teplo. Na záložce TEXT lze zjistit, že vztah se týká 21 pobytů - řádků analyzované matice dat.
Silná positivní ordinální asociace se projevuje tím, že převažují řádky matice ve kterých nastává jedna ze situací: