Uživatelské nástroje

Nástroje pro tento web


Postranní lišta

Úvod


Data Hotel

Další data


Typové úlohy




Všechny řešené příklady


Řešené příklady s detaily na wiki

Histogramy na wiki

Asociační pravidla na wiki

Kontingenční tabulky na wiki

Dvojice asociačních pravidel


lm_guha_di_ct_tau_b_0_priklad

Negativní ordinální asociace - příklad

Motivace

Součástí dat Hotel jsou atributy DHodnoceni, DPersonal_ef3, DStrava_ef3, DUbytování_ef3 a DZabava_ef3. Atribut DHodnoceni má kategorie nespokojen, průměr, spokojen, všechny zbývající atributy mají kategorie nižší, průměr, vyšší. Je tedy přirozenou otázkou pro které z atributů *_ef3 a za jakých okolností platí, že pokud má atribut DHodnocení hodnotu nespokojen, pak atribut *_ef3 má hodnotu vyšší a analogicky pro dvojice průměr-průměr a spokojen-nižší.

Jinými slovy, zajímá nás analytická otázka: Za jakých okolností existuje silná negativní ordinální asociace mezi atributem DHodnocení a některým z atributů DPersonal_ef3, DStrava_ef3, DUbytování_ef3 a DZabava_ef3?

Relevantní okolnosti budeme definovat pomocí množiny booleovských atributů

Host(?) ∧ Host/Bydliště(?) ∧ Pobyt/Začátek(?) ∧ Meteo(?),

kde

Budeme požadovat, aby booleovský atribut charakterizující relevantní okolnosti byl splněn minimálně pro 20 řádků analyzované matice dat. Nízký minimální počet počet řádků je zvolen proto, že mezi atributy, které nás zajímají neočekáváme silné negativní ordinální asociace.

Pro vyjádření silné negativní ordinální asociace použijeme Kendallův kvantifikátor s hodnotou TauB=-0.7.

Zadání procedury

Zadání procedury KL-Miner pro řešení výše naznačené úlohy je v následujícím obrázku. V okně ROW ATTRIBUTES je uvedeno, že řádky kontingenční tabulky budou odpovídat kategoriím atributu DHodnoceni. V okně QUANTIFIERS jsou zadány KL-kvantifikátory SUM a KEND. Kvantifikátor SUM specifikuje, že nás zajímají okolnosti dané booleovskými atributy zadanými v okně CONDITION, kterým vyhovuje alespoň 20 řádků analyzované matice dat. Volíme tak nízkou hodnotou, protože neočekáváme silné negativní závislosti pro rozsáhlejší množiny řádků. Kvantifikátor KEND udává, že nás zajímají negativní závislosti mezi atributy s hodnotou TauB maximálně -0.7. V okně COLUMN ATTRIBUTES je uvedeno, že sloupce kontingenční tabulky budou postupně odpovídat kategoriím atributů DHodnoceni, DPersonal, DStrava, DUbytovani a DZabava.

Výsledky

Výsledkem běhu procedury KL-Miner je šest vztahů silné negativní ordinální asociace: Ze čtyř nejsilnějších vztahů je zvýrazněn vztah, který se týká atributů DHodnoceni a DZabava a pobytů hostů z ČR, přijíždějících v pátek roce 2012, přičemž je zatažená obloha a teplo. Hodnota TauB je -0.772: Vztah se týká atributů DHodnoceni a DZabava a hostů z ČR ve věku od 28 do 60 let kteří přijeli v pátek v roce 2012, přičemž byla obloha zatažená a bylo teplo. Na záložce TEXT lze zjistit, že vztah se týká 21 pobytů - řádků analyzované matice dat.

Silná positivní ordinální asociace se projevuje tím, že převažují řádky matice ve kterých nastává jedna ze situací:

  • atribut DHodnoceni nabývá hodnotu průměr a atribut DZabava nabývá hodnotu průměr
  • atribut DHodnoceni nabývá hodnotu spokojen a atribut DZabava nabývá hodnotu nižší.
lm_guha_di_ct_tau_b_0_priklad.txt · Poslední úprava: 2019/08/14 18:10 (upraveno mimo DokuWiki)