Uživatelské nástroje

Nástroje pro tento web


Postranní lišta

Úvod


Data Hotel

Další data


Typové úlohy




Všechny řešené příklady


Řešené příklady s detaily na wiki

Histogramy na wiki

Asociační pravidla na wiki

Kontingenční tabulky na wiki

Dvojice asociačních pravidel


lm_guha_di_ct_tau_b_1_obecne

Positivní ordinální asociace - obecně

Rekapitulace příkladu

V příkladu jsme řešili analytickou otázku Za jakých okolností existuje silná pozitivní ordinální asociace mezi atributem DHodnocení a některým z atributů DPersonal_ef3, DStrava_ef3, DUbytování_ef3 a DZabava_ef3? Otázku jsme transformovali do zadání procedury 4ft-Miner podle těchto zásad:

  1. Analyzovali jsme matici dat HotelPlusExterni, jejíž řádky odpovídají pobytům hostů v hotelu.
  2. Silnou ordinální závislost jsme vyjádřili podmínkou na minimální hodnotu parametru TauB Kendallova kvantifikátoru
  3. Okolnosti jsme charakterizovali konjunkcí atributů Host(?) ∧ Host/Bydliště(?) ∧ Pobyt/Začátek(?).
  4. Analytickou otázku jsme vyjádřili pomocí parametrů ve sloupcích ROW ATTRIBUTES, QUANTIFIERS, COLUMN ATTRIBUTES a CONDITION.
  5. Podstatným způsobem jsme využili možnosti zadávání relevantních podmínek.

Zobecnění příkladu

Obecný postup počínaje formulací analytické otázky a končící stanovením úlohy pro proceduru KL-Miner lze s využitím příkladu popsat takto:

  • Vycházíme z matice dat, jejíž řádky odpovídají objektům našeho zájmu. V našem příkladu nás zajímají pobyty klientů v hotelu.
  • Sloupce matice dat odpovídají atributům charakterizujícím objekty našeho zájmu. Jsou rozděleny do skupin G1,…, GK.
  • Zajímá nás analytická otázka Za jakých okolností daných booleovským atributem χ odvozeným z některých skupin atributů existuje silná pozitivní ordinální asociace mezi některým z atributů R1,…,Ru a některým z atributů C1, …, Cv?
  • Tuto analytickou otázku formulujeme jako úlohu hledání KL-vztahů s Kendallovým kvantifikátorem. To, že se nás zajímají silné pozitivní ordinální asociace vyjádříme tím, že požadujeme hodnotu parametru TauB blízko jedné.
  • Stanovíme dolní hranici počtu objektů-řádků, které musí splňovat booleovský atribut χ. Budeme předpokládat, že minimální počet objektů je MINOBJ.
  • Úlohu hledání KL-vztahů specifikujeme pomocí parametrů procedury KL-Miner.

Zadání procedury

Zadání parametrů procedury KL-Miner se zahajuje v okně a provádí se podle těchto zásad:

  • seznam atributů R1,…,Ru se zadává v okně ROW ATTRIBUTES
  • seznam atributů C1, …, Cv se zadává v okně COLUMN ATTRIBUTES
  • v okně QUANTIFIERS se zadá KL-kvantifikátor SUM pro určení minimálního počtu řádků splňujících podmínku
  • v okně QUANTIFIERS se dále zadá KL-kvantifikátor KEND pro specifikaci silné pozitivní ordinální asociace
  • množina relevantních booleovských atributů χ se zadává v okně CONDITION jako množina relevantních cedentů.

KL-kvantifikátor SUM

Použijeme Jednoduché frekvenční KL-kvantifikátory, viz první krok v levé části obrázku. Ve druhém kroku, viz pravou část obrázku, zadáme:

  • míru zajímavosti Sum of frequencies v rozbalovací nabídce Interest measure type
  • způsob výpočtu míry zajímavosti Absolute number v rozbalovací nabídce Source frequencies
  • celý Category Range (použít tlačítko Reset to All) v Category range
  • operátor porovnání Greater than or equal v rozbalovací nabídce Relation
  • prahovou hodnotu MINOBJ v poli Threshold value
  • jednotky pro prahovou hodnotu Absolute number v rozbalovací nabídce Threshold-value units
  • oblast Primary IM settings nebudeme měnit.

KL-kvantifikátor KEND

Použijeme Statistické 4ft-kvantifikátory , viz první krok v okně v levé části obrázku. Toto okno otevřeme tlačítkem QUANTIFIERS. Ve druhém kroku, viz pravou část obrázku, zadáme:

  • míru zajímavosti Kendall's TauB coefficient v rozbalovací nabídce Interest measure type
  • způsob výpočtu míry zajímavosti Absolute number v rozbalovací nabídce Source frequencies
  • operátor porovnání Greater than or equal v rozbalovací nabídce Relation
  • prahovou hodnotu TauB v poli Threshold value
  • volbu v oblasti Parameters nebudeme zaškrtávat
  • oblast Primary IM settings nebudeme měnit.
lm_guha_di_ct_tau_b_1_obecne.txt · Poslední úprava: 2018/09/09 19:38 (upraveno mimo DokuWiki)