Negativní ordinální asociace - obecně
Rekapitulace příkladu
V příkladu jsme řešili analytickou otázku Za jakých okolností existuje silná negativní ordinální asociace mezi atributem DHodnocení a některým z atributů DPersonal_ef3, DStrava_ef3, DUbytování_ef3 a DZabava_ef3?
Otázku jsme transformovali do zadání procedury 4ft-Miner podle těchto zásad:
Analyzovali jsme matici dat HotelPlusExterni, jejíž řádky odpovídají pobytům hostů v hotelu.
Silnou ordinální závislost jsme vyjádřili podmínkou na maximální hodnotu parametru TauB Kendallova kvantifikátoru
Okolnosti jsme charakterizovali konjunkcí atributů Host(?) ∧ Host/Bydliště(?) ∧ Pobyt/Začátek(?) ∧ Meteo(?).
Analytickou otázku jsme vyjádřili pomocí parametrů ve sloupcích ROW ATTRIBUTES, QUANTIFIERS, COLUMN ATTRIBUTES a CONDITION.
-
Zobecnění příkladu
Obecný postup počínaje formulací analytické otázky a končící stanovením úlohy pro proceduru KL-Miner lze s využitím příkladu popsat takto:
Vycházíme z matice dat, jejíž řádky odpovídají objektům našeho zájmu. V našem příkladu nás zajímají pobyty klientů v hotelu.
Sloupce matice dat odpovídají atributům charakterizujícím objekty našeho zájmu. Jsou rozděleny do skupin G1,…, GK.
Zajímá nás analytická otázka Za jakých okolností daných booleovským atributem χ odvozeným z některých skupin atributů existuje silná negativní ordinální asociace mezi některým z atributů R1,…,Ru a některým z atributů C1, …, Cv?
Tuto analytickou otázku formulujeme jako úlohu hledání
KL-vztahů s
Kendallovým kvantifikátorem. To, že se nás zajímají silné pozitivní ordinální asociace vyjádříme tím, že požadujeme hodnotu parametru TauB blízko mínus jedné.
Stanovíme dolní hranici počtu objektů-řádků, které musí splňovat booleovský atribut χ. Budeme předpokládat, že minimální počet objektů je MINOBJ.
Úlohu hledání KL-vztahů specifikujeme pomocí parametrů procedury KL-Miner.
Zadání procedury
Zadání parametrů procedury KL-Miner se zahajuje v okně
a provádí se podle těchto zásad:
seznam atributů R1,…,Ru se zadává v okně ROW ATTRIBUTES
seznam atributů C1, …, Cv se zadává v okně COLUMN ATTRIBUTES
v okně QUANTIFIERS se zadá
KL-kvantifikátor SUM pro určení minimálního počtu řádků splňujících podmínku
v okně QUANTIFIERS se dále zadá
KL-kvantifikátor KEND pro specifikaci silné negativní ordinnální asociace
-
KL-kvantifikátor SUM
Použijeme Jednoduché frekvenční KL-kvantifikátory, viz první krok v levé části obrázku. Ve druhém kroku, viz pravou část obrázku, zadáme:
míru zajímavosti Sum of frequencies v rozbalovací nabídce Interest measure type
způsob výpočtu míry zajímavosti Absolute number v rozbalovací nabídce Source frequencies
celý Category Range (použít tlačítko Reset to All) v Category range
operátor porovnání Greater than or equal v rozbalovací nabídce Relation
prahovou hodnotu MINOBJ v poli Threshold value
jednotky pro prahovou hodnotu Absolute number v rozbalovací nabídce Threshold-value units
oblast Primary IM settings nebudeme měnit.
KL-kvantifikátor KEND
Použijeme Statistické 4ft-kvantifikátory , viz první krok v okně v levé části obrázku. Toto okno otevřeme tlačítkem QUANTIFIERS. Ve druhém kroku, viz pravou část obrázku, zadáme:
míru zajímavosti Kendall's TauB coefficient v rozbalovací nabídce Interest measure type
způsob výpočtu míry zajímavosti Absolute number v rozbalovací nabídce Source frequencies
operátor porovnání Greater than or equal v rozbalovací nabídce Relation
prahovou hodnotu TauB v poli Threshold value
volbu v oblasti Parameters nebudeme zaškrtávat
oblast Primary IM settings nebudeme měnit.