====== Positivní ordinální asociace - obecně ====== ===== Rekapitulace příkladu ===== V [[lm_guha_di_ct_tau_b_1_priklad|příkladu]] jsme řešili analytickou otázku //Za jakých okolností existuje silná pozitivní ordinální asociace mezi atributem DHodnocení a některým z atributů DPersonal_ef3, DStrava_ef3, DUbytování_ef3 a DZabava_ef3?// Otázku jsme transformovali do zadání procedury 4ft-Miner podle těchto zásad: - Analyzovali jsme matici dat HotelPlusExterni, jejíž řádky odpovídají pobytům hostů v hotelu. - Silnou ordinální závislost jsme vyjádřili podmínkou na minimální hodnotu parametru TauB Kendallova kvantifikátoru - Okolnosti jsme charakterizovali konjunkcí atributů Host(?) ∧ Host/Bydliště(?) ∧ Pobyt/Začátek(?). - Analytickou otázku jsme vyjádřili pomocí parametrů ve sloupcích ROW ATTRIBUTES, QUANTIFIERS, COLUMN ATTRIBUTES a CONDITION. - Podstatným způsobem jsme využili možnosti [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftcedenthierarchy|zadávání relevantních podmínek]]. ===== Zobecnění příkladu ===== Obecný postup počínaje formulací analytické otázky a končící stanovením úlohy pro proceduru KL-Miner lze s využitím příkladu popsat takto: * Vycházíme z matice dat, jejíž řádky odpovídají objektům našeho zájmu. V našem příkladu nás zajímají pobyty klientů v hotelu. * Sloupce matice dat odpovídají atributům charakterizujícím objekty našeho zájmu. Jsou rozděleny do skupin **G1**,..., **GK**. * Zajímá nás analytická otázka //Za jakých okolností daných booleovským atributem χ odvozeným z některých skupin atributů existuje silná pozitivní ordinální asociace mezi některým z atributů R1,...,Ru a některým z atributů C1, ..., Cv?// * Tuto analytickou otázku formulujeme jako úlohu hledání [[lm_guha_di_tabulka|KL-vztahů]] s [[lm_guha_di_tabulka|Kendallovým kvantifikátorem]]. To, že se nás zajímají silné pozitivní ordinální asociace vyjádříme tím, že požadujeme hodnotu parametru TauB blízko jedné. * Stanovíme dolní hranici počtu objektů-řádků, které musí splňovat booleovský atribut χ. Budeme předpokládat, že minimální počet objektů je MINOBJ. * Úlohu hledání KL-vztahů specifikujeme pomocí parametrů procedury KL-Miner. ===== Zadání procedury ===== Zadání parametrů procedury KL-Miner se zahajuje v okně {{ ::pozitivni_ordinalni_asociace_obecne_zadani.png |}} a provádí se podle těchto zásad: * seznam atributů R1,...,Ru se zadává v okně ROW ATTRIBUTES * seznam atributů C1, ..., Cv se zadává v okně COLUMN ATTRIBUTES * v okně QUANTIFIERS se zadá [[lm_guha_di_ct_tau_b_1_obecne#KL-kvantifikátor SUM |KL-kvantifikátor SUM]] pro určení minimálního počtu řádků splňujících podmínku * v okně QUANTIFIERS se dále zadá [[lm_guha_di_ct_tau_b_1_obecne#KL-kvantifikátor KEND |KL-kvantifikátor KEND]] pro specifikaci silné pozitivní ordinální asociace * množina relevantních booleovských atributů χ se zadává v okně CONDITION jako [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftcedenthierarchy|množina relevantních cedentů]]. ===== KL-kvantifikátor SUM ===== Použijeme [[https://lispminer.vse.cz/wiki/doku.php?id=mkl:settings:klquantifiersimple|Jednoduché frekvenční KL-kvantifikátory]], viz první krok v levé části obrázku. Ve druhém kroku, viz pravou část obrázku, zadáme: {{ ::pozitivni_asociace_zadani_minobj_kl.png |}} * míru zajímavosti //Sum of frequencies// v rozbalovací nabídce //Interest measure type // * způsob výpočtu míry zajímavosti //Absolute number// v rozbalovací nabídce //Source frequencies // * celý Category Range (použít tlačítko //Reset to All//) v //Category range // * operátor porovnání //Greater than or equal// v rozbalovací nabídce //Relation // * prahovou hodnotu MINOBJ v poli //Threshold value// * jednotky pro prahovou hodnotu //Absolute number// v rozbalovací nabídce //Threshold-value units// * oblast //Primary IM settings// nebudeme měnit. ===== KL-kvantifikátor KEND ===== Použijeme [[https://lispminer.vse.cz/wiki/doku.php?id=mft:settings:ftquantifierfnc|Statistické 4ft-kvantifikátory ]], viz první krok v okně v levé části obrázku. Toto okno otevřeme tlačítkem QUANTIFIERS. Ve druhém kroku, viz pravou část obrázku, zadáme: {{ ::pozitivni_asociace_zadani_kendall_kl.png |}} * míru zajímavosti //Kendall's TauB coefficient// v rozbalovací nabídce //Interest measure type // * způsob výpočtu míry zajímavosti //Absolute number// v rozbalovací nabídce //Source frequencies // * operátor porovnání //Greater than or equal// v rozbalovací nabídce //Relation // * prahovou hodnotu TauB v poli //Threshold value// * volbu v oblasti //Parameters// nebudeme zaškrtávat * oblast //Primary IM settings// nebudeme měnit.