Uživatelské nástroje

Nástroje pro tento web


Postranní lišta

Úvod


Data Hotel

Další data


Typové úlohy




Všechny řešené příklady


Řešené příklady s detaily na wiki

Histogramy na wiki

Asociační pravidla na wiki

Kontingenční tabulky na wiki

Dvojice asociačních pravidel


lm_guha_di_ar_aa_obecne

Nárůst relativní četnosti - obecně

Rekapitulace příkladu

V příkladu jsme řešili analytickou otázku Jaké charakteristiky hostů, jejich bydliště a začátků jejich pobytů vedou k výraznému nárůstu relativní četnosti některé kombinace spokojenosti hostů a ceny pobytu oproti relativní četnosti této kombinace v celých datech?

Otázku jsme transformovali do zadání procedury 4ft-Miner podle těchto zásad:

  1. Analyzovali jsme matici dat HotelPlusExterni, jejíž řádky odpovídají pobytům hostů v hotelu.
  2. Využili jsme toho, že analytickou otázku lze formulovat tak, že nás zajímají asociační pravidla s antecedentem Host(?) ∧ Host/Bydliště(?) ∧ Pobyt/Začátek(?), sukcedentem DHodnoceni(nespokojen) nebo DHodnoceni(spokojen) pro která je relativní četnost sukcedentu alespoň o 100% vyšší než relativní četnost sukcedentu v celé matici a zároveň taková, že nejméně 150 pobytů splňuje jak antecedent tak sukcedent
  3. Tyto úvahy jsme vyjádřili pomocí parametrů ve sloupcích ANTECEDENT, QUANTIFIERS a SUCCEDENT.
  4. Podstatným způsobem jsme využili možnosti zadávání relevantních antecedentů a sukcedentů.

Zobecnění příkladu

Obecný postup počínaje formulací analytické otázky a končící stanovením úlohy pro proceduru 4ft-Miner lze s využitím příkladu popsat takto:

  • Vycházíme z matice dat, jejíž řádky odpovídají objektům našeho zájmu. V našem příkladu nás zajímají pobyty klientů v hotelu.
  • Sloupce matice dat odpovídají atributům charakterizujícím objekty našeho zájmu. Jsou rozděleny do skupin G1,…, GK.
  • Zajímá nás analytická otázka Pro jaké booleovské charakteristiky φ a ψ řádků matice platí, že relativní četnost řádků splňujících ψ mezi řádky splňujícími φ je výrazně vyšší, než je relativní četnost řádků splňujících ψ v celé matici dat?
  • Tuto analytickou otázku formulujeme jako úlohu hledání asociačních pravidel se 4ft-kvantifikátorem fundovaného nadprůměrného souvisení.
  • Tuto analytickou otázku je možno formulovat i jako úlohu hledání asociačních pravidel se 4ft-kvantifikátorem nadprůměrného souvisení s podporou.
  • Úlohu hledání asociačních pravidel specifikujeme pomocí parametrů procedury 4ft-Miner.

Zadání procedury

Zadání parametrů procedury 4ft-Miner se zahajuje v okně a provádí se podle těchto zásad:

4ft-kvantifikátor nadprůměrného souvisení

Použijeme Statistické 4ft-kvantifikátory , viz první krok v okně v levé části obrázku. Toto okno otevřeme tlačítkem QUANTIFIERS. Ve druhém kroku, viz pravou část obrázku, zadáme parametr p.

Oblast Primary IM settings nebudeme měnit.

lm_guha_di_ar_aa_obecne.txt · Poslední úprava: 2019/09/23 16:46 (upraveno mimo DokuWiki)