Obsah

Nárůst relativní četnosti - obecně

Rekapitulace příkladu

V příkladu jsme řešili analytickou otázku Jaké charakteristiky hostů, jejich bydliště a začátků jejich pobytů vedou k výraznému nárůstu relativní četnosti některé kombinace spokojenosti hostů a ceny pobytu oproti relativní četnosti této kombinace v celých datech?

Otázku jsme transformovali do zadání procedury 4ft-Miner podle těchto zásad:

  1. Analyzovali jsme matici dat HotelPlusExterni, jejíž řádky odpovídají pobytům hostů v hotelu.
  2. Využili jsme toho, že analytickou otázku lze formulovat tak, že nás zajímají asociační pravidla s antecedentem Host(?) ∧ Host/Bydliště(?) ∧ Pobyt/Začátek(?), sukcedentem DHodnoceni(nespokojen) nebo DHodnoceni(spokojen) pro která je relativní četnost sukcedentu alespoň o 100% vyšší než relativní četnost sukcedentu v celé matici a zároveň taková, že nejméně 150 pobytů splňuje jak antecedent tak sukcedent
  3. Tyto úvahy jsme vyjádřili pomocí parametrů ve sloupcích ANTECEDENT, QUANTIFIERS a SUCCEDENT.
  4. Podstatným způsobem jsme využili možnosti zadávání relevantních antecedentů a sukcedentů.

Zobecnění příkladu

Obecný postup počínaje formulací analytické otázky a končící stanovením úlohy pro proceduru 4ft-Miner lze s využitím příkladu popsat takto:

Zadání procedury

Zadání parametrů procedury 4ft-Miner se zahajuje v okně a provádí se podle těchto zásad:

4ft-kvantifikátor nadprůměrného souvisení

Použijeme Statistické 4ft-kvantifikátory , viz první krok v okně v levé části obrázku. Toto okno otevřeme tlačítkem QUANTIFIERS. Ve druhém kroku, viz pravou část obrázku, zadáme parametr p.

Oblast Primary IM settings nebudeme měnit.