Obsah

Vysoký rozdíl konfidencí - obecně

Rekapitulace příkladu

V příkladu jsme řešili analytickou otázku Jsou významné rozdíly mezi jednotlivými státy ohledně vztahů mezi charakteristikami hosta (pohlaví, věk) a typickými parametry odpovědí v dotazníku pobytu? Symbolicky můžeme otázku zapsat jako Stát(?) x Stát(?) [Host ≈ Dotazník]. Otázku jsme transformovali do zadání procedury SD4ft-Miner podle těchto zásad:

  1. Analyzovali jsme matici dat HotelPlusExterni, jejíž řádky odpovídají pobytům hostů v hotelu.
  2. Otázku jsme upřesnili takto: Existují takové skupiny hostů, že pro některou dvojici států je rozdíl procentuálních podílů některé kombinace výsledků v dotazníku větší než daná mez?
  3. Upřesnění jsme vyjádřili pomocí dvou podmíněných asociačních pravidel lišících se pouze podmínkou. Otázku jsme následně formalizovali pomocí dvou čtyřpolních tabulek.
  4. Analytickou otázku jsme vyjádřili pomocí parametrů procedury SD4ft-Miner.
  5. Podstatným způsobem jsme využili možnosti zadávání relevantních podmínek.

Zobecnění příkladu

Obecný postup počínaje formulací analytické otázky a konče stanovením úlohy pro proceduru SD4ft-Miner lze s využitím příkladu popsat takto:

  1. konfidence asociačního pravidla φ → ψ / A(a1) je nejméně o T vyšší, než konfidence asociačního pravidla φ → ψ / A(a2),
  2. nejméně Base1 objektů splňujících A(a1) splňuje antecedent φ  i sukcedent ψ,
  3. nejméně Base2 objektů splňujících A(a2) splňuje antecedent φ  i sukcedent ψ.

Zadání procedury

Zadání procedury SD4ft-Miner se zahajuje v okně. V poli ANTECEDENT je uvedeno zadání relevantních booleovských atributů φ, zadává se jako množina relevantních cedentů.

V poli QUANTIFIERS je zadán SD4ft-kvantifikátor →[Df-Conf,T,Base1,Base2], viz zadání parametru T a zadání parametrů Base1 a Base2,

V poli SUCCEDENT je uvedeno zadání relevantních booleovských atributů ψ, zadává se jako množina relevantních cedentů, stejně jako pro sloupec ANTECEDENT.

V poli FIRST SET je zadání relevantních booleovských atributů A(?), použije se zadání koeficientu Subsets délky 1-1

V poli SECOND SET je zadání relevantních booleovských atributů A(?), použije se zadání koeficientu Subsets délky 1-1.

Zadání parametru T

Použijeme Statistické SD4ft-kvantifikátory, viz první krok v levé části obrázku. Ve druhém kroku, viz pravou část obrázku, zadáme:

Zadání parametrů Base1 a Base2

Použijeme Jednoduché frekvenční SD4ft-kvantifikátory, viz první krok v levé části obrázku. Druhý krok se provádí zvlášť pro Base1 a zvlášť pro Base2. Ve druhém kroku, viz pravou část obrázku, zadáme: