Obsah

Výška sloupců v daných mezích - obecně

Rekapitulace příkladu

V příkladu jsme řešili analytickou otázku Existuje skupina klientů, která přijíždí zhruba ve stejném zastoupení každý den v týdnu? Otázku jsme transformovali do zadání procedury CF-Miner podle těchto zásad:

  1. Analyzovali jsme matici dat HotelPlusExterni, jejíž řádky odpovídají pobytům klientů v hotelu. Využili jsme fakt, že kategorie atributu PDenTydne odpovídají dnům týdne a že jsou k dispozici atributy charakterizující klienty.
  2. Pro definici relevantních skupin klientů jsme použili atributy PNoci_enum_m, POsob, POsobonoci_ef5 ze skupiny Pobyt, HPohlavi a HVek_exp ze skupiny Host, H_Cizinec_b, HMesto, HStat ze skupiny Host/Bydliště a MObloha a MTeplota_exp ze skupiny atributů Meteo.
  3. Jako dolní hranici počtu klientů ve skupině jsme stanovili 105.
  4. To, že klienti přijíždí zhruba ve stejném zastoupení každý den v týdnu jsme vyjádřili pomocí minimálního a maximálního procenta klientů přijíždějících v jednotlivých dnech týdne. Jako dolní hranici jsme použili 10 procent a jako horní hranici 20 procent.
  5. Tyto úvahy jsme vyjádřili pomocí parametrů ve sloupcích ATRIBUTES FOR HISTOGRAM, QUANTIFIERS a CONDITION

Zobecnění příkladu

Obecný postup počínaje formulací analytické otázky a končící stanovením úlohy pro proceduru CF-Miner lze s využitím příkladu popsat takto:

Zadání procedury

Pro zadání parametrů procedury CF-Miner použijeme

CF-quantifier SUM

Použijeme Jednoduché frekvenční CF-kvantifikátory, viz první krok v levé části obrázku. Ve druhém kroku, viz pravou část obrázku, zadáme:

CF-quantifier MIN

Použijeme Jednoduché frekvenční CF-kvantifikátory, viz první krok v levé části obrázku. Ve druhém kroku, viz pravou část obrázku, zadáme:

CF-quantifier MAX

Použijeme Jednoduché frekvenční CF-kvantifikátory, viz první krok v levé části obrázku. Ve druhém kroku, viz pravou část obrázku, zadáme: