Obsah

Histogram klesá - obecně

Rekapitulace příkladu

V příkladu jsme řešili analytickou otázku Existuje skupina klientů, pro kterou je histogram atributu DHodnocení klesající? Otázku jsme transformovali do zadání procedury CF-Miner podle těchto zásad:

  1. Analyzovali jsme matici dat HotelPlusExterni, jejíž řádky odpovídají pobytům klientů v hotelu. Využili jsme fakt, že jsou k dispozici atributy charakterizující klienty.
  2. Pro definici relevantních skupin klientů jsme použili atributy PNoci_enum_m, POsob, POsobonoci_ef5 a PDenTydne ze skupiny Pobyt, HPohlavi a HVek_exp ze skupiny Host, H_Cizinec_b, HMesto, HStat ze skupiny Host/Bydliště a MObloha a MTeplota_exp ze skupiny atributů Meteo.
  3. Jako dolní hranici počtu klientů ve skupině jsme stanovili 100.
  4. To, že je histogram rostoucí jsme vyjádřili podmínkami na počet schodů dolů a na minimální výškou schodu. Podmínka na počet schodů je, že jejich počet je roven počtu kategorií minus jedna, výška schodů musí být minimálně 10.
  5. Tyto úvahy jsme vyjádřili pomocí parametrů ve sloupcích ATRIBUTES FOR HISTOGRAM, QUANTIFIERS a CONDITION

Zobecnění příkladu

Obecný postup počínaje formulací analytické otázky a končící stanovením úlohy pro proceduru CF-Miner lze s využitím příkladu popsat takto:

Zadání procedury

Pro zadání parametrů procedury CF-Miner použijeme

CF-quantifier SUM

Použijeme Jednoduché frekvenční CF-kvantifikátory, viz první krok v levé části obrázku. Ve druhém kroku, viz pravou část obrázku, zadáme:

CF-quantifier S-UP

Použijeme CF-kvantifikátory typu Schody nahoru/dolů, viz první krok v levé části obrázku. Ve druhém kroku, viz pravou část obrázku, zadáme: