====== Histogram klesá - příklad ====== ===== Motivace ===== V následujícím obrázku je procentuální rozdělení klientů z ČR podle kategorií atributu [[lm_guha_di_hotel_dotaznik#Atribut DHodnoceni|DHodnoceni]]. Jedná se o histogram atributu DHodnoceni na matici dat matici dat HotelPlusExterni/HStat(ČR). {{ :histogram_roste_motivace.png|}} Vidíme, že 28% hostů je nespokojeno, 44% hostů je průměrně spokojeno a 28% hostů je spokojeno. To je inspirací pro analytickou otázku: //Existuje skupina klientů, pro kterou je histogram atributu DHodnocení klesající?// Pokud ano, můžeme to chápat tak, že v této skupině je klesající trend spokojenosti a je třeba to využít k nápravným opatřením. Použijeme složitější zadání skupiny klientů - kombinace atributů [[lm_guha_di_hotel_pobyt#Atribut PNoci_enum_m|PNoci_enum_m]], [[lm_guha_di_hotel_pobyt#Atribut POsob|POsob]], [[lm_guha_di_hotel_pobyt#Atribut POsobonoci_ef5|POsobonoci_ef5]], [[lm_guha_di_hotel_pobyt#Atribut PDenTydne|PDenTydne]], ze skupiny Pobyt, [[lm_guha_di_hotel_host#Atribut HPohlavi|HPohlavi]] a [[lm_guha_di_hotel_host#Atribut HVek_exp|HVek_exp]] ze skupiny Host, [[lm_guha_di_hotel_host_bydliste#Atribut H_Cizinec_b|H_Cizinec_b]], [[lm_guha_di_hotel_host_bydliste#Atribut HMesto|HMesto]], [[lm_guha_di_hotel_host_bydliste#Atribut HStat|HStat]] ze skupiny Host/Bydliště a atributů [[lm_guha_di_hotel_meteo#Atribut MObloha|MObloha]] a [[lm_guha_di_hotel_meteo#Atribut MTeplota_exp|MTeplota_exp]] ze skupiny atributů Meteo. Budeme ale chtít, aby tato skupina klientů byla dostatečně veliká. Jako dolní mez pro počet klientů zvolíme 100. To, že je histogram klesající vyjádříme podmínkou na schody v histogramu, viz následující obrázek. Vyjdeme z toho, že atribut DHodnocení má 3 kategorie, které definují dva schody. Chceme, aby histogram byl klesající, tedy požadujeme dva schody dolů. Jako minimální výšku schodu stanovíme 10. ===== Zadání procedury ===== Zadání procedury CF-Miner pro řešení výše naznačené úlohy je v následujícím obrázku. {{ ::schody_dolu_zadani_priklad.png|}} Ve sloupci ATRIBUTES FOR HISTOGRAM je uvedeno, že nás zajímá atribut DHodnoceni. Ve sloupci QUANTIFIERS je zadáno, že nás zajímají skupiny nejméně 100 klientů a histogramy s dvěma schody dolů a s minimální výškou 10. Ve sloupci CONDITION je zadání relevantních skupin klientů. Je použito zadání množiny relevantních cedentů, obvyklým způsobem jsou použity dílčí cedenty. Zde se jedná o dílčí cedenty Pobyt, Host, Host/Bydliště a Meteo. Jsou použity pouze některé z atributů odpovídajících skupin atributů, Jsou použity pouze některé z atributů odpovídajících skupin atributů, viz [[lm_guha_di_hotel_prehled_skupin#Skupina Pobyt|skupina Pobyt]], [[lm_guha_di_hotel_prehled_skupin#Skupina Host|skupina Host]], [[lm_guha_di_hotel_prehled_skupin#Skupina Host/Bydliště|skupina Host/Bydliště]] a [[lm_guha_di_hotel_prehled_skupin#Skupina Meteo|skupina Meteo]]. Poznamenejme, že je vícekrát použito zadání koeficientů - sekvencí. ===== Výsledky ===== Výsledkem běhu procedury CF-Miner je 36 skupin hostů vyhovujících zadaným podmínkám: {{ ::schody_dolu_priklad_vysledky_prehled.png |}} Příkladem je skupina 139 klientů přijíždějících na nejvyšší počet osobonocí pokud jsou srážky: {{ ::schody_dolu_priklad_vysledky_detail.png |}} Výška prvního schodu je 15 = 66-51, výška druhého schodu je 29 = 51-22.