====== Histogram roste - příklad ====== ==== Motivace ==== V následujícím obrázku je procentuální rozdělení klientů z ČR podle kategorií atributu [[lm_guha_di_hotel_dotaznik#Atribut DHodnoceni|DHodnoceni]]. Jedná se o histogram atributu DHodnoceni na matici dat matici dat HotelPlusExterni/HStat(ČR). {{ :histogram_roste_motivace.png |}} Vidíme, že 28% hostů je nespokojeno, 44% hostů je průměrně spokojeno a 28% hostů je spokojeno. To je inspirací pro analytickou otázku: //Existuje skupina klientů, pro kterou je histogram atributu DHodnocení rostoucí?// Pokud ano, můžeme to chápat tak, že v této skupině je rostoucí trend spokojenosti a můžeme to využít v reklamě cílené na takové klienty. Použijeme složitější zadání skupiny klientů - kombinace atributů [[lm_guha_di_hotel_pobyt#Atribut PNoci_enum_m|PNoci_enum_m]], [[lm_guha_di_hotel_pobyt#Atribut POsob|POsob]], [[lm_guha_di_hotel_pobyt#Atribut POsobonoci_ef5|POsobonoci_ef5]], [[lm_guha_di_hotel_pobyt#Atribut PDenTydne|PDenTydne]], ze skupiny Pobyt, [[lm_guha_di_hotel_host#Atribut HPohlavi|HPohlavi]] a [[lm_guha_di_hotel_host#Atribut HVek_exp|HVek_exp]] ze skupiny Host, [[lm_guha_di_hotel_host_bydliste#Atribut H_Cizinec_b|H_Cizinec_b]], [[lm_guha_di_hotel_host_bydliste#Atribut HMesto|HMesto]], [[lm_guha_di_hotel_host_bydliste#Atribut HStat|HStat]] ze skupiny Host/Bydliště a atributů [[lm_guha_di_hotel_meteo#Atribut MObloha|MObloha]] a [[lm_guha_di_hotel_meteo#Atribut MTeplota_exp|MTeplota_exp]] ze skupiny atributů Meteo. Budeme ale chtít, aby tato skupina klientů byla dostatečně veliká. Jako dolní mez pro počet klientů zvolíme 100. To, že je histogram rostoucí vyjádříme podmínkou na schody v histogramu, viz následující obrázek. {{ ::schody_schema.png |}} Vyjdeme z toho, že atribut DHodnocení má 3 kategorie, které definují dva schody. Chceme, aby histogram byl rostoucí, tedy požadujeme dva schody nahoru. Jako minimální výšku schodu stanovíme 10. ==== Zadání procedury ==== Zadání procedury [[https://lispminer.vse.cz/wiki/doku.php?id=mcf:start|CF-Miner]] pro řešení výše naznačené úlohy je v následujícím obrázku. {{ ::schody_nahoru_zadani_priklad.png|}} Ve sloupci [[https://lispminer.vse.cz/wiki/doku.php?id=mcf:settings:cfcedent|ATRIBUTES FOR HISTOGRAM ]] je uvedeno, že nás zajímá atribut DHodnoceni. Ve sloupci [[https://lispminer.vse.cz/wiki/doku.php?id=mcf:settings:cfquantifier|QUANTIFIERS]] je zadáno, že nás zajímají skupiny nejméně 100 klientů a histogramy se dvěma schody nahoru a s minimální výškou 10. Ve sloupci [[https://lispminer.vse.cz/wiki/doku.php?id=mcf:settings#zadani_podminky|CONDITION]] je zadání relevantních skupin klientů. Je použito [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftcedenthierarchy|zadání množiny relevantních cedentů]], obvyklým způsobem jsou použity [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftpartialcedent|dílčí cedenty]]. Zde se jedná o dílčí cedenty Pobyt, Host, Host/Bydliště a Meteo. Jsou použity pouze některé z atributů odpovídajících skupin atributů, viz [[lm_guha_di_hotel_prehled_skupin#Skupina Pobyt|skupina Pobyt]], [[lm_guha_di_hotel_prehled_skupin#Skupina Host|skupina Host]], [[lm_guha_di_hotel_prehled_skupin#Skupina Host/Bydliště|skupina Host/Bydliště]] a [[lm_guha_di_hotel_prehled_skupin#Skupina Meteo|skupina Meteo]]. Poznamenejme, že je vícekrát použito zadání koeficientů - sekvencí. ==== Výsledky ==== Výsledkem běhu procedury CF-Miner je 17 skupin hostů vyhovujících zadaným podmínkám: {{ ::schody_nahoru_priklad_vysledky_prehled.png|}} Příkladem je skupina 132 klientů přijíždějících na tři až sedm nocí pokud je teplota neutrální: {{ ::schody_nahoru_priklad_vysledky_detail.png |}} Výška prvního schodu je 16 = 33-17, výška druhého schodu je 17 = 50-33.