====== Výška sloupců v daných mezích - příklad ====== ==== Motivace ==== V následujícím obrázku je procentuální rozložení příjezdů hostů v jednotlivých dnech týdne. Jedná se o histogram atributu [[lm_guha_di_hotel_pobyt_zacatek#Atribut PDenTydne|PDenTydne]]. {{ ::den_tydne_jen_procenta.png?800 |}} Histogram je inspirací pro prakticky motivovanou analytickou otázku: //Existuje skupina klientů, která přijíždí zhruba ve stejném zastoupení každý den v týdnu?// Pokud ano, je třeba být každý den připravený na takové klienty. Použijeme složitější zadání skupiny klientů - kombinace atributů [[lm_guha_di_hotel_pobyt#Atribut PNoci_enum_m|PNoci_enum_m]], [[lm_guha_di_hotel_pobyt#Atribut POsob|POsob]], [[lm_guha_di_hotel_pobyt#Atribut POsobonoci_ef5|POsobonoci_ef5]] ze skupiny Pobyt, [[lm_guha_di_hotel_host#Atribut HPohlavi|HPohlavi]] a [[lm_guha_di_hotel_host#Atribut HVek_exp|HVek_exp]] ze skupiny Host, [[lm_guha_di_hotel_host_bydliste#Atribut H_Cizinec_b|H_Cizinec_b]], [[lm_guha_di_hotel_host_bydliste#Atribut HMesto|HMesto]], [[lm_guha_di_hotel_host_bydliste#Atribut HStat|HStat]] ze skupiny Host/Bydliště a atributů [[lm_guha_di_hotel_meteo#Atribut MObloha|MObloha]] a [[lm_guha_di_hotel_meteo#Atribut MTeplota_exp|MTeplota_exp]] ze skupiny atributů Meteo. Budeme ale chtít, aby tato skupina klientů byla dostatečně veliká. Jako dolní mez pro počet klientů zvolíme 105, tedy průměrně alespoň 15 klientů za každý den týdne. Požadujeme ale, aby tato skupina byla rozložena tak, že nejméně 10% a nejvýše 20% z nich bude přijíždět v každém dnu týdne. Jinými slovy, budeme chtít, aby minimální výška sloupce histogramu atributu PDenTydne znázorňujícího procenta pobytů začínajících v jednotlivé dny byla 10 a maximální výška byla 20. ==== Zadání procedury ==== Zadání procedury [[https://lispminer.vse.cz/wiki/doku.php?id=mcf:start|CF-Miner]] pro řešení výše naznačené úlohy je v následujícím obrázku. {{ ::histogram_min_max_zadani_priklad.png?800 |}} Ve sloupci [[https://lispminer.vse.cz/wiki/doku.php?id=mcf:settings:cfcedent|ATRIBUTES FOR HISTOGRAM ]] je uvedeno, že nás zajímá atribut PDenTydne. Ve sloupci [[https://lispminer.vse.cz/wiki/doku.php?id=mcf:settings:cfquantifier|QUANTIFIERS]] je zadáno, že nás zajímají skupiny nejméně 105 klientů a takové procentuální rozložení příjezdů hostů v jednotlivých dnech týdne, že v každém přijíždí nejméně 10% a nejvýše 20% klientů ze skupiny. Ve sloupci [[https://lispminer.vse.cz/wiki/doku.php?id=mcf:settings#zadani_podminky|CONDITION]] je zadání relevantních skupin klientů. Je použito [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftcedenthierarchy|zadání množiny relevantních cedentů]], obvyklým způsobem jsou použity [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftpartialcedent|dílčí cedenty]]. Zde se jedná o dílčí cedenty Pobyt, Host, Host/Bydliště a Meteo. Jsou použity pouze některé z atributů odpovídajících skupin atributů, viz [[lm_guha_di_hotel_prehled_skupin#Skupina Pobyt|skupina Pobyt]], [[lm_guha_di_hotel_prehled_skupin#Skupina Host|skupina Host]], [[lm_guha_di_hotel_prehled_skupin#Skupina Host/Bydliště|skupina Host/Bydliště]] a [[lm_guha_di_hotel_prehled_skupin#Skupina Meteo|skupina Meteo]]. Poznamenejme, že je vícekrát použito zadání koeficientů - sekvencí. ==== Výsledky ==== Výsledkem běhu procedury CF-Miner je 51 skupin hostů vyhovujících zadaným podmínkám: {{ ::histogram_min_max_zadani_vysledky_prehled.png?800 |}} Nejčetnější skupinou 336 klientů vyhovujících daným podmínkám je skupina klientů přijíždějících na jednu noc pokud je teplota neutrální nebo je teplo: {{ ::histogram_min_max_zadani_vysledky_detail.png?800 |}} Vidíme, že minimální podíl klientů připadá na středu, která odpovídá 10% z celé skupiny. Maximální podíl klientů připadá na čtvrtek, kdy jich přijíždí 20% z celé skupiny.