====== Maximum větší než daná mez - příklad ====== ==== Motivace ==== V následujícím obrázku je procentuální rozložení příjezdů hostů v jednotlivých dnech týdne. Jedná se o histogram atributu [[lm_guha_di_hotel_pobyt_zacatek#Atribut PDenTydne|PDenTydne]]. {{ ::den_tydne_jen_procenta.png |}} Histogram je inspirací pro prakticky motivovanou analytickou otázku: //Existuje skupina klientů a den v týdnu ve kterém převažují příjezdy klientů z této skupiny?// Pokud ano, je možno se na to připravit, například mít mezi personálem pracovníky s příslušným jazykovým vybavením nebo upravit jídelní lístek na večeři. Použijeme velmi jednoduché zadání skupiny klientů - kombinace jednoho z atributů [[lm_guha_di_hotel_host_bydliste#Atribut H_Cizinec_b|H_Cizinec_b]], [[lm_guha_di_hotel_host_bydliste#Atribut HMesto|HMesto]], [[lm_guha_di_hotel_host_bydliste#Atribut HStat|HStat]] ze skupiny Host/Bydliště a atributu [[lm_guha_di_hotel_meteo#Atribut MObloha|MObloha]] ze skupiny atributů Meteo. Budeme ale chtít, aby tato skupina klientů byla dostatečně veliká. Jako dolní mez pro počet klientů zvolíme 105, tedy průměrně alespoň 15 klientů za každý den týdne. Požadujeme ale, aby tato skupina byla rozložena tak, že nejméně 50% z nich bude soustředěno do jednoho dne v týdnu. Jinými slovy, budeme chtít, aby maximální výška sloupce histogramu atributu PDenTydne znázorňujícího procenta pobytů začínajících v jednotlivé dny byla alespoň 50. ==== Zadání procedury ==== Zadání procedury [[https://lispminer.vse.cz/wiki/doku.php?id=mcf:start|CF-Miner]] pro řešení výše naznačené úlohy je v následujícím obrázku. {{ :histogram_max_zadani_priklad.png |}} Ve sloupci [[https://lispminer.vse.cz/wiki/doku.php?id=mcf:settings:cfcedent|ATRIBUTES FOR HISTOGRAM ]] je uvedeno, že nás zajímá atribut PDenTydne. Ve sloupci [[https://lispminer.vse.cz/wiki/doku.php?id=mcf:settings:cfquantifier|QUANTIFIERS]] je zadáno, že nás zajímají skupiny nejméně 105 klientů a takové procentuální rozložení příjezdů hostů v jednotlivých dnech týdne, že v některém dni přijíždí alespoň 50% klientů ze skupiny. Ve sloupci [[https://lispminer.vse.cz/wiki/doku.php?id=mcf:settings#zadani_podminky|CONDITION]] je zadání relevantních skupin klientů. Je použito [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftcedenthierarchy|zadání množiny relevantních cedentů]], obvyklým způsobem jsou použity [[https://lispminer.vse.cz/wiki/doku.php?id=lmtask:settings:ftpartialcedent|dílčí cedenty]]. Zde se jedná o dílčí cedenty Host/Bydliště a Meteo, jsou použity pouze některé z atributů odpovídajících skupin atributů, viz [[lm_guha_di_hotel_prehled_skupin#Skupina Host/Bydliště|skupina Host/Bydliště]] a [[lm_guha_di_hotel_prehled_skupin#Skupina Meteo|skupina Meteo]]. ==== Výsledky ==== Výsledkem běhu procedury CF-Miner je šest skupin hostů vyhovujících zadaným podmínkám: {{ :histogram_max_zadani_vysledky_prehled.png |}} Nejvíce klientů přijíždějících v jeden den týdne je pro skupinu klientů z Lince přijíždějících za slunečného počasí. 85 % z těchto klientů přijíždí v pátek: {{ ::histogram_max_zadani_vysledky_detail.png |}} Na záložce TEXT lze zjistit, že takových klientů je 177.