====== Histogramy - příklady aplikací procedury CF-Miner ====== Je uveden přehled příkladů aplikací procedury [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_cf_proc|CF-Miner]]. Jsou k dispozici jak [[lm_guha_di_typul_cf#Příklady ve wiki LISp-Miner a v této wiki|příklady popsané ve wiki LISp-Miner a v této wiki]], tak i [[lm_guha_di_typul_cf#Příklady popsané v souborech pdf|příklady popsané v souborech pdf]]. Piktogramy u jednotlivých příkladů naznačují, které [[lm_guha_di_typy_uloh_procedury#CF-Miner, histogramy|typové úlohy]] jednotlivé příklady řeší. ===== Příklady ve wiki LISp-Miner a v této wiki ===== **Příklad 1** - {{:cf_miner_jedna_kategorie_prevazuje.png?150}} [[https://lispminer.vse.cz/wiki/doku.php?id=lmdemo:hotel2015:task:cf|Převažující den začátku pobytu podle údajů o hostovi a o počasí]] uvedený ve wiki [[https://lispminer.vse.cz/wiki/doku.php|Systém LISp-Miner]]. **Příklad 2** - {{:cf_miner_jedna_kategorie_prevazuje.png?150}} [[lm_guha_di_hist_max_prikl|Maximum větší než daná mez]], k tomuto příkladu je k dispozici i [[lm_guha_di_hist_max_obecne|obecný postup pro řešení úloh stejného typu]]. **Příklad 3** - {{:cf_miner_kategorie_priblizne_stejne_frekvence.png?150}} [[lm_guha_di_hist_mami_priklad|Výška sloupců v daných mezích]], k tomuto příkladu je k dispozici i [[lm_guha_di_hist_mami_obecne|obecný postup pro řešení úloh stejného typu]]. **Příklad 4** - {{:cf_miner_histogram_roste.png?150}} [[lm_guha_di_hist_roste_priklad|Histogram roste]], k tomuto příkladu je k dispozici i [[lm_guha_di_hist_roste_obecne|obecný postup pro řešení úloh stejného typu]]. **Příklad 5** - {{:cf_miner_histogram_klesa.png?150}} [[lm_guha_di_hist_klesa_priklad|Histogram klesá]], k tomuto příkladu je k dispozici i [[lm_guha_di_hist_klesa_obecne|obecný postup pro řešení úloh stejného typu]]. ===== Příklady popsané v souborech pdf ===== Příklady popsané v souborech pdf jsou rozděleny do skupin podle toho, jaké typy úloh řeší. Piktogramy naznačují dílčí typy úloh. * [[lm_guha_di_typul_cf#Hledání podmínek za kterých má histogram požadovaný tvar|Hledání podmínek za kterých má histogram požadovaný tvar]] * [[lm_guha_di_typul_cf#Hledání dodatečných podmínek s odlišným tvarem histogramu|Hledání dodatečných podmínek s odlišným tvarem histogramu]] * [[lm_guha_di_typul_cf#Hledání podmínek za kterých jsou splněny požadavky na vzdálenost histogramu od vzoru|Hledání podmínek za kterých jsou splněny požadavky na vzdálenost histogramu od vzoru]] * [[lm_guha_di_typul_cf#Hledání zajímavých histogramů týkajících se podílu podmínky na kategoriích|Hledání zajímavých histogramů týkajících se podílu podmínky na kategoriích]] ===== Hledání podmínek za kterých má histogram požadovaný tvar ===== ==== Data Hotel - jedna kategorie výrazně převažuje ==== {{:cf_miner_jedna_kategorie_prevazuje.png?150}} Příklad se týká dat [[lm_guha_di_hotel_prehled_skupin|Hotel]] a řeší problém: //Existuje skupina klientů a den v týdnu ve kterém převažují příjezdy klientů z této skupiny?// Pokud ano, je možno se na to připravit, například mít na recepci pracovníka s příslušným jazykovým vybavením nebo upravit jídelní lístek na večeři. Příklad je inspirován příkladem 1 a je podobný příkladu 2. Podrobnosti k jsou {{ :cf_miner_01_hotel_jedna_kategorie_prevazuje.pdf |zde}}. ==== Data Hotel - kategorie přibližně stejné frekvence ==== {{:cf_miner_kategorie_priblizne_stejne_frekvence.png?150}}Příklad se týká dat [[lm_guha_di_hotel_prehled_skupin|Hotel]] a řeší problém: //Existuje skupina klientů, která přijíždí zhruba ve stejném zastoupení každý den v týdnu?// Na takové klienty je třeba být připravený každý den. Podrobnosti k příkladu jsou {{ :cf_miner_02_hotel_priblizne_stejne_frekvence.pdf |zde}}. ==== Data Hotel - histogram roste ==== {{:cf_miner_histogram_roste.png?150 |}}Příklad se týká dat [[lm_guha_di_hotel_prehled_skupin|Hotel]] a řeší problém: //Existuje segment hostů s rostoucí úrovní spokojenosti?// Takové segmenty hostů je třeba identifikovat a dále analyzovat. Podrobnosti k příkladu jsou {{ :cf_miner_03_hotel_rostouci_histogram.pdf |zde}}. ==== Data Hotel - histogram klesá ==== {{:cf_miner_histogram_klesa.png?150 |}}Příklad se týká dat [[lm_guha_di_hotel_prehled_skupin|Hotel]] a řeší problém: //Existuje segment hostů s klesající úrovní spokojenosti?// Takové segmenty hostů je třeba identifikovat a dále analyzovat. Podrobnosti k příkladu jsou {{ :cf_miner_04_hotel_klesajici_histogram.pdf |zde}}. ==== Data Insolvency - histogram roste ==== {{:cf_miner_histogram_roste.png?150 |}}Příklad se týká dat [[lm_guha_di_insolvency|Insolvency]] a řeší problém: //Pro které administrátory roste histogram atributu Počet dní do zahájení řízení?// Takové administrátory je třeba identifikovat a podrobit další analýze. Podrobnosti k příkladu jsou [[https://insis.vse.cz/auth/nucitel/ds_modul.pl?predmet=151961;id=341754|zde]], jsou však dostupné pouze pro studenty předmětu [[https://insis.vse.cz/katalog/syllabus.pl?zpet=/katalog/index.pl?vzorek=4IZ460%20,Dohledat=Dohledat,obdobi=261,jak=dle_jmena;predmet=146388|4IZ460 - Pokročilé přístupy k DZD]] v aktuálním semestru. ==== Data Insolvency - histogram klesá ==== {{:cf_miner_histogram_klesa.png?150 |}}Příklad se týká dat [[lm_guha_di_insolvency|Insolvency]] a řeší problém: //Pro které administrátory klesá histogram atributu Počet dní do zahájení řízení?// Takové administrátory je třeba identifikovat a podrobit další analýze. Podrobnosti k příkladu jsou [[https://insis.vse.cz/auth/nucitel/ds_modul.pl?predmet=151961;id=341754|zde]], jsou však dostupné pouze pro studenty předmětu [[https://insis.vse.cz/katalog/syllabus.pl?zpet=/katalog/index.pl?vzorek=4IZ460%20,Dohledat=Dohledat,obdobi=261,jak=dle_jmena;predmet=146388|4IZ460 - Pokročilé přístupy k DZD]] v aktuálním semestru. ===== Hledání dodatečných podmínek s odlišným tvarem histogramu ===== ==== Data Accidents - Histogram za podmínky roste a pro dodatečnou podmínku částečně klesá ==== {{:cf_miner_zadany_tvar_za_subpodminky.png?150 |}} Příklad se týká dat [[lm_guha_di_accidents|Accidents]] a řeší problém: //Celkové počty nehod v 2005 až 2015 klesají, ale počty nehod malých motocyklů v městských oblastech rostou. Existují nějaké dodatečné okolnosti za kterých počty nehod malých motocyklů v městských oblastech alespoň částečně klesají?// Takové okolnosti je třeba identifikovat a podrobit další analýze. Podrobnosti k příkladu jsou {{ :cf_miner_07_accidents_zadany_tvar_za_subpodminky.pdf |zde}}. ===== Hledání podmínek za kterých jsou splněny požadavky na vzdálenost histogramu od vzoru ===== ==== Data Hotel - vzdálenost histogramů od vzoru malá ==== {{:cf_miner_vzdalenost_histogramu_mala.png?200 |}} Příklad se týká dat [[lm_guha_di_hotel_prehled_skupin|Hotel]] a řeší problém: //Je dán histogram atributu jako vzor a zajímá nás za jakých okolností jsou vzdálenosti histogramu téhož atributu od vzoru malé (histogramy si jsou podobné).// Takové okolnosti je třeba identifikovat a dále analyzovat. Podrobnosti k příkladu jsou {{ :cf_miner_08_hotel_vzdalenost_histogramu_podobnost.pdf |zde}}. ==== Data Hotel - vzdálenost histogramů od vzoru velká ==== {{:cf_miner_vzdalenost_histogramu_velka.png?200 |}} Příklad se týká dat [[lm_guha_di_hotel_prehled_skupin|Hotel]] a řeší problém: //Je dán histogram atributu jako vzor a zajímá nás za jakých okolností jsou vzdálenosti histogramu téhož atributu od vzoru velké (histogramy si nejsou podobné).// Takové okolnosti je třeba identifikovat a dále analyzovat. Podrobnosti k příkladu jsou {{ :cf_miner_09_hotel_vzdalenost_histogramu_odlisnost.pdf |zde}}. ===== Hledání zajímavých histogramů týkajících se podílu podmínky na kategoriích ===== ==== Data Hotel - podíl podmínky na kategorii je alespoň 50 % ==== {{:cf_miner_podil_podminky_na_kategoriich.png?200 |}}Příklad se týká dat [[lm_guha_di_hotel_prehled_skupin|Hotel]] a řeší problém: //Existují podmínky a den týdne takové, že alespoň 50% ze všech hostů přijíždějících v tomto dni vyhovuje podmínkám? // Takové podmínky je třeba identifikovat a dále analyzovat. Podrobnosti k příkladu jsou {{ :cf_miner_10_hotel_podil_podminky_na_kategoriich.pdf |zde}}.