===== Histogramy a procedura CF-Miner ===== Pro histogramy a proceduru CF-Miner jsou k dispozici tato témata: * [[lm_guha_te_temata_histogramy_a_procedura_cf-miner#Základní informace|základní informace]] * [[lm_guha_te_temata_histogramy_a_procedura_cf-miner#Příklady typických aplikací|příklady typických aplikací]] * [[lm_guha_te_temata_histogramy_a_procedura_cf-miner#Typové úlohy hledání výjimek a odlišností|typové úlohy hledání výjimek a odlišností]] * [[lm_guha_te_temata_histogramy_a_procedura_cf-miner#Typové úlohy pro hledání podobných skupin objektů|typové úlohy pro hledání podobných skupin objektů]]. ==== Základní informace ==== Procedura CF-Miner pracuje s [[lm_guha_te_histogram|histogramy A/χ]] kde A je [[lm_guha_te_matice|kategoriální atribut]] a χ je [[lm_guha_te_bool|booleovský atribut]]. Hledá takové histogramy, které splňují podmínku odpovídající zadanému [[lm_guha_te_histogram#CF-kvantifikátor|CF-kvantifikátoru]] ≈ na podmatici analyzované matice definované booleovským atributem χ. Podrobnosti jsou uvedeny [[lm_guha_te_cf_proc|zde]]. ==== Příklady typických aplikací ==== Je uvedeno několik typických příkladů aplikací procedury CF-Miner, které lze opakovat na vlastních datech bez podrobného studia náležitostí zadání. Vždy se jedná o hledání podmatice na které histogram splňuje nějakou **//zajímavou podmínku//**. - **//Výrazně převažuje jeden sloupec histogramu//**. Příklady jsou uvedeny [[https://lispminer.vse.cz/wiki/doku.php?id=lmdemo:hotel2015:task:cf|zde]], [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_hist_max_prikl|zde]], a [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_typul_cf&do=#data_hotel_-_jedna_kategorie_vyrazne_prevazuje|zde]]. K tomuto typu úloh je k dispozici i [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_hist_max_obecne|obecný postup pro řešení]]. - **//Výška sloupců histogramu je přibližně stejná//**. Příklady jsou uvedeny [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_hist_mami_priklad|zde]] a [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_typul_cf&do=#data_hotel_-_kategorie_priblizne_stejne_frekvence|zde]].K tomuto typu úloh je k dispozici i [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_hist_mami_obecne|obecný postup pro řešení]]. - **//Histogram roste//**. Příklady jsou uvedeny [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_hist_roste_priklad|zde]] a [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_typul_cf#data_hotel_-_histogram_roste|zde]]. K tomuto typu úloh je k dispozici i [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_hist_roste_obecne|obecný postup pro řešení]]. - **//Histogram klesá//**. Příklady jsou uvedeny [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_hist_klesa_priklad|zde]] a [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_typul_cf#data_hotel_-_histogram_klesa|zde]]. K tomuto typu úloh je k dispozici i [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_hist_klesa_obecne|obecný postup pro řešení]]. - **//Histogram za podmínky roste a pro dodatečnou podmínku částečně klesá//**. Příklad je uveden [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_typul_cf#data_accidents_-_histogram_za_podminky_roste_a_pro_dodatecnou_podminku_castecne_klesa|zde]]. - **//Vzdálenost histogramů od vzoru je malá//**. Příklad je uveden [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_typul_cf#data_hotel_-_vzdalenost_histogramu_od_vzoru_mala|zde]]. - **//Vzdálenost histogramů od vzoru je velká//**. Příklad je uveden [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_typul_cf#data_hotel_-_vzdalenost_histogramu_od_vzoru_velka|zde]]. - **//Podíl podmínky na kategorii je alespoň 50 %//**. Příklad je uveden [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_typul_cf#data_hotel_-_podil_podminky_na_kategorii_je_alespon_50|zde]]. ==== Typové úlohy hledání výjimek a odlišností ==== Pro proceduru CF-Miner jsou k dispozici následující typové úlohy na hledání výjimek a odlišností: - [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_typy_uloh_vyjimky#jiny_tvar_histogramu_na_podmatici|jiný tvar histogramu na podmatici]] - [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_typy_uloh_vyjimky#jiny_tvar_histogramu_na_podmatici_podmatice|jiný tvar histogramu na podmatici podmatice]] - [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_typy_uloh_vyjimky#velka_vzdalenost_histogramu_na_podmatici_a_matici|velká vzdálenost histogramů na podmatici a matici]] - [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_typy_uloh_vyjimky#velka_vzdalenost_daneho_histogramu_na_podmatici_podmatice|velká vzdálenost daného histogramu na podmatici podmatice]] ==== Typové úlohy pro hledání podobných skupin objektů ==== Pro proceduru CF-Miner je popsána jedna typová úloha na hledání podobných skupin objektů: - [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_typy_uloh_podobne#podobny_tvar_histogramu|podobný tvar histogramu]].