===== Typové úlohy pro hledání podobných skupin objektů ===== Jsou uvedeny typové úlohy týkající se hledání podobných skupin objektů na základě * [[lm_guha_di_typy_uloh_podobne#Podobný tvar histogramu|podobného tvaru histogramu]], řešeno pomocí procedury [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_4ft_proc|CF-Miner]] * [[lm_guha_di_typy_uloh_podobne#Podobné charakteristiky asociačních pravidel|podobných charakteristik asociačních pravidel]], řešeno pomocí procedury [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_sd4ft_proc|SD4ft-Miner]] * [[lm_guha_di_typy_uloh_podobne#Podobné rozložení frekvencí v kontingenčních tabulkách|podobného podobného rozložení frekvencí v kontingenčních tabulkách]]. ==== Podobný tvar histogramu ==== Úlohy tohoto typu lze charakterizovat takto: * Vyjdeme z histogramu daného atributu A na podmatici M/ω se zajímavým tvarem * Zajímá nás, na jakých dalších podmaticích M/χ má histogram atributu A podobný tvar * Zajímavý histogram uložíme do galerie * Určíme maximální vzdálenost histogramů jako podmínku pro jejich podobnost a tuto podmínku vyjádříme pomocí CF-kvantifikátoru pattern - difference. * Definujeme množinu COND relevantních χ jako množinu podmínek pro proceduru CF-Miner. * Pomocí procedury CF-Miner s případnými korekcemi parametrů najdeme všechny relevantní podmatice M/χ. Příklad uvedený {{ :cf_miner_08_hotel_vzdalenost_histogramu_podobnost.pdf |zde}} ukazuje možnosti hledání podmatic M/χ takových, že vzdálenost histogramu na M/χ a histogramu na M/ω je menší než dané maximum. Jedná se o příklad již prezentovaný jako příklad aplikace procedury CF-Miner. Týká se histogramu atributu DHodnoceni matice dat Hotel. Histogram na podmatici M/ω se zajímavým tvarem ukazující procentuální podíl jednotlivých kategorií, je uveden v levé části následujícího obrázku (součet podílů je 101 díky zaokrouhlovací chybě). Histogram v pravé části obrázku se týká jisté podmatice M/χ a je dle daných kriterií podobný histogramu na M/ω. {{ :hotel_histogramy_omega_chi_podobne.png |}} ==== Podobné charakteristiky asociačních pravidel ==== Prozatím je k dispozici ukázka řešení úlohy **//Je pro některé řidiče za nějakých okolností relativní četnost poruch s nějakou závažností téměř stejná pro muže i pro ženy?//** Podrobnosti jsou uvedeny [[lm_guha_di_typul_sd4ft#data_accidents_-_vyuziti_pomeru_konfidenci|zde]], jedná se o druhou dílčí otázku. Bude doplněno. ==== Podobné rozložení frekvencí v kontingenčních tabulkách ==== Bude doplněno