Obsah

Dvojice histogramů a procedura SDCF-Miner

Pro dvojice histogramů a proceduru SDCF-Miner jsou k dispozici tato témata:

Základní informace

Procedura SDCF-Miner pracuje s SDCF-výrazy α×β: ≈A/χ. Zde A je kategoriální atribut, α,β,χ jsou booleovské atributy a ≈ je SDCF-kvantifikátor. SDCF-výraz je určen pro vyjádření rozdílu mezi histogramy
A/α∧χ a A/β∧χ. Histogram A/α∧χ na matici dat M je identický s histogramem A/χ na podmatici M/α a histogram A/β∧χ na matici dat M je totéž jako histogram A/χ na podmatici M/β. Rozdíl mezi histogramy A/α∧χ a A/β∧χ na matici dat M můžeme tedy chápat jako rozdíl mezi histogramem A/χ na podmatici M/α a histogramem A/χ na podmatici M/β. Podrobnosti jsou uvedeny zde.

Příklady typických aplikací

Je uveden jeden typický příklad aplikace procedury SDCF-Miner, který lze opakovat na vlastních datech bez podrobného studia náležitostí zadání.

Jedná se o hledání dvou kategorií b1, b2 atributu B a booleovského atributu χ takových, že trendy histogramů daného atributu A na podmaticích daných booleovskými atributy B(b1)∧χ a B(b2)∧χ jsou opačné. Podrobnosti jsou uvedeny zde.

Typové úlohy hledání výjimek a odlišností

Pro proceduru SDCF-Miner je prozatím popsána jedna typová úloha na hledání výjimek a odlišností.

Jedná se o úlohu, kdy nás zajímají různé tvary histogramu atributu A pro různé kategorie atributu B. Podrobnosti jsou uvedeny zde.