Obsah

SDCF-Miner

Procedura SDCF-Miner pracuje s SDCF-výrazy α×β: ≈A/χ. Zde A je kategoriální atribut, α,β,χ jsou booleovské atributy a ≈ je SDCF-kvantifikátor. SDCF-výraz je určen pro vyjádření rozdílu mezi histogramy
A/α∧χ a A/β∧χ. Histogram A/α∧χ na matici dat M je totéž jako histogram A/χ na podmatici M/α a histogram A/β∧χ na matici dat M je totéž jako histogram A/χ na podmatici M/β. Rozdíl mezi histogramy A/α∧χ a A/β∧χ na matici dat M můžeme tedy chápat jako rozdíl mezi histogramem A/χ na podmatici M/α a histogramem A/χ na podmatici M/β.

Zadání procedury se provádí v okně dle následujícího obrázku.

Zadává se množina relevantních SDCF-výrazů. Tlačítkem Validate se vyvolá kontrola zadání.

Parametrem Maximal number of hypotheses to be mined se udává maximální počet pravidel, který může být nalezen. Parametr je dostupný po použití tlačítka Params. Po dosažení uvedeného maximálního počtu pravidel se běh procedury ukončí.

Procedura se spustí jedním z tlačítek Run, Bkgrnd Run, Grid Run popsaných zde. Prohlížení a interpretace výsledků se zahajuje tlačítkem Show Results.

Tlačítkem Task Clone se provede vyklonování úlohy.

Ukázky aplikací procedury SDCF-Miner jsou zde.

Množina relevantních SDCF-výrazů

Množina relevantních SDCF-výrazů je dána

Množiny ANT, SUCC a COND se zadávají jako množiny relevantních cedentů.

Součástí zadání množiny relevantních SDCF-výrazů je i zadání vztahu množin α a β, které se vyvolá tlačítkem Params.

Množina relevantních množin α musí být vždy neprázdná, množina relevantních množin β i množina podmínek mohou být prázdné. V zadání těchto množin se mohou vyskytovat stejné atributy.

Za relevantní SDCF-výrazy jsou potom považovány všechny SDCF-výrazy α×β: ≈A/χ takové, že A je uveden v seznamu atributů, α ∈ ALFA, β ∈ BETA, χ ∈ COND a zároveň α, β a χ nemají společné atributy.

Kontrola zadání

Kontrola zahrnuje jednak obecné kontroly společné pro všechny procedury a jednak kontroly zadání parametrů specifických pro SDCF-Miner.