Procedura SDCF-Miner pracuje s SDCF-výrazy α×β: ≈A/χ. Zde A je kategoriální atribut,
α,β,χ jsou booleovské atributy a ≈ je SDCF-kvantifikátor. SDCF-výraz je určen pro vyjádření rozdílu mezi histogramy
A/α∧χ a A/β∧χ.
Histogram A/α∧χ na matici dat M je totéž jako histogram A/χ na podmatici M/α a histogram A/β∧χ na matici dat M je totéž jako histogram A/χ na podmatici M/β. Rozdíl mezi histogramy A/α∧χ a A/β∧χ na matici dat M můžeme tedy chápat jako rozdíl mezi histogramem A/χ na podmatici M/α a histogramem A/χ na podmatici M/β.
Zadání procedury se provádí v okně dle následujícího obrázku.
Zadává se množina relevantních SDCF-výrazů. Tlačítkem Validate
se vyvolá kontrola zadání.
Parametrem Maximal number of hypotheses to be mined se udává maximální počet pravidel, který může být nalezen. Parametr je dostupný po použití tlačítka Params
. Po dosažení uvedeného maximálního počtu pravidel se běh procedury ukončí.
Procedura se spustí jedním z tlačítek Run
, Bkgrnd Run
, Grid Run
popsaných zde. Prohlížení a interpretace výsledků se zahajuje tlačítkem Show Results
.
Tlačítkem Task Clone
se provede vyklonování úlohy.
Ukázky aplikací procedury SDCF-Miner jsou zde.
Množina relevantních SDCF-výrazů je dána
ATTRIBUTES FOR HISTOGRAM
FIRST SET
SECOND SET
CONDITION
QUANTIFIERS
Množiny ANT, SUCC a COND se zadávají jako množiny relevantních cedentů.
Součástí zadání množiny relevantních SDCF-výrazů je i zadání vztahu množin α a β, které se vyvolá tlačítkem Params
.
Množina relevantních množin α musí být vždy neprázdná, množina relevantních množin β i množina podmínek mohou být prázdné. V zadání těchto množin se mohou vyskytovat stejné atributy.
Za relevantní SDCF-výrazy jsou potom považovány všechny SDCF-výrazy α×β: ≈A/χ takové, že A je uveden v seznamu atributů, α ∈ ALFA, β ∈ BETA, χ ∈ COND a zároveň α, β a χ nemají společné atributy.
Kontrola zahrnuje jednak obecné kontroly společné pro všechny procedury a jednak kontroly zadání parametrů specifických pro SDCF-Miner.