Uživatelské nástroje

Nástroje pro tento web


Postranní lišta

Úvod

Důležité pojmy

Vztahy, s nimiž procedury pracují

GUHA procedury

GUHA procedury - společné prvky

Observační kalkuly - relevantní výsledky

Důležité tématické okruhy

lm_guha_te_kl_proc

KL-Miner

Procedura KL-Miner pracuje s KL-vztahy R≈C/χ. Zde R a C jsou kategoriální atributy, χ je booleovský atribut a ≈ je KL-kvantifikátor. KL-vztah R≈C/χ říká, že vztah kategoriálních atributů R a C na podmatici dané booleovským atributem χ splňuje podmínku danou KL-kvantifikátorem ≈. Zadání procedury se provádí v okně dle následujícího obrázku.

Zadává se množina relevantních KL-vztahů a detaily výstupu.

Tlačítkem Validate se vyvolá kontrola zadání.

Parametrem Maximal number of hypotheses to be mined se udává maximální počet pravidel, který může být nalezen. Parametr je dostupný po použití tlačítka Params. Po dosažení uvedeného maximálního počtu pravidel se běh procedury ukončí.

Procedura se spustí jedním z tlačítek Run, Bkgrnd Run, Grid Run popsaných zde. Prohlížení a interpretace výsledků se zahajuje tlačítkem Show Results.

Tlačítkem Task Clone se provede vyklonování úlohy.

Ukázky aplikací procedury KL-Miner jsou zde.

Množina relevantních KL-vztahů

Množina relevantních CF-výrazů je dána

  • zadáním neprázdného seznamu atributů relevantních pro řádkové atributy, to se zahajuje tlačítkem
    ROW ATTRIBUTES
  • zadáním neprázdného seznamu atributů relevantních pro sloupcové atributy, to se zahajuje tlačítkem COLUMN ATTRIBUTES
  • zadáním množiny COND relevantních podmínek, to se zahajuje tlačítkem CONDITION.
  • zadáním KL-kvantifikátoru ≈, to se zahajuje tlačítkem QUANTIFIERS

Množina COND se zadává jako množina relevantních cedentů, může být prázdná,.

Za relevantní KL-vztahy jsou potom považovány všechny KL-vztahy R≈C/χ takové, že R je uveden v seznamu řádkových atributů, S je uveden v seznamu sloupcových atributů a χ ∈ COND.

Součástí zadání množiny relevantních KL-vztahů je i zadání způsobu výpočtu hodnot v kontingenční tabulce tlačítkem Aggregate function.

Výpočet hodnot v kontingenční tabulce

Předpokládá se, že hodnota v poli ‹i,j› kontingenční tabulky odpovídá počtu řádků analyzované matice splňujících booleovský atribut χ pro které je hodnota atributu R jeho i-tou kategorií a hodnota atributu C jeho j-tou kategorií. To je možno změnit pomocí tlačítka Aggregate function, kterým se otevře okno dle následujícího obrázku.

BUDE DOPLŇENO

Kontrola zadání

Kontrola zahrnuje jednak obecné kontroly společné pro všechny procedury a jednak kontroly zadání parametrů specifických pro KL-Miner:

  • Pro zadané rozpětí kategorií kvantifikátoru musí platit, že hodnota od je menší, než je hodnota do (platí pro sloupce i pro řádky).
  • Horní mez zadaného rozpětí kategorií kvantifikátoru zadaná v absolutní hodnotě musí být nižší než počet kategorií u každého z atributů uvedených v zadání úlohy (platí pro sloupce i pro řádky).
  • KL-kvantifikátory používající při výpočtu kardinální hodnoty mohou být použity pouze nad atributy s kardinálními hodnotami.
lm_guha_te_kl_proc.txt · Poslední úprava: 2020/02/26 09:52 (upraveno mimo DokuWiki)