Uživatelské nástroje

Nástroje pro tento web


Postranní lišta

Úvod

Důležité pojmy

Vztahy, s nimiž procedury pracují

GUHA procedury

GUHA procedury - společné prvky

Observační kalkuly - relevantní výsledky

Důležité tématické okruhy

lm_guha_te_4ft_missings

Zpracování neúplné informace

Procedura 4ft-Miner nabízí čtyři způsoby zpracování neúplné informace. Volba způsobu se provádí v horní části okna vyvolaného tlačítkem Params z hlavní obrazovky procedury 4ft-Miner, viz též následující obrázek.

Teoretické souvislosti a další podrobnosti jsou k dispozici zde. Dále jsou uvedeny informace nezbytné pro používání jednotlivých způsobů. Jedná se o

Příklad ukazující aplikaci zabezpečeného přístupu je zde.

Vynechání neúplné informace

Podstatou vynechání neúplné informace je, že se pro verifikaci asociačního pravidla využije čtyřpolní tabulka vzniklá z devítipolní vynecháním polí devítipolní tabulky, která se týkají chybějící informace. Podrobnosti o vytvoření čtyřpolní tabulky jsou zde.

Obdobně se postupuje i při vynechání neúplné informace pro podmíněná asociační pravidla, podrobnosti jsou zde.

Tento přístup lze použít pro všechny 4ft-kvantifikátory implementované v proceduře 4ft-Miner i pro jejich kombinace.

Optimistické doplnění

Volba optimistického doplnění znamená, že asociační pravidlo je považováno za pravdivé v matici dat s neúplnou informací, pokud je pravdivé alespoň v jednom doplnění této matice. Při verifikaci pomocí tohoto přístupu se používá optimalizovaný způsob verifikace, který je však znám jenom pro některé z implementovaných kvantifikátorů.

To znamená, že tento způsob lze využít pouze pro následující kvantifikátory a jejich kombinace (stejné, jako pro zabezpečené doplnění).

  • p-Implikace PIM, dolní kritická implikace LCI, horní kritická implikace LCI
  • dvojitá implikace DPIM, dolní kritická dvojitá implikace DLCI, horní kritická dvojitá implikace DUCI
  • ekvivalence (přesnost) PEQ, dolní kritická ekvivalence LCE, horní kritická ekvivalence UCE
  • nadprůměrné souvisení (AA-kvantifikátor) AAD, prosté vychýlení SID, Fisherův kvantifikátor FSH, χ2-kvantifikátor CHI
  • BASE, support SUPP.

Podrobnosti jsou uvedeny zde.

Pro podmíněná asociační pravidla platí stejná omezení, další informace jsou zde

Zabezpečený přístup

Zabezpečený přístup znamená, že asociační pravidlo je považováno za pravdivé v matici dat s neúplnou informací, pokud je pravdivé ve všech doplněních této matice. Při verifikaci pomocí tohoto přístupu se používá optimalizovaný způsob verifikace, který je však znám jenom pro některé z implementovaných kvantifikátorů.

To znamená, že tento způsob lze využít pouze pro následující kvantifikátory a jejich kombinace (stejné, jako pro optimistické doplnění).

  • p-Implikace PIM, dolní kritická implikace LCI, horní kritická implikace LCI
  • dvojitá implikace DPIM, dolní kritická dvojitá implikace DLCI, horní kritická dvojitá implikace DUCI
  • ekvivalence (přesnost) PEQ, dolní kritická ekvivalence LCE, horní kritická ekvivalence UCE
  • nadprůměrné souvisení (AA-kvantifikátor) AAD, prosté vychýlení SID, Fisherův kvantifikátor FSH, χ2-kvantifikátor CHI
  • BASE, support SUPP.

Podrobnosti jsou uvedeny ve formě úvah a příkladů zde, formálnější popis je zde

Pro podmíněná asociační pravidla platí stejná omezení, další informace jsou zde

Ignorování neúplné informace

Při zpracování se neúplná informace ignoruje v tom smyslu, že kód chybějící hodnoty X se považuje za speciální kategorii. Tato kategorie zůstává skryta a nelze ji použít při zadání relevantních koeficientů. Podrobnosti jsou zde.

Tento přístup lze použít pro všechny 4ft-kvantifikátory implementované v proceduře 4ft-Miner i pro jejich kombinace.

Totéž platí pro podmíněná asociační pravidla, podrobnosti jsou zde.

lm_guha_te_4ft_missings.txt · Poslední úprava: 2019/10/01 19:24 (upraveno mimo DokuWiki)