====== Zpracování neúplné informace ======
Procedura 4ft-Miner nabízí čtyři způsoby zpracování neúplné informace. Volba způsobu se provádí
v horní části okna vyvolaného tlačítkem ''Params'' z [[lm_guha_te_4ft_proc|hlavní obrazovky procedury 4ft-Miner]], viz též
následující obrázek.
{{ :4ft_miner_zadani_neuplne_informace.png?500 |}}
Teoretické souvislosti a další podrobnosti jsou
k dispozici [[lm_guha_te_missings|zde]]. Dále jsou uvedeny informace nezbytné pro používání jednotlivých způsobů.
Jedná se o
* Deleting - [[lm_guha_te_4ft_missings#Vynechání neúplné informace|vynechání neúplné informace]]
* Optimistical - [[lm_guha_te_4ft_missings#Optimistické doplnění|optimistické doplnění]]
* Secured - [[lm_guha_te_4ft_missings#Zabezpečený přístup|zabezpečený přístup]]
* Ignore X-categories - [[lm_guha_te_4ft_missings#Ignorování neúplné informace|ignorování neúplné informace]].
Příklad ukazující aplikaci zabezpečeného přístupu je [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_typul_4ft#data_adult_-_chybejici_informace|zde]].
===== Vynechání neúplné informace =====
Podstatou vynechání neúplné informace je, že se pro verifikaci asociačního pravidla využije čtyřpolní tabulka vzniklá z devítipolní
vynecháním polí devítipolní tabulky, která se týkají chybějící informace.
Podrobnosti o vytvoření čtyřpolní tabulky jsou {{ :missings_vynechani.pdf |zde}}.
Obdobně se postupuje i při vynechání neúplné informace pro podmíněná asociační pravidla,
podrobnosti jsou {{ :missings_podminena_pravidla_vynechani.pdf |zde}}.
Tento přístup lze použít pro všechny
[[lm_guha_te_4ft_kvantifikator|4ft-kvantifikátory implementované v proceduře 4ft-Miner]] i pro jejich kombinace.
===== Optimistické doplnění =====
Volba optimistického doplnění znamená, že asociační pravidlo je považováno
za pravdivé v matici dat s neúplnou informací, pokud je pravdivé alespoň v jednom doplnění této matice.
Při verifikaci pomocí tohoto přístupu se používá optimalizovaný způsob verifikace, který je však znám jenom
pro některé z implementovaných kvantifikátorů.
To znamená, že tento způsob lze využít pouze pro následující
kvantifikátory a jejich kombinace (stejné, jako pro zabezpečené doplnění).
* p-Implikace PIM, dolní kritická implikace LCI, horní kritická implikace LCI
* dvojitá implikace DPIM, dolní kritická dvojitá implikace DLCI, horní kritická dvojitá implikace DUCI
* ekvivalence (přesnost) PEQ, dolní kritická ekvivalence LCE, horní kritická ekvivalence UCE
* nadprůměrné souvisení (AA-kvantifikátor) AAD, prosté vychýlení SID, Fisherův kvantifikátor FSH, χ2-kvantifikátor CHI
* BASE, support SUPP.
Podrobnosti jsou uvedeny {{ :missings_optimisticke_doplneni.pdf |zde}}.
Pro podmíněná asociační pravidla platí stejná omezení, další informace jsou [[lm_guha_te_missings#Podmíněná pravidla a optimistické doplnění|zde]]
===== Zabezpečený přístup =====
Zabezpečený přístup znamená, že asociační pravidlo je považováno
za pravdivé v matici dat s neúplnou informací, pokud je pravdivé ve všech doplněních této matice.
Při verifikaci pomocí tohoto přístupu se používá optimalizovaný způsob verifikace, který je však znám jenom
pro některé z implementovaných kvantifikátorů.
To znamená, že tento způsob lze využít pouze pro následující
kvantifikátory a jejich kombinace (stejné, jako pro optimistické doplnění).
* p-Implikace PIM, dolní kritická implikace LCI, horní kritická implikace LCI
* dvojitá implikace DPIM, dolní kritická dvojitá implikace DLCI, horní kritická dvojitá implikace DUCI
* ekvivalence (přesnost) PEQ, dolní kritická ekvivalence LCE, horní kritická ekvivalence UCE
* nadprůměrné souvisení (AA-kvantifikátor) AAD, prosté vychýlení SID, Fisherův kvantifikátor FSH, χ2-kvantifikátor CHI
* BASE, support SUPP.
Podrobnosti jsou uvedeny ve formě úvah a příkladů {{ :missings_pravidla_priklady.pdf |zde}},
formálnější popis je {{ :missings_pravidla_formalnejsi_popis.pdf |zde}}
Pro podmíněná asociační pravidla platí stejná omezení, další informace jsou
[[lm_guha_te_missings#Podmíněná pravidla a zabezpečené doplnění|zde]]
===== Ignorování neúplné informace =====
Při zpracování se neúplná informace ignoruje v tom smyslu, že
kód chybějící hodnoty X se považuje za speciální kategorii.
Tato kategorie zůstává skryta a nelze ji použít při zadání relevantních koeficientů.
Podrobnosti jsou {{ :missings_ignorovani.pdf |zde}}.
Tento přístup lze použít pro všechny
[[lm_guha_te_4ft_kvantifikator|4ft-kvantifikátory implementované v proceduře 4ft-Miner]] i pro jejich kombinace.
Totéž platí pro podmíněná asociační pravidla, podrobnosti jsou [[lm_guha_te_missings#Podmíněná pravidla a
ignorování neúplné informace|zde]].