====== Zpracování neúplné informace ====== Procedura 4ft-Miner nabízí čtyři způsoby zpracování neúplné informace. Volba způsobu se provádí v horní části okna vyvolaného tlačítkem ''Params'' z [[lm_guha_te_4ft_proc|hlavní obrazovky procedury 4ft-Miner]], viz též následující obrázek. {{ :4ft_miner_zadani_neuplne_informace.png?500 |}} Teoretické souvislosti a další podrobnosti jsou k dispozici [[lm_guha_te_missings|zde]]. Dále jsou uvedeny informace nezbytné pro používání jednotlivých způsobů. Jedná se o * Deleting - [[lm_guha_te_4ft_missings#Vynechání neúplné informace|vynechání neúplné informace]] * Optimistical - [[lm_guha_te_4ft_missings#Optimistické doplnění|optimistické doplnění]] * Secured - [[lm_guha_te_4ft_missings#Zabezpečený přístup|zabezpečený přístup]] * Ignore X-categories - [[lm_guha_te_4ft_missings#Ignorování neúplné informace|ignorování neúplné informace]]. Příklad ukazující aplikaci zabezpečeného přístupu je [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_typul_4ft#data_adult_-_chybejici_informace|zde]]. ===== Vynechání neúplné informace ===== Podstatou vynechání neúplné informace je, že se pro verifikaci asociačního pravidla využije čtyřpolní tabulka vzniklá z devítipolní vynecháním polí devítipolní tabulky, která se týkají chybějící informace. Podrobnosti o vytvoření čtyřpolní tabulky jsou {{ :missings_vynechani.pdf |zde}}. Obdobně se postupuje i při vynechání neúplné informace pro podmíněná asociační pravidla, podrobnosti jsou {{ :missings_podminena_pravidla_vynechani.pdf |zde}}. Tento přístup lze použít pro všechny [[lm_guha_te_4ft_kvantifikator|4ft-kvantifikátory implementované v proceduře 4ft-Miner]] i pro jejich kombinace. ===== Optimistické doplnění ===== Volba optimistického doplnění znamená, že asociační pravidlo je považováno za pravdivé v matici dat s neúplnou informací, pokud je pravdivé alespoň v jednom doplnění této matice. Při verifikaci pomocí tohoto přístupu se používá optimalizovaný způsob verifikace, který je však znám jenom pro některé z implementovaných kvantifikátorů. To znamená, že tento způsob lze využít pouze pro následující kvantifikátory a jejich kombinace (stejné, jako pro zabezpečené doplnění). * p-Implikace PIM, dolní kritická implikace LCI, horní kritická implikace LCI * dvojitá implikace DPIM, dolní kritická dvojitá implikace DLCI, horní kritická dvojitá implikace DUCI * ekvivalence (přesnost) PEQ, dolní kritická ekvivalence LCE, horní kritická ekvivalence UCE * nadprůměrné souvisení (AA-kvantifikátor) AAD, prosté vychýlení SID, Fisherův kvantifikátor FSH, χ2-kvantifikátor CHI * BASE, support SUPP. Podrobnosti jsou uvedeny {{ :missings_optimisticke_doplneni.pdf |zde}}. Pro podmíněná asociační pravidla platí stejná omezení, další informace jsou [[lm_guha_te_missings#Podmíněná pravidla a optimistické doplnění|zde]] ===== Zabezpečený přístup ===== Zabezpečený přístup znamená, že asociační pravidlo je považováno za pravdivé v matici dat s neúplnou informací, pokud je pravdivé ve všech doplněních této matice. Při verifikaci pomocí tohoto přístupu se používá optimalizovaný způsob verifikace, který je však znám jenom pro některé z implementovaných kvantifikátorů. To znamená, že tento způsob lze využít pouze pro následující kvantifikátory a jejich kombinace (stejné, jako pro optimistické doplnění). * p-Implikace PIM, dolní kritická implikace LCI, horní kritická implikace LCI * dvojitá implikace DPIM, dolní kritická dvojitá implikace DLCI, horní kritická dvojitá implikace DUCI * ekvivalence (přesnost) PEQ, dolní kritická ekvivalence LCE, horní kritická ekvivalence UCE * nadprůměrné souvisení (AA-kvantifikátor) AAD, prosté vychýlení SID, Fisherův kvantifikátor FSH, χ2-kvantifikátor CHI * BASE, support SUPP. Podrobnosti jsou uvedeny ve formě úvah a příkladů {{ :missings_pravidla_priklady.pdf |zde}}, formálnější popis je {{ :missings_pravidla_formalnejsi_popis.pdf |zde}} Pro podmíněná asociační pravidla platí stejná omezení, další informace jsou [[lm_guha_te_missings#Podmíněná pravidla a zabezpečené doplnění|zde]] ===== Ignorování neúplné informace ===== Při zpracování se neúplná informace ignoruje v tom smyslu, že kód chybějící hodnoty X se považuje za speciální kategorii. Tato kategorie zůstává skryta a nelze ji použít při zadání relevantních koeficientů. Podrobnosti jsou {{ :missings_ignorovani.pdf |zde}}. Tento přístup lze použít pro všechny [[lm_guha_te_4ft_kvantifikator|4ft-kvantifikátory implementované v proceduře 4ft-Miner]] i pro jejich kombinace. Totéž platí pro podmíněná asociační pravidla, podrobnosti jsou [[lm_guha_te_missings#Podmíněná pravidla a ignorování neúplné informace|zde]].