Uživatelské nástroje

Nástroje pro tento web


lmexplore:start

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

lmexplore:start [2015/08/03 20:53] (aktuální)
Řádek 1: Řádek 1:
 +====== Seznámení s daty ======
 +
 +{{:​dzd:​faze2.png?​direct&​200 |}} Seznámení s daty je druhou fází procesu DZD podle metodiky CRISP-DM. ​
 +
 +Základní funkce pro seznámení s daty jsou v systému LISp-Miner soustředěny do modulu [[:​lmbase:​lmworkspace|LM Workspace]]. Tyto funkce umožňují jak načtení (nebo připojení) dat, tak i prohlížení dat – tedy získání základní představy o jejich struktuře a obsahu. Bez skutečného porozumění datům – jejich struktuře i obsahu není možné dosáhnout dobrých výsledků analýzy. ​
 +
 +===== Načtení dat =====
 +
 +Analýzu obvykle zahujememe [[:​lmexplore:​import|načtením dat]]. ​
 +
 +Zvláštní péči je třeba věnovat problému při [[:​lmexplore:​multicolumn|práci s daty s velkým množstvím vlastností (sloupců)]],​ které nelze rovnou načíst do databázových tabulek.
 +
 +{{:​lmdemo:​example.png?​nolink&​32|}} Praktická ukázka: [[:​lmdemo:​hotel2015:​import|Demo Hotel: Načtení dat]]
 +
 +===== Prohlížení dat =====
 +
 +Základní funkce pro prohlížení struktury a obsahu dat nalezneme v modulu LM Workspace v menu ''​Data Introduction''​. Záložky patřící do fáze //​Seznámení s daty// se budou objevovat ve stromu otevřených záložek po levé straně pracovní plochy ve větvi ''​A. Data Introduction''​ .
 +
 +Výchozí záložkou je seznam všech [[:​lmexplore:​tables|databázových tabulek]]. Výběrem jedné položky ze seznamu otevřeme záložku s [[:​lmexplore:​table|detailem tabulky]]. Tlačítkem ''​Show Data''​ otevřeme záložky s [[:​lmexplore:​tabledata|obsahem právě vybrané tabulky]].
 +
 +Skládají-li se analyzovaná data z více tabulek, musíme zadat [[:​lmexplore:​relationships|relace]],​ pomocí kterých se mají tabulky spojovat.
 +
 +{{:​lmdemo:​example.png?​nolink&​32|}} Praktická ukázka: [[:​lmdemo:​hotel2015:​explore|Demo Hotel: Prohlížení dat]]
 +
 +===== Načtení dalších dat =====
 +
 +Na záložce [[:​lmexplore:​tables|Tables]] můžeme tlačítkem ''​Import TXT''​ přidat do analyzovaných dat další databázovou tabulku, jejíž obsah bude načten z textového souboru. Funkce i postup je shodný jako při prvotním [[:​lmexplore:​importtxt|importu dat z textového soboru]].
 +
 +Po úspěšném importu dalších dat a vytvoření nové databázové tabulky se tato objeví v seznamu databázových tabulek na záložce [[:​lmexplore:​tables|Tables]]. Stejně tak se systém LISp-Miner pokusí automaticky inicializovat tabulku a identifikovat primární klíč.
 +
 +------
 +
 +**Související témata:**
 +
 +{{:​lmbase:​seealso.png?​nolink&​32|}} [[:​lmexplore:​import|Načtení dat v textovém souboru nebo v databázi]]\\
 +{{:​lmbase:​seealso.png?​nolink&​32|}} [[:​lmexplore:​import#​pripojeni_existujici_dvojice_data_metabaze|Propojení existující dvojice data+metabáze]]\\
  
lmexplore/start.txt · Poslední úprava: 2015/08/03 20:53 (upraveno mimo DokuWiki)