Uživatelské nástroje

Nástroje pro tento web


lmexplore:start

Seznámení s daty

Seznámení s daty je druhou fází procesu DZD podle metodiky CRISP-DM.

Základní funkce pro seznámení s daty jsou v systému LISp-Miner soustředěny do modulu LM Workspace. Tyto funkce umožňují jak načtení (nebo připojení) dat, tak i prohlížení dat – tedy získání základní představy o jejich struktuře a obsahu. Bez skutečného porozumění datům – jejich struktuře i obsahu není možné dosáhnout dobrých výsledků analýzy.

Načtení dat

Analýzu obvykle zahujememe načtením dat.

Zvláštní péči je třeba věnovat problému při práci s daty s velkým množstvím vlastností (sloupců), které nelze rovnou načíst do databázových tabulek.

Praktická ukázka: Demo Hotel: Načtení dat

Prohlížení dat

Základní funkce pro prohlížení struktury a obsahu dat nalezneme v modulu LM Workspace v menu Data Introduction. Záložky patřící do fáze Seznámení s daty se budou objevovat ve stromu otevřených záložek po levé straně pracovní plochy ve větvi A. Data Introduction .

Výchozí záložkou je seznam všech databázových tabulek. Výběrem jedné položky ze seznamu otevřeme záložku s detailem tabulky. Tlačítkem Show Data otevřeme záložky s obsahem právě vybrané tabulky.

Skládají-li se analyzovaná data z více tabulek, musíme zadat relace, pomocí kterých se mají tabulky spojovat.

Praktická ukázka: Demo Hotel: Prohlížení dat

Načtení dalších dat

Na záložce Tables můžeme tlačítkem Import TXT přidat do analyzovaných dat další databázovou tabulku, jejíž obsah bude načten z textového souboru. Funkce i postup je shodný jako při prvotním importu dat z textového soboru.

Po úspěšném importu dalších dat a vytvoření nové databázové tabulky se tato objeví v seznamu databázových tabulek na záložce Tables. Stejně tak se systém LISp-Miner pokusí automaticky inicializovat tabulku a identifikovat primární klíč.


Související témata:

Načtení dat v textovém souboru nebo v databázi
Propojení existující dvojice data+metabáze

lmexplore/start.txt · Poslední úprava: 2015/08/03 20:53 autor: msi