Uživatelské nástroje

Nástroje pro tento web


lmexplore:import

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

lmexplore:import [2016/02/24 22:13] (aktuální)
Řádek 1: Řádek 1:
 +===== Načtení dat =====
 +
 +Systém LISp-Miner předpokládá,​ že analyzovaná data jsou uložena v relační databázi a přístupná pomocí rozhraní ODBC. 
 +
 +Použití univerzálního databázového rozhraní ODBC dovoluje, aby analyzovaná data byla uložena téměř v libovolné databázi (MS Access, Oracle, MS SQL Server, MySQL...) nebo třeba i jako textový soubor obsahující vhodně naformátovaná data. 
 +
 +V analyzovaných datech nejsou prováděny žádné změny a je k nim přistupováno pouze v režimu //​read-only//​. Výjimku představuje funkce [[:​lmexplore:​importtxt|importu dat z textového souboru]], která data ukládá do databáze, a funkce smazání databázové tabulky na záložce se seznamem [[:​lmexplore:​tables|databázových tabulek]].
 +
 +==== Vytvoření dvojice data+metabáze ====
 +
 +Ke každým datům je systémem LISp-Miner vytvořena [[:​lmbase:​start#​dvojice_data_metabaze|metabáze]],​ do které se ukládají veškerá uživatelská data. Patří mezi ně popis struktury analyzovaných dat, popis kategorizace (atributů),​ zadání úloh a v neposlední řadě i výsledky běhu úloh.
 +
 +Abychom tedy mohli začít se systémem pracovat, musíme připravit relační databázi (s jednou nebo více relačními tabulkami) obsahující analyzovaná data. K nim se pak automaticky vytvoří i metabáze. Nastat mohou následující situace, pro které je i následně uveden postup:
 +
 +  * Data jsme získali v podobě [[:​lmexplore:​importtxt|textového souboru ve formátu CSV]] (možné jsou i jiné oddělovače sloupců, než čárka) a potřebujeme je načíst do databáze a vytvořit k nim metabázi.
 +  * Data máme již uložená jako [[:​lmexplore:​newfrommdb|databázi MS Access]] a potřebujeme k nim vytvořit metabázi.
 +  * Data máme již v [[:​lmexplore:​newfromdsn|databázovém systému podporujícím ODBC]] a potřebujeme k nim vytvořit metabázi.
 + 
 +==== Automatická inicializace metabáze ====
 +
 +Po úspěšném vytvoření metabáze se otevře základní obrazovka modulu LM Workspace a v něm se automaticky zobrazí záložka se [[:​lmexplore:​tables|seznamem databázových tabulek]]. Zároveň se načtou základní údaje o databázové tabulce (počty a názvy sloupců, statistické hodnoty o sloupcích…) a také se označí primární klíč (dokáže-li jej systém LISp-Miner rozpoznat – jeho název musí být **ID** nebo **ID_LM** a datový typ //Celé číslo//​). ​
 +
 +Že byla tabulka úspěšně inicializována poznáme tak, že v seznamu tabulek bude zvýrazněna zeleně. V opačném případě ji musíme [[:​lmexplore:​table|inicializovat ručně]]. ​
 +
 +===== Připojení existující dvojice data+metabáze =====
 +
 +Pokud změníme umístění již existující dvojice [[:​lmbase:​start#​dvojice_data_metabaze|data+metabáze]] na lokálním disku nebo tuto dvojici přeneseme z jiného počítače,​ musíme oba soubory znovu propojit.
 +
 +K tomu použijeme tlačítko ''​Associate an existing metabase with data''​. Tlačítko vyvolá dialogové okno, pomocí kterého označíme nejprve analyzovaná data, a pak i metabázi. Po stisku tlačítka ''​Ok''​ dojde k jejich propojení a od teď bude možné i na tomto počítači vybírat dvojici [[:​lmbase:​start#​dvojice_data_metabaze|data+metabáze]] ze seznamu naposledy otevřených dat k analýze.
 +
 +Jak analyzovaná data, tak i metabázi můžeme nezávislé na sobě označit dvěma způsoby – buď pomocí //ODBC datového zdroje//, nebo odkazem na soubor ve formátu MS Access někde na lokálním disku. ​
 +
 +V obou případěch je možné jak pro data, tak pro metabázi použít stejný řetěz znaků, protože systém LISp-Miner automaticky odliší název //ODBC datového zdroje// k metabázi přidáním sufixu //MB//. Při volbě vhodného názvu //ODBC datového zdroje// je třeba dodržovat omezení na něj kladená (používat pouze znaky bez diakritiky a nepřekročit maximální délku). ​
 +
 +==== Automatické dohledání souboru metabáze k datům ====
 +
 +Po označení MDB souboru s analyzovanými daty pomocí tlačítka ''​Browse''​ se pokusí LISp-Miner ušetřit uživateli práci a automaticky dohledat soubor s metabází. Zároveň se i předvyplnění názvy obou ODBC datových zdrojů.
 +
 +K automatickému dohledání a vyplnění dojde v případě, že analyzovaná data i metabáze jsou ve stejné složce a v podobě MDB souborů a zároveň je použito standardní pojmenování obou souborů – se zakončením na ''​.Data.mdb''​ (analyzovaná data) a ''​.LMMB.mdb''​ (metabáze).
 +
 +==== File DSN ====
 +
 +V případě identifikace odkazem na soubor je vhodné opravit přednastavený název pro //ODBC datový zdroj//, který bude použit k přístupu k datům přes rozhraní ODBC. 
 +
 +
 +===== Volby související s mezinárodním nastavením systému Windows a databáze =====
 +
 +Po vytvoření nové metabáze i po připojení existující je třeba zkontrolovat nastavení související s jazykovým prostředím. Zejména je třeba zkontrolovat formát datumů, který má LISp-Miner používat při komunikaci při databází – viz [[:​lmbase:​lmworkspace#​ostatni_nastaveni|uživatelská nastavení]]. Jsou-li data uložena v systému s anglickým formátem datumu, je třeba změnit formát datumů na //​MM/​DD/​YYYY//​.
 +
 +===== Doporučení a omezení podle velikosti dat =====
 +
 +Systém LISp-Miner je uzpůsoben pro práci s daty od desítek záznamů po stovky miliónů záznamů. Podle velikosti dat i složitosti úloh byl připraven [[:​lmbase:​datasize|seznam doporučení a omezení]].
 +
 +-----
 +
 +**Související témata:**
 +
 +{{:​lmbase:​seealso.png?​nolink&​32|}} [[:​lmexplore:​start|Seznámení s daty]]\\
 +{{:​lmbase:​seealso.png?​nolink&​32|}} [[:​lmexplore:​table|Záložka s detailem databázové tabulky]]\\
  
lmexplore/import.txt · Poslední úprava: 2016/02/24 22:13 (upraveno mimo DokuWiki)