Uživatelské nástroje

Nástroje pro tento web


lmexplore:columnderived

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

lmexplore:columnderived [2016/01/03 20:48]
lmexplore:columnderived [2016/12/12 17:11] (aktuální)
Řádek 1: Řádek 1:
 +====== Výpočet odvozených hodnot ======
  
 +Odvozené hodnoty jsou počítány z hodnot již dostupných v analyzovaných datech, ale nabízejí jiný, trochu odlišný pohled na data. 
 +
 +Přístupné jsou jako dodatečně přidané (odvozené) sloupce (angl. //derived columns//) do původní databázové tabulky. Objevují se tak v seznamu sloupců na záložce [[:​lmexplore:​table|databázové tabulky]], kde můžeme přidávat i další odvozené sloupce. ​
 +
 +===== Automaticky vytvořené odvozené hodnoty =====
 +
 +Typickou odvozenou hodnotou je den v týdnu vypočtený z datumu. Zároveň je možné z datumu vypočítat i pořadový den v roce, pořadí týdne v roce, čtvrtletí nebo i pořadový den na základě minimální hodnoty v daném sloupci.  ​
 +
 +Samotné datum a čas jsou složené datové typy, které se skládají z dílčích hodnot – rok, měsíc a den pro datum a hodina, minuta, sekunda pro čas. S každou z těchto dílčích hodnot můžeme pracovat samostatně jako s odvozenou hodnotou. ​
 +
 +Výše zmíněné odvozené hodnoty vytvoří LISp-Miner automaticky.
 +
 +===== Hodnoty vypočtené výrazem =====
 +
 +Častým případem odvozených hodnot je výpočet jednotkových cen z cen celkových. Dalším příkladem může být věk vypočtený z datumu narození nebo **BMI** (//​body-mass index//) používaný v lékařském prostředí a zohledňující jak hmotnost, tak výšku pacienta. ​
 +
 +Jde o odvozené hodnoty vypočtené z jiných sloupců, ale vždy pouze z hodnot v jednom řádku databázové tabulky. ​
 +
 +**Více viz:** [[:​lmexplore:​columnexpr|Hodnoty vypočtené výrazem]]\\
 +
 +===== Hodnoty vypočtené vnořeným SQL dotazem =====
 +
 +Za odvozené hodnoty je možné považovat i různé agregované údaje. Ty můžeme vypočítat jak ze samotné databázové tabulky, nad kterou provádíme analýzu, tak i z dalších (nějakým způsobem provázaných) databázových tabulek. ​
 +
 +Příklad první agregované hodnoty může být pro každého hosta výpočet počtu dalších hostů, kteří ve **stejný den** přijeli ze **stejného města**. Příkladem druhého způsobu výpočtu může být zjištění vzdálenosti k nejbližší policejní stanici pro každý ze spáchaný zločinů na základě souřadnic místa zločinu v hlavní tabulce a souřadnic policejních stanic v tabulce druhé. ​
 +
 +**Více viz:** [[:​lmexplore:​columnquery|Hodnoty vypočtené vnořeným SQL dotazem]]\\
 +
 +===== Hodnoty vypočtené z geografických dat =====
 +
 +Jsou-li součástí dat i geografické souřadnice bodu (např. místa nehody nebo trestného činu, bydliště hosta...), můžeme je využít pro výpočet dalšího typu odvozených hodnot počítaných na základě geografických relací jako např. "​vzdálenost od místa nehody k nejbližší nemocnici",​ "​název (konkurenčního) hotelu, ke kterému má host nejblíže ze svého bydliště"​ nebo "​název gangu, v jehož teritoriu se zločin stal"​. ​
 +
 +**Více viz:** [[:​lmexplore:​columngeo|Hodnoty vypočtené z geografických dat]]\\
 +
 +===== Hodnoty odvozené z analýzy hlavních komponent =====
 +
 +Dalším typem odvozených sloupců jsou sloupce vzniklé představující jednotlivé hlavní komponenty jako výsledek [[:​lmianalysis:​pca#​vytvoreni_odvozenych_sloupcu|analýzy hlavní komponent]].
 +
 +**Více viz:** [[:​lmianalysis:​pca|Analýza hlavních komponent]]\\
 +
 +===== Hodnoty odvozené z výsledků úloh =====
 +
 +Konečně je možné vytvářet odvozené sloupce nad nalezenými vztahy.
 +
 +**Více viz:** [[:​lmexplore:​columnhypothesis|Hodnoty vypočtené z výsledků úloh DZD]]\\
 +
 +-----
 +
 +**Související témata:**
 +
 +{{:​lmbase:​seealso.png?​nolink&​32|}} [[:​lmexplore:​table|Záložka s detaily o tabulce]]\\
 +{{:​lmbase:​seealso.png?​nolink&​32|}} [[:​lmexplore:​tabledata|Zobrazení hodnot v tabulce]]\\
 +
 +{{:​lmdemo:​example.png?​nolink&​32|}} Praktická ukázka: [[:​lmdemo:​hotel2015:​columnderived|Demo Hotel: Výpočet odvozených hodnot]]