Uživatelské nástroje

Nástroje pro tento web


lmexplore:columngeo

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

lmexplore:columngeo [2017/01/22 14:15] (aktuální)
Řádek 1: Řádek 1:
 +====== Hodnoty vypočtené z geografických dat ======
  
 +Součástí dat bývají často i geografické souřadnice bodu (např. místa nehody nebo trestného činu, bydliště hosta...). Ty můžeme využít pro výpočet dalšího typu odvozených hodnot počítaných na základě geografických relací – např. "​vzdálenost od místa nehody k nejbližší nemocnici",​ "​název (konkurenčního) hotelu, ke kterému má host nejblíže ze svého bydliště"​ nebo "​název gangu, v jehož teritoriu se zločin stal"​. ​
 +
 +Kromě souřadnic v datech budeme potřebovat ještě soubor s definicí zájmových bodů nebo hranic oblastí. ​
 +
 +**Pozor!** Odvozené hodnoty vypočtené z geografických dat byly do systému LISp-Miner přidány zejména pro potřeby výuky a pro vyzkoušení možností jejich vyžití při analýze (výukových) dat. V případě analýzy rozsáhlých reálných dat je z hlediska časové náročnosti výpočtu nutné použít vhodný databázový systém (DBMS) a tento typ odvozenýcgh hodnot počítat přímo v něm.
 +
 +===== Typy odvozených hodnot z geografických dat =====
 +
 +V současné době je možné vybírat ze tří typů geografických relací:
 +
 +  * **Vzdálenost k nejbližšímu bodu** ... Pro daný záznam analyzovaných dat bude zjištěn nejbližší bod ze souboru zájmových bodů a vypočtena vzdálenost k němu.
 +  * **Název nejbližšího bodu** ... Pro daný záznam analyzovaných dat bude zjištěn nejbližší bod ze souboru zájmových bodů a vrácen jeho název.
 +  * **Bod v oblasti** ... Pro daný záznam analyzovaných dat bude pak vrácen název oblasti, do které bod o daných souřadnicích patří (na základě definice hranic oblastí v souboru). V případě, že bod nebude patřit do žádné oblasti, bude vrácena hodnota ''​NULL''​.
 +
 +===== Přidání odvozeného sloupce =====
 +
 +Odvozený sloupec vypočtený z geografických dat přidáme tlačítkem ''​Add geo''​. ​
 +
 +{{:​lmexplore:​databasecolumngeo.hkraj.png?​800 |}} 
 +
 +Nejprve je třeba zadat výstižný název nově přidávaného sloupce -- ten musí být unikátní v rámci databázové tabulky. ​
 +
 +Následně zvolíme typ geografické relace, který se má pro tento odvozený sloupec počítat (viz [[#Typy odvozených hodnot z geografických dat|Typy odvozených hodnot z geografických dat]]). ​
 +
 +Pro výpočet vzdálenosti je třeba zvolit vhodný způsob podle použitého souřadnicového systému:
 +
 +  * **Euclidean** ... euklidovská vzdálenost pro rovinné souřadnice
 +  * **Cylindrical** ... euklidovská vzdálenost na souřadnice WGS84, následně převedena na kilometry. Protože se zanedbává zakřivení zeměkoule, je tento způsob použitelný pouze pro výpočet na kratších vzdáleností (cca do 500 km)
 +  * **Haversine** ... výpočet vzdáleností (v kilometrech) na zemském povrchu pomocí funkce [[https://​en.wikipedia.org/​wiki/​Haversine_formula|haversine]]. ​
 +
 +Pak vybereme sloupce v analyzovaných datech, které reprezentují souřadnice bodu (nejprve pro x-ovou souřadnici,​ následně pro y-ovou). ​
 +
 +Konečně je třeba zadat cestu k souboru s vektorovou definicí bodů (resp. hranic oblastí) a jejich názvy. Pro snazší vyhledání souboru můžeme použít tlačítko ''​Browse''​. ​
 +
 +Po stisku tlačítka ''​Ok''​ se objeví záložka s [[:​lmexplore:​column|detaily o databázovém sloupci]]. Oproti sloupcům existujících přímo v databázi obsahuje tato i souřadnice a název souboru, ze kterých jsou hodnoty v odvozeném sloupci vypočteny. Zadání odvozeného sloupce je možné upravovat po stisku tlačítka ''​Edit''​. Funkčnost záložky i další zacházení s odvozenými sloupci je však zcela shodné jako v případě původních databázových sloupců. ​
 +
 +V seznamu sloupců databázové tabulky bude odvozený sloupec označen typem //Geo//.
 +
 +==== Soubor s vektorovou definicí bodů, resp. hranic oblastí ====
 +
 +V současné době jsou pro definici bodů/​hranic oblastí podporovány pouze soubory ve formátu [[http://​www.opengeospatial.org/​standards/​kml|KML]].
 +
 +V případě relací "​Vzdálenost k nejbližšímu bodu" a "​Název nejbližšího bodu" musí být v souboru nadefinován alespoň jeden pojmenovaný bod. Obvykle však bude bodů více.
 +
 +V případě relace "Bod v oblasti"​ musí být v souboru nadefinován alespoň jeden pojmenovaný polygon představující hranice oblasti. Obvykle však bude polygonů více. V případě, že se polygony budou překrývat (nebo budou uvnitř jiného), bude vrácen název prvního z polygonů, do kterého bod patří.
 +
 +==== Volba datového typu ====
 +
 +Datový typ odvozeného sloupce je automaticky nastaven na ''​Text'',​ protože se vrací název oblasti. ​
 +
 +-----
 +
 +**Související témata:**
 +
 +{{:​lmbase:​seealso.png?​nolink&​32|}} [[:​lmexplore:​columnderived|Odvozené hodnoty]]\\
 +{{:​lmbase:​seealso.png?​nolink&​32|}} [[:​lmexplore:​table|Záložka s detaily o tabulce]]\\
 +{{:​lmbase:​seealso.png?​nolink&​32|}} [[:​lmexplore:​tabledata|Zobrazení hodnot v tabulce]]\\
 +
 +{{:​lmdemo:​example.png?​nolink&​32|}} Praktická ukázka: [[:​lmdemo:​hotel2015:​columnderived|Demo Hotel: Výpočet odvozených hodnot]]
lmexplore/columngeo.txt · Poslední úprava: 2017/01/22 14:15 (upraveno mimo DokuWiki)