Uživatelské nástroje

Nástroje pro tento web


lmexplore:columngeo

Hodnoty vypočtené z geografických dat

Součástí dat bývají často i geografické souřadnice bodu (např. místa nehody nebo trestného činu, bydliště hosta…). Ty můžeme využít pro výpočet dalšího typu odvozených hodnot počítaných na základě geografických relací – např. „vzdálenost od místa nehody k nejbližší nemocnici“, „název (konkurenčního) hotelu, ke kterému má host nejblíže ze svého bydliště“ nebo „název gangu, v jehož teritoriu se zločin stal“.

Kromě souřadnic v datech budeme potřebovat ještě soubor s definicí zájmových bodů nebo hranic oblastí.

Pozor! Odvozené hodnoty vypočtené z geografických dat byly do systému LISp-Miner přidány zejména pro potřeby výuky a pro vyzkoušení možností jejich vyžití při analýze (výukových) dat. V případě analýzy rozsáhlých reálných dat je z hlediska časové náročnosti výpočtu nutné použít vhodný databázový systém (DBMS) a tento typ odvozenýcgh hodnot počítat přímo v něm.

Typy odvozených hodnot z geografických dat

V současné době je možné vybírat ze tří typů geografických relací:

  • Vzdálenost k nejbližšímu bodu … Pro daný záznam analyzovaných dat bude zjištěn nejbližší bod ze souboru zájmových bodů a vypočtena vzdálenost k němu.
  • Název nejbližšího bodu … Pro daný záznam analyzovaných dat bude zjištěn nejbližší bod ze souboru zájmových bodů a vrácen jeho název.
  • Bod v oblasti … Pro daný záznam analyzovaných dat bude pak vrácen název oblasti, do které bod o daných souřadnicích patří (na základě definice hranic oblastí v souboru). V případě, že bod nebude patřit do žádné oblasti, bude vrácena hodnota NULL.

Přidání odvozeného sloupce

Odvozený sloupec vypočtený z geografických dat přidáme tlačítkem Add geo.

Nejprve je třeba zadat výstižný název nově přidávaného sloupce – ten musí být unikátní v rámci databázové tabulky.

Následně zvolíme typ geografické relace, který se má pro tento odvozený sloupec počítat (viz Typy odvozených hodnot z geografických dat).

Pro výpočet vzdálenosti je třeba zvolit vhodný způsob podle použitého souřadnicového systému:

  • Euclidean … euklidovská vzdálenost pro rovinné souřadnice
  • Cylindrical … euklidovská vzdálenost na souřadnice WGS84, následně převedena na kilometry. Protože se zanedbává zakřivení zeměkoule, je tento způsob použitelný pouze pro výpočet na kratších vzdáleností (cca do 500 km)
  • Haversine … výpočet vzdáleností (v kilometrech) na zemském povrchu pomocí funkce haversine.

Pak vybereme sloupce v analyzovaných datech, které reprezentují souřadnice bodu (nejprve pro x-ovou souřadnici, následně pro y-ovou).

Konečně je třeba zadat cestu k souboru s vektorovou definicí bodů (resp. hranic oblastí) a jejich názvy. Pro snazší vyhledání souboru můžeme použít tlačítko Browse.

Po stisku tlačítka Ok se objeví záložka s detaily o databázovém sloupci. Oproti sloupcům existujících přímo v databázi obsahuje tato i souřadnice a název souboru, ze kterých jsou hodnoty v odvozeném sloupci vypočteny. Zadání odvozeného sloupce je možné upravovat po stisku tlačítka Edit. Funkčnost záložky i další zacházení s odvozenými sloupci je však zcela shodné jako v případě původních databázových sloupců.

V seznamu sloupců databázové tabulky bude odvozený sloupec označen typem Geo.

Soubor s vektorovou definicí bodů, resp. hranic oblastí

V současné době jsou pro definici bodů/hranic oblastí podporovány pouze soubory ve formátu KML.

V případě relací „Vzdálenost k nejbližšímu bodu“ a „Název nejbližšího bodu“ musí být v souboru nadefinován alespoň jeden pojmenovaný bod. Obvykle však bude bodů více.

V případě relace „Bod v oblasti“ musí být v souboru nadefinován alespoň jeden pojmenovaný polygon představující hranice oblasti. Obvykle však bude polygonů více. V případě, že se polygony budou překrývat (nebo budou uvnitř jiného), bude vrácen název prvního z polygonů, do kterého bod patří.

Volba datového typu

Datový typ odvozeného sloupce je automaticky nastaven na Text, protože se vrací název oblasti.


Související témata:

Odvozené hodnoty
Záložka s detaily o tabulce
Zobrazení hodnot v tabulce

Praktická ukázka: Demo Hotel: Výpočet odvozených hodnot

lmexplore/columngeo.txt · Poslední úprava: 2017/01/22 14:15 autor: msi