CV10 – Explorační analýza dat, deterministické interpolační metody

Metodický návod pro ArcGIS Pro 3.x (Spatial Analyst, případně Geostatistical Analyst)


Obsah

  1. Cíle cvičení
  2. Teoretický základ
  3. Vstupní data a předpoklady
  4. Postup v ArcGIS Pro
  5. Doporučené nastavení prostředí a souřadnic
  6. Výstupy k odevzdání
  7. Časté chyby a kontrolní seznam

Cíle cvičení


Teoretický základ

Explorační analýza dat (EDA)

Základní kroky v kontextu GIS:

Typické EDA nástroje:

Deterministické interpolační metody

1) IDW – Inverse Distance Weighting
Princip: interpolovaná hodnota je váženým průměrem vzorků; váha = 1 / vzdálenost^p, kde p je exponent (power).
Vlastnosti:

2) Spline (Regularized, Tension)
Princip: hladký povrch procházející všemi body s minimalizací zakřivení.

3) Natural Neighbor
Princip: využívá Voronoiho diagram; váhy odvozené z plochy překryvu.
Vlastnosti:


Vstupní data a předpoklady

Poznámka k datům: teplota je v Kelvinech. Převod na stupně Celsia: °C = K − 273.15.


Postup v ArcGIS Pro

Import netCDF a výběr dat pro prosinec 2014

  1. Vytvoř projekt typu Map.
  2. Přidej netCDF: Catalog → Folders → Add → mean2014_2023.nc.
  3. Panel Multidimensional:
    • V části Current Slice nastav datum na 2014-12-01 (prosinec 2014).
    • Zkontroluj, že proměnná odpovídá průměrné teplotě.
  4. V Multidimensional → Data Management → Subset:
    • Vyber proměnnou a časovou dimenzi.
    • Zadej konkrétní datum 2014-12-01.
    • Výstup: temp_2014_12_01.crf (jednorozměrný raster pro prosinec 2014).

Volitelně: příprava i ledna 2014

Potřebuješ-li z téhož netCDF odečíst hodnoty pro leden 2014:

  1. Změň v Multidimensional datum na 2014-01-01.
  2. Opět použij Subset → výstup temp_2014_01_01.crf.

Generování 100 náhodných bodů na území ČR

  1. Přidej polygon hranice ČR (např. vrstvy administrativního členění).
  2. Nástroj Create Random Points
    Data Management Tools → Feature Class → Create Random Points
    • Constraining Feature Class: hranice ČR
    • Number of Points: 100
    • Output: rand_points_100.gdb/rand_points_100
  3. Zkontroluj rozmístění bodů. V případě potřeby vyluč oblasti bez dat (masky).

Odečet hodnot do bodů a převod K→°C

  1. Extract Values to Points
    Spatial Analyst Tools → Extraction → Extract Values to Points
    • Input point features: rand_points_100
    • Input raster: temp_2014_01_01.crf (pokud cvičení vyžaduje leden; jinak použij prosinec)
    • Output: rand_points_100_temp
    • Zatrhni „Interpolate values“ pro sub-pixel přesnost, je-li vhodné.
  2. Otevři atributovou tabulku výsledných bodů.
  3. Přidej pole Temp_C (Double).
  4. Field Calculator pro převod Kelvin→Celsius: !RASTERVALU! - 273.15 kde RASTERVALU je název pole s odečtenou hodnotou.

EDA v ArcGIS Pro: statistiky a grafy

  1. Deskriptivní statistiky:
    • V atributové tabulce klikni na záhlaví pole Temp_CStatistics.
    • Zapiš: count, mean, median, std, min, max, percentiles.
    • Identifikuj outliers (porovnej min/max s očekávanými hodnotami).
  2. Grafy:
    • Pravým klikem na vrstvu rand_points_100_tempCreate Chart:
      • Histogram pro Temp_C (zkontroluj unimodalitu, šířku tříd).
      • Box Plot pro Temp_C (outliers, kvartily).
      • Scatter Plot (např. Temp_C vs. nadmořská výška, pokud máš Z).
  3. Prostorová vizualizace:
    • Symbolika body podle Temp_C (graduated colors, kvantily).
    • Heatmapa pro vizuální trend (Map → Symbology → Heat Map).

Interpolace: IDW, Spline, Natural Neighbor

Než spustíš interpolace, nastav jednotné prostředí (Extent, Cell Size, Mask) – viz kapitola Doporučené nastavení prostředí a souřadnic.

IDW

Spatial Analyst Tools → Interpolation → IDW

Doporučené parametry k testování:

Interpretace:

Spline

Spatial Analyst Tools → Interpolation → Spline

Varianty a parametry:

Interpretace:

Natural Neighbor

Spatial Analyst Tools → Interpolation → Natural Neighbor

Parametry:

Interpretace:

Hodnocení přesnosti: cross-validation, RMSE, MAE

Možnosti:

1) Geostatistical Wizard (pokročilé, pohodlné)

2) Manuální křížová validace

Vzorce: RMSE = sqrt( (1/n) * Σ (obs_i - pred_i)^2 ) MAE = (1/n) * Σ |obs_i - pred_i| ME = (1/n) * Σ (obs_i - pred_i) # mean error (bias)

V ArcGIS Pro lze souhrnné metriky získat nástrojem Summary Statistics:


Doporučené nastavení prostředí a souřadnic

Aby byly výsledky metod porovnatelné, sjednoť následující:


Výstupy k odevzdání

  1. Raster pro prosinec 2014: temp_2014_12_01.crf (nebo export .tif).
  2. Body s odečtenými hodnotami: rand_points_100_temp s polem Temp_C.
  3. EDA:
    • screenshot Statistics z pole Temp_C,
    • grafy: histogram, box plot, případně scatter plot.
  4. Interpolace:
    • idw_*.tif, spline_*.tif, natneigh_*.tif (uveď parametry).
    • mapové kompozice s jednotnou legendou a měřítkem.
  5. Hodnocení přesnosti:
    • Report z Geostatistical Wizard (IDW) s cross-validation,
    • tabulka metrik: RMSE, MAE, ME pro vybrané konfigurace.
  6. Krátká interpretace:
    • Která metoda a jaké parametry vychází nejlépe a proč?
    • Jak rozložení bodů a volba projekce ovlivnily výsledek?

Časté chyby a kontrolní seznam

Kontrola před spuštěním:

Během EDA:

Interpolace:

Validace:

Prezentace: