Integracja danych CRFOP

From OpenStreetMap Wiki
Jump to navigation Jump to search

Cele

Integracja danych Centralnego Rejestru Form Ochrony Przyrody z bazą danych OSM w zakresie integracji pomników przyrody

Harmonogram

Dane zostaną wprowadzone do końca 2019 roku

Dane Importowane

Linki do danych

Data source site: http://www.gdos.gov.pl/dane-i-metadane
Data license: http://crfop.gdos.gov.pl/CRFOP/faq.jsf


Dane Projektu

https://github.com/openstreetmap-polska/CRFOP.git

Typ importu

Dane w większości są danymi punktowymi. Po weryfikacji danych, by uniknąć dublowania zostaną wprowadzone przez import JOSM

Przygotowanie danych

Uproszczenie

Dane są dostępne na stronie https://www.gdos.gov.pl/dane-i-metadane w postaci spakowanego pliku SHP z podziałem na województwa. W każdej paczce są dostępne następujące warstwy danych:

  • PomnikiPrzyrodyMPoint - zawiera pkt. pomocnicze dla pozostałych obiektów, mogą to być np. inne wejścia do jaskini (tej warstwy nie integrujemy po ustaleniach z pracownikami CRFOP - mogą być tam błędy, lub zdublowane pkt. z warstwą Point)
  • PomnikiPrzyrodyPoint - zawiera pkt. z współrzędnymi pojedynczych obiektów przyrodniczych.
  • PomnikiPrzyrodyPolygon - zawiera poligony całych obszarów chronionych jak np. las


Dane dostępne są jako pkt. nie wymagają uproszczenia. Konieczna weryfikacja danych z warstw Polygon.

Tagowanie

  • ref:gid - numer z rejestru CRFOP pozwalający jednoznacznie określić obiekt
  • ref:INSPIRE - jw. dotyczy rejestru inspire
  • natural - wartość definiowana w zależności od obiektu
    • tree - dla drzewa (Uwagaǃ Zgodnie z metodologią CRFOP jałowce, cyprysiki oraz żywotniki w przypadku większych okazów są oznaczane jak drzewa, konieczna weryfikacja po gatunku)
      • leaf_type=broadleaved - dla drzew liściastych
      • leaf_type=needleleaved - dla drzew iglastych
    • shrub - dla krzaków
    • stone - dla głazów lub kamienie
    • rock - dla skał i skałek
    • spring - dla żródeł
  • name - nazwa jeśli występuje
  • species - gatunek, nazwa łacińska, jeśli występuje
  • species:pl - gatunek, nazwa polska, jeśli występuje
  • url:cfop - link do strony obiektu w rejestrze CRFOP

Dla wszystkich obiektów:

  • denotation=natural_monument
  • protected=yes

Obróbka danych informacje

Dane wymagają zmiany układu współrzędnych na WGS84

Dany warstw "Point" wymagają rozdzielenia dla poszczególnych wartości klucza natural - należy je integrować osobno.

Dane warstw "Polygon" konieczne wprowadzenie indywidualne.

Przydatne oprogramowanie

Folder "data" w repozytorium Github-a zawiera następujące plikiː

  • nazwawojewództwa ̠all.csv - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do analizy, niezawierają tagów związanych z typem listowia, dokonana korekta kwalfikowania Jałowca, Cyprysika jako drzewa.
  • nazwawojewództwa ̠tree.csv - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do konwersji na osm
  • nazwawojewództwa ̠stone.csv - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do konwersji na osm.
  • nazwawojewództwa ̠shrub.csv - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do konwersji na osm.
  • nazwawojewództwa ̠rock.csv - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do konwersji na osm.
  • nazwawojewództwa ̠spring.csv - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do konwersji na osm.
  • nazwawojewództwa ̠inne.csv - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do weryfikacji, te wartości trzeba będzie ręcznie zweryfikować. Zawiera oprócz obiektów oznaczonych jako inne również jaskinie, jary oraz wodospady.

Folder "shp" w repozytorium Github-a zawiera następujące plikiː

  • nazwawojewództwa ̠tree.csv - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do konwersji na osm (Konwersja poprzez JOSM)

Folder "osm" w repozytorium Github-a zawiera następujące plikiː

  • nazwawojewództwa ̠tree.osm - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do zweryfikowania czy niewprowadzamy zdublowanych obiektów.
  • nazwawojewództwa ̠stone.osm - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do zweryfikowania czy niewprowadzamy zdublowanych obiektów.
  • nazwawojewództwa ̠shrub.osm - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do zweryfikowania czy niewprowadzamy zdublowanych obiektów.

Procedura obróbki danych

  1. Qgis - zmiana układu współrzędnych z EPSGː2180 na EPSGː4326 - import to pliku wojewodztwa ̠ all.csv
  2. OpenRefine - edycja danych
    1. Dodanie kolumnː "protected" oraz "denotation"
    2. Zmiana nazw nagłówków
    3. Usunięcie niepotrzebnych kolumn
  3. Wprowadzenie danych do JOSM, weryfikacja już istniejących danych w OSM tab by nie zdublować importu. (Dane z CRFOP, już wprowadzone usuwamy z pliku do importu)

QA

Add your QA plan here.

See also

The email to the Imports mailing list was sent on October 2019 and can be found in the archives of the mailing list at https://lists.openstreetmap.org/pipermail/imports/2019-October/006112.html

PL forum thread (where Polish community communicates) is at https://forum.openstreetmap.org/viewtopic.php?id=66070