Eksploracja danych geoprzestrzennych

Klasyfikacja nienadzorowana

Author

Krzysztof Dyba

  1. Materiały: https://kadyb.github.io/GEOINF2022/Grupowanie.html
  2. Dane: https://zenodo.org/records/7299645

Wprowadzenie

Zadanie

  • Dokonaj klasyfikacji nienadzorowanej danych rastrowych znajdujących się w katalogu dane (w repozytorium GitHub) używając metody k-means na podstawie losowej próby. Pamiętaj, że ta metoda jest wrażliwa na skalę zmiennych wejściowych.
  • Zweryfikuj otrzymane wyniki za pomocą wskaźnika silhouette.
  • Sprawdź jak zmieni się wynik dla innej liczby klastrów.
  • Przetestuj inną metodę klasteryzacji, np. Gaussian mixture models.
  • Zaprezentuj wynik klasteryzacji na mapie i dobierz odpowiedni schemat kolorów.
  • Spróbuj zinterpretować, co przedstawiają wydzielone klastry wykorzystując wykres pudełkowy. Spróbuj również nazwać powstałe klastry.
  • Otrzymane wyniki i wnioski przedstaw w formie raportu (Quarto lub Markdown).