Geo-GIS

Neural Network Untuk Klasifikasi Citra Menggunakan Tensorflow di Python Bagian 1

Deep Learning telah digunakan pada sebagian besar bidang dalam memecahkan masalah yang kompleks, dan bidang geospasial tidak terkecuali. Sedikit pengetahuan tentang bagaimana algoritma Machine Learning (ML) bekerja akan membantu Anda. Bagi mereka yang tidak terbiasa dengan konsep ML, singkatnya, itu adalah membangun hubungan antara beberapa karakteristik (obyek atau Xs) suatu entitas/obyek dengan properti lainnya (nilai atau label atau Y) – disediakan banyak contoh (data berlabel ) ke model sehingga model belajar dan kemudian memprediksi nilai / label untuk data baru (data tidak berlabel).


Masalah umum dengan data satelit:

Dua atau lebih kelas obyek (mis. wilayah terbangun /lahan kosong/ galian) dalam data satelit dapat memiliki nilai spektral yang serupa, yang menjadikan klasifikasi tugas yang menantang dalam beberapa dekade terakhir. Metode konvensional yaitu klasifikasi tersupervisi dan tidak disupervisi gagal menjadi pengklasifikasi sempurna karena masalah tersebut di atas, meskipun cukup baik dalam melakukan klasifikasi. Tapi, selalu ada masalah terkait. Mari kita pahami ini dengan contoh di bawah ini:

Pada gambar di atas, jika Anda menggunakan garis vertikal sebagai classifier dan memindahkan/menggeser hanya di sepanjang sumbu x sedemikian rupa sehingga mengklasifikasikan semua gambar di sebelah kanan sebagai rumah, jawabannya mungkin bukan dalam bentuk garis lurus. Ini karena distribusi data sedemikian rupa sehingga tidak mungkin untuk memisahkannya hanya dengan satu garis vertikal. Namun, ini tidak berarti bahwa rumah-rumah tersebut tidak dapat diklasifikasikan sama sekali.


 

Katakanlah Anda menggunakan garis merah, seperti yang ditunjukkan pada gambar di atas, untuk memisahkan dua obyek. Dalam hal ini, sebagian besar rumah bisa diidentifikasi tetapi, sebuah rumah masih ditinggalkan, dan pohon diklasifikasikan sebagai rumah. Untuk memastikan tidak ada satu rumah pun yang tertinggal, Anda dapat menggunakan garis biru, dan itu akan mencakup semua rumah; ini disebut high recall. Namun, tidak semua gambar yang diklasifikasikan benar-benar rumah, ini disebut presisi rendah. Demikian pula, jika kita menggunakan garis hijau, semua gambar yang diklasifikasikan sebagai rumah adalah rumah; oleh karena itu, klasifikasi memiliki presisi tinggi. penarikan batas/deliniasi akan sedikit lebih rendah dalam kasus ini karena tiga rumah masih diluar kelas yang seharusnya. Dalam sebagian besar kasus, pertukaran antara ketepatan dan deliniasi ini berlaku.

Masalah rumah dan pohon yang ditunjukkan di atas adalah analogi dengan kasus tanah terbangun, galian dan tanah tandus. Prioritas klasifikasi untuk data satelit dapat bervariasi sesuai tujuannya. Misalnya, jika Anda ingin memastikan bahwa semua pixel lahan terbangun dikelompokkan sebagai kelas lahan terbangun, tidak ada yang tertinggal, dan Anda tidak terlalu peduli tentang piksel kelas lain dengan ciri serupa yang diklasifikasikan sebagai lahan terbangun, maka model yang diperlukan adalah high recall/klasifikasi total. Sebaliknya, jika prioritasnya adalah untuk mengklasifikasikan piksel bawaan murni hanya tanpa menyertakan piksel kelas lainnya, dan Anda boleh melepaskan piksel bawaan campuran, maka diperlukan klasifikasi presisi tinggi. Model generik akan menggunakan garis merah pada contoh di atas untuk pengkelasan rumah dan pohon untuk menjaga keseimbangan antara presisi dan recall.