Rumah Tren Mengapa anotasi data penting dalam beberapa proyek pembelajaran mesin?

Mengapa anotasi data penting dalam beberapa proyek pembelajaran mesin?

Anonim

Q:

Mengapa anotasi data penting dalam beberapa proyek pembelajaran mesin?

SEBUAH:

Anotasi data penting dalam pembelajaran mesin karena dalam banyak kasus, ini membuat pekerjaan program pembelajaran mesin lebih mudah.

Ini ada hubungannya dengan perbedaan antara pembelajaran mesin yang diawasi dan tidak diawasi. Dengan pembelajaran mesin yang diawasi, data pelatihan sudah diberi label sehingga mesin dapat memahami lebih banyak tentang hasil yang diinginkan. Misalnya, jika tujuan program adalah untuk mengidentifikasi kucing dalam gambar, sistem sudah memiliki sejumlah besar foto yang ditandai sebagai kucing atau tidak. Kemudian menggunakan contoh-contoh itu untuk membandingkan data baru untuk membuat hasilnya.

Unduh Gratis: Pembelajaran Mesin dan Mengapa Itu Penting

Dengan pembelajaran mesin tanpa pengawasan, tidak ada label, sehingga sistem harus menggunakan atribut dan teknik lain untuk mengidentifikasi kucing. Insinyur dapat melatih program untuk mengenali fitur visual kucing seperti kumis atau ekor, tetapi prosesnya tidak pernah semudah seperti dalam pembelajaran mesin yang diawasi di mana label-label itu memainkan peran yang sangat penting.

Anotasi data adalah proses menempelkan label ke set data pelatihan. Ini dapat diterapkan dengan berbagai cara - di atas kita berbicara tentang anotasi data biner - kucing atau bukan kucing - tetapi jenis anotasi data lainnya juga penting. Misalnya, di bidang medis, anotasi data mungkin melibatkan penandaan gambar biologis spesifik dengan tag yang mengidentifikasi patologi atau penanda penyakit untuk sifat medis lainnya.

Anotasi data membutuhkan kerja - dan sering dilakukan oleh tim orang - tetapi ini merupakan bagian mendasar dari apa yang membuat banyak proyek pembelajaran mesin berfungsi secara akurat. Ini memberikan pengaturan awal untuk mengajarkan suatu program apa yang perlu dipelajari dan bagaimana membedakan berbagai input untuk menghasilkan output yang akurat.

Mengapa anotasi data penting dalam beberapa proyek pembelajaran mesin?