Rumah In-The-News Mengapa pemilihan fitur sangat penting dalam pembelajaran mesin?

Mengapa pemilihan fitur sangat penting dalam pembelajaran mesin?

Anonim

Q:

Mengapa pemilihan fitur sangat penting dalam pembelajaran mesin?

SEBUAH:

Pemilihan fitur sangat penting dalam pembelajaran mesin terutama karena berfungsi sebagai teknik dasar untuk mengarahkan penggunaan variabel ke apa yang paling efisien dan efektif untuk sistem pembelajaran mesin yang diberikan.

Para ahli berbicara tentang bagaimana pemilihan fitur dan ekstraksi fitur berfungsi untuk meminimalkan kutukan dimensi atau membantu mengatasi overfitting - ini adalah cara yang berbeda untuk mengatasi gagasan pemodelan yang terlalu rumit.

Unduh Gratis: Pembelajaran Mesin dan Mengapa Itu Penting

Cara lain untuk mengatakan ini adalah bahwa pemilihan fitur membantu memberi pengembang alat untuk menggunakan hanya data yang paling relevan dan berguna dalam set pelatihan pembelajaran mesin, yang secara dramatis mengurangi biaya dan volume data.

Salah satu contoh adalah gagasan untuk mengukur bentuk kompleks pada skala. Seiring dengan skala program, program ini mengidentifikasi lebih banyak titik data dan sistem menjadi jauh lebih kompleks. Tetapi bentuk yang kompleks bukanlah kumpulan data khas yang digunakan sistem pembelajaran mesin. Sistem ini dapat menggunakan set data yang memiliki tingkat varians yang sangat berbeda antara variabel yang berbeda. Misalnya, dalam mengklasifikasikan spesies, insinyur dapat menggunakan pemilihan fitur untuk hanya mempelajari variabel yang akan memberi mereka hasil yang paling bertarget. Jika setiap hewan dalam grafik memiliki jumlah mata atau kaki yang sama, data tersebut dapat dihapus, atau titik data lain yang lebih relevan dapat diekstraksi.

Pemilihan fitur adalah proses yang membedakan di mana para insinyur mengarahkan sistem pembelajaran mesin ke sasaran. Selain gagasan menghilangkan kompleksitas dari sistem pada skala, pemilihan fitur juga dapat berguna dalam mengoptimalkan aspek dari apa yang para ahli sebut "trade-off varians varians" dalam pembelajaran mesin.

Alasan mengapa pemilihan fitur membantu dengan bias dan analisis varian lebih rumit. Sebuah studi dari Cornell University tentang pemilihan fitur, varians bias dan bagging berfungsi untuk menggambarkan bagaimana pemilihan fitur membantu proyek.

Menurut penulis, makalah ini "meneliti mekanisme di mana pemilihan fitur meningkatkan akurasi pembelajaran yang diawasi."

Penelitian lebih lanjut menyatakan:

Analisis bias / varians empiris ketika pemilihan fitur berlangsung menunjukkan bahwa set fitur yang paling akurat sesuai dengan titik tradeoff varians-varians terbaik untuk algoritma pembelajaran.

Dalam membahas penggunaan relevansi kuat atau lemah, penulis berbicara tentang pemilihan fitur sebagai "metode pengurangan varians" - ini masuk akal ketika Anda menganggap varians pada dasarnya jumlah variasi dalam variabel yang diberikan. Jika tidak ada varian, titik data atau array pada dasarnya tidak berguna. Jika ada varian yang sangat tinggi, itu mungkin berubah menjadi apa yang insinyur mungkin anggap sebagai "kebisingan" atau hasil yang sewenang-wenang yang tidak dapat dikelola oleh sistem pembelajaran mesin.

Dalam terang ini, pemilihan fitur adalah bagian mendasar dari desain dalam pembelajaran mesin.

Mengapa pemilihan fitur sangat penting dalam pembelajaran mesin?