Daftar Isi:
Definisi - Apa yang dimaksud Cross-Validation?
Validasi silang adalah teknik yang digunakan untuk penilaian tentang bagaimana hasil analisis statistik digeneralisasikan ke kumpulan data independen. Validasi silang sebagian besar digunakan dalam pengaturan di mana target adalah prediksi dan perlu untuk memperkirakan keakuratan kinerja model prediksi. Alasan utama untuk menggunakan validasi silang daripada validasi konvensional adalah bahwa tidak ada cukup data yang tersedia untuk mempartisi mereka menjadi pelatihan dan set tes terpisah (seperti dalam validasi konvensional). Hal ini menyebabkan hilangnya kemampuan pengujian dan pemodelan.
Validasi silang juga dikenal sebagai estimasi rotasi.
Techopedia menjelaskan Validasi Lintas
Untuk masalah prediksi, suatu model umumnya dilengkapi dengan kumpulan data dari data yang diketahui, yang disebut kumpulan data pelatihan, dan satu set data yang tidak diketahui yang digunakan untuk menguji model tersebut, yang dikenal sebagai kumpulan data uji. Sasarannya adalah memiliki set data untuk menguji model dalam fase pelatihan dan kemudian memberikan wawasan tentang bagaimana model spesifik beradaptasi dengan set data independen. Putaran validasi silang terdiri dari partisi data menjadi himpunan bagian yang saling melengkapi, kemudian melakukan analisis pada satu subset. Setelah ini, analisis divalidasi pada himpunan bagian lainnya (set pengujian). Untuk mengurangi variabilitas, banyak putaran validasi silang dilakukan menggunakan banyak partisi berbeda dan kemudian rata-rata hasilnya diambil. Validasi silang adalah teknik yang kuat dalam estimasi teknik kinerja model.
