Rumah Database Menggunakan algoritma untuk memprediksi pemilihan: obrolan dengan drew linzer

Menggunakan algoritma untuk memprediksi pemilihan: obrolan dengan drew linzer

Anonim

Drew akan hadir pada KTT Inovasi Data Besar, 30 & 31 Januari di Las Vegas: http://analytics.theiegroup.com/bigdata-lasvegas, bersama pembicara dari Obama untuk Amerika, Best Buy, LinkedIn, The New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs dan banyak lagi.


Tautan Registrasi: http://bit.ly/Zs3wms


Wawancara ini dilakukan oleh George Hill dan diterbitkan di Big Inovation Magazine.


Reaksi macam apa yang ada pada prediksi Anda?


Sebagian besar reaksi berfokus pada perbedaan akurasi antara kita yang mempelajari jajak pendapat publik, dan prediksi "firasat" prediksi para pakar dan komentator populer. Pada Hari Pemilu, analis data seperti saya, Nate Silver (blog New York Times FiveThirtyEight), Simon Jackman (Stanford University dan Huffington Post), dan Sam Wang (Konsorsium Pemilu Princeton) semuanya menempatkan peluang terpilihnya kembali Obama lebih dari 90%, dan meramalkan dengan benar 332 suara pemilihan untuk Obama sebagai hasil yang paling mungkin. Sementara itu, para pakar seperti Karl Rove, George Will, dan Steve Forbes mengatakan Romney akan menang - dan dalam beberapa kasus, dengan mudah. Hal ini menyebabkan pembicaraan tentang "kemenangan untuk pertanyaan" yang saya harap akan dibawa ke pemilihan mendatang.


Bagaimana Anda mengevaluasi algoritma yang digunakan dalam prediksi Anda?


Model perkiraan saya memperkirakan hasil pemilihan suara negara bagian dan pemilihan final, pada setiap hari kampanye, dimulai pada bulan Juni. Saya ingin penilaian ramalan ini seadil dan seobyektif mungkin - dan tidak meninggalkan ruang gerak jika salah. Jadi, sekitar satu bulan sebelum pemilihan, saya memasang delapan kriteria evaluasi yang akan saya gunakan di situs web saya begitu hasilnya diketahui. Ternyata, modelnya bekerja dengan sempurna. Itu meramalkan selama musim panas bahwa Obama akan memenangkan semua negara bagian 2008-nya minus Indiana dan North Carolina, dan hampir tidak beranjak dari prediksi itu bahkan setelah dukungan untuk Obama naik tipis pada bulan September, kemudian turun setelah debat presiden pertama.


Jumlah data yang digunakan di seluruh kampanye ini baik oleh analis independen dan tim kampanye sangat besar, implikasi seperti apa yang ada pada penggunaan data pada tahun 2016?


Kampanye 2012 membuktikan bahwa berbagai sumber informasi kuantitatif yang beragam dapat dikelola, dipercaya, dan diterapkan dengan sukses untuk berbagai tujuan. Kami orang luar dapat memprediksi hasil pemilu jauh sebelumnya. Di dalam kampanye, ada langkah besar yang dibuat dalam penargetan pemilih, pelacakan pendapat, penggalangan dana, dan partisipasi pemilih. Sekarang kita tahu metode ini dapat bekerja, saya pikir tidak ada jalan untuk kembali. Saya berharap wartawan dan komentator kampanye untuk mengambil agregasi survei jauh lebih serius pada 2016. Dan meskipun Obama dan Demokrat saat ini tampaknya memiliki keunggulan dalam teknologi kampanye, saya akan terkejut jika Republik tidak cepat mengejar ketinggalan.


Apakah Anda berpikir bahwa keberhasilan kampanye yang didorong oleh data ini berarti bahwa manajer kampanye sekarang perlu menjadi analis sekaligus ahli strategi?


Manajer kampanye mungkin tidak perlu menjadi analis sendiri, tetapi mereka harus memiliki apresiasi yang lebih besar untuk bagaimana data dan teknologi dapat dimanfaatkan untuk keuntungan mereka. Kampanye selalu menggunakan penelitian survei untuk merumuskan strategi dan mengukur sentimen pemilih. Tetapi sekarang ada sejumlah alat kuat lainnya yang tersedia: situs web jejaring sosial, basis data pemilih, ponsel cerdas, dan pemasaran email, untuk menyebutkan beberapa saja. Dan itu merupakan tambahan terhadap kemajuan terbaru dalam metodologi pemungutan suara dan pemodelan opini statistik. Ada banyak inovasi yang terjadi dalam politik kampanye Amerika saat ini.


Anda berhasil memprediksi hasil pemilihan 6 bulan sebelumnya, menurut Anda apa kerangka waktu maksimum yang realistis untuk memprediksi hasil secara akurat menggunakan teknik analisis Anda?


Sekitar empat atau lima bulan adalah sejauh ilmu pengetahuan memungkinkan kita pergi sekarang; dan itu bahkan mendorongnya sedikit. Sebelum itu, jajak pendapat tidak cukup informatif tentang hasil akhirnya: terlalu banyak orang yang ragu-ragu atau belum mulai memperhatikan kampanye. Faktor-faktor ekonomi dan politik historis yang telah terbukti berkorelasi dengan hasil pemilu juga mulai kehilangan kekuatan prediktifnya begitu kita melampaui kisaran kira-kira 4-5 bulan. Untungnya, itu masih memberi banyak kampanye waktu untuk merencanakan strategi dan membuat keputusan tentang bagaimana mengalokasikan sumber daya mereka.

Menggunakan algoritma untuk memprediksi pemilihan: obrolan dengan drew linzer