Presentasi yang menarik oleh Kate Crawford, peneliti utama di Microsoft Research, di Konferensi Strata 2013 melihat lebih dekat pada data besar dan apa artinya, mengeksplorasi beberapa dari apa yang Crawford sebut "ilusi algoritmik" dan keterbatasan solusi data skala besar yang sedang dianut di banyak bagian dunia bisnis.
Menggunakan analogi mendasar terhadap ilusi optik yang melibatkan kucing berputar, Crawford menyatakan bahwa meskipun data besar penting bagi banyak aplikasi bisnis, ada lebih dari satu cara untuk menginterpretasikan banyak hasil kumpulan data yang mungkin tampak objektif bagi pembuat keputusan manusia. .
"Segala sesuatu dapat dilihat secara berbeda, " kata Crawford, mengutip sebuah makalah di mana dia dan rekan penulisnya David Boyd merenungkan beberapa prinsip utama penggunaan data besar, termasuk apa yang disebut Crawford sebagai "mitologi, " atau keyakinan bahwa data besar membawa kebenaran absolut dan objektivisme terhadap suatu proyek. Para pemimpin, katanya, sering secara langsung mengaitkan data besar dengan pandangan mata burung yang objektif, sambil mengabaikan apa yang disebutnya tiga batasan atau pertimbangan mendasar yang dapat memengaruhi objektivitas ini dalam cara-cara utama: bias, sinyal, dan skala.
Dimulai dengan bias, Crawford menggunakan contoh banjir di Australia dan Amerika Serikat untuk menunjukkan bahwa data besar tidak selalu cocok dengan kenyataan di jalanan. Dia mengaitkan prinsip kedua, sinyal, yang menggambarkan lebih jauh bagaimana set data dapat mencerminkan aktualitas tersembunyi yang dapat memengaruhi hasil. Sebagai salah satu contoh, Crawford mengutip berbagai jenis peta dunia yang telah dikembangkan dalam upaya untuk menunjukkan pandangan objektif tentang ukuran relatif dari benua dan negara.
"Peta tidak netral, " kata Crawford. "Kami membuat pilihan setiap kali kami memutuskan untuk mewakili data kami."
Untuk lebih mengilustrasikan prinsip tersebut, Crawford menggunakan contoh aplikasi yang melaporkan lubang di Boston kepada pejabat kota, menunjukkan bahwa aplikasi semacam ini yang berfungsi pada ponsel cerdas dan perangkat seluler dapat berakhir membuat laporan keseluruhan sangat mirip peta sensus yang menunjukkan usia relatif. dan pendapatan di seluruh kota atau kota.
"Kami menghadapi risiko semakin mengakar jenis ketidakadilan sosial tertentu, " kata Crawford, menunjuk kepada mereka yang mungkin ditinggalkan dari kumpulan data besar yang diberikan karena perbedaan dalam penggunaan teknologi.
"Apa yang terjadi jika kamu hidup dalam bayang-bayang kumpulan data besar?" dia berkata.
Selain itu, Crawford juga berbicara tentang penelitian dari tahun lalu yang mempertanyakan apakah informasi tingkat tinggi selalu mewakili lebih banyak data granular dan apakah "panorama objektif" selalu berfungsi sebagai representasi yang lebih akurat daripada data dalam skala yang lebih kecil. Crawford juga meminta pendengar untuk berpikir tidak hanya tentang data besar, tetapi tentang "data dengan kedalaman." Dengan ini, yang ia maksudkan adalah data yang benar-benar memandu pembaca menuju realitas objektif, alih-alih menutupi detail dengan pendekatan yang lebih global yang, meskipun lebih mudah dipahami, dapat mengabaikan elemen-elemen kunci dari apa yang sebenarnya ada.