Daftar Isi:
- Mitos: Semua orang di depan kita dalam mengadopsi data besar.
- Mitos: Kami memiliki begitu banyak data; kita tidak perlu khawatir tentang setiap kekurangan data kecil.
- Mitos: Teknologi big data akan menghilangkan kebutuhan akan integrasi data.
- Mitos: Menggunakan gudang data untuk analitik lanjut tidak ada gunanya.
- Mitos: Danau data akan menggantikan gudang data.
- Big Data Bekerja - Metode Manipulasi Data Baru Mungkin Tidak
Kembali pada Mei 2014, Forrester Research mengeluarkan dua laporan yang menarik kesimpulan tertentu tentang hype seputar data besar. Perusahaan riset itu mensurvei lebih dari 250 eksekutif pemasaran dan pengembangan bisnis. Menurut penulis laporan itu, retorika data besar selalu ada, dan vendor teknologi menggembar-gemborkan produk dengan apa yang tampak sebagai klaim luar biasa.
Gartner setuju dengan Forrester Research; sensasi besar mengelilingi data besar. Dalam laporan September 2014, Gartner membantah lima mitos data terbesar, dan analis Gartner menawarkan pendapat mereka tentang apa yang disalahpahami tentang data besar dan manipulasinya. Jadi, apa mitos terbesar big data? Mari kita lihat.
Mitos: Semua orang di depan kita dalam mengadopsi data besar.
Gartner mengatakan minat terhadap data besar berada pada titik tertinggi sepanjang masa. Meskipun demikian, 13 persen dari mereka yang disurvei memiliki sistem kerja. Alasannya: sebagian besar perusahaan belum mengetahui cara menambang nilai apa pun dari repositori data yang besar. Di sini, survei Gartner lebih optimis daripada laporan Forrester, yang menemukan bahwa hanya 9 persen dari peserta survei mengatakan mereka berencana untuk menerapkan teknologi data besar selama tahun depan. (Data besar memiliki banyak hal untuk ditawarkan. Pelajari selengkapnya dalam 5 Masalah Dunia Nyata, Data Besar Dapat Dipecahkan.)Mitos: Kami memiliki begitu banyak data; kita tidak perlu khawatir tentang setiap kekurangan data kecil.
Gartner khawatir tentang kelemahan manusia yang kita miliki: "Kita memiliki begitu banyak, sedikit hal buruk itu tidak masalah." Ted Friedman, wakil presiden dan analis terkemuka di Gartner percaya bahwa ini adalah cara yang salah untuk melihat situasi.
"Pada kenyataannya, meskipun setiap cacat individu memiliki dampak yang jauh lebih kecil pada seluruh dataset daripada ketika ada lebih sedikit data, ada lebih banyak kekurangan dari sebelumnya karena ada lebih banyak data, " kata Friedman. "Karena itu, dampak keseluruhan dari data berkualitas buruk pada seluruh dataset tetap sama."
Friedman menambahkan alasan lain untuk prihatin. Pengambilan data besar sering kali menyertakan data dari luar bisnis, yang karenanya tidak diketahui struktur dan asalnya. Ini meningkatkan potensi kesalahan.
Mitos: Teknologi big data akan menghilangkan kebutuhan akan integrasi data.
Ada dua strategi analisis data utama yang dapat diterapkan pada data besar: "skema tulis" atau "skema baca." Sampai saat ini, skema penulisan adalah satu-satunya metode yang digunakan. Skema saat dibaca adalah kegemaran saat ini dalam manajemen basis data. Tidak seperti schema on write, yang membutuhkan format terstruktur, data dimuat ke dalam database schema-on-read dalam format mentah. Kemudian pengembang - menggunakan platform basis data yang tidak terstruktur seperti Hadoop - menekuk data yang berbeda menjadi format yang dapat digunakan. Skema baca memiliki keuntungan yang jelas, tetapi, seperti yang disebutkan Gartner, integrasi data harus terjadi di beberapa titik.Mitos: Menggunakan gudang data untuk analitik lanjut tidak ada gunanya.
Menghabiskan waktu untuk membuat data warehouse tampaknya tidak ada gunanya bagi banyak manajer informasi, terutama ketika data yang baru diambil berbeda dari yang ada di data warehouse. Namun, Gartner sekali lagi memperingatkan bahkan analitik data tingkat lanjut akan menggunakan gudang data dan data baru, yang berarti integrator data harus:- Saring tipe data baru agar cocok untuk analisis
- Putuskan data mana yang relevan, dan tingkat kualitas data yang dibutuhkan
- Tentukan bagaimana cara mengumpulkan data
- Memahami bahwa penyempurnaan data dapat terjadi di tempat selain dari gudang data
Mitos: Danau data akan menggantikan gudang data.
Danau data adalah gudang data yang berbeda, berbeda dengan gudang data di mana data berada dalam format terstruktur. Membuat danau data membutuhkan sedikit usaha di muka (tidak perlu memformat data) dibandingkan dengan gudang data, itulah sebabnya danau data menjadi hal yang menarik.
Gartner menekankan bahwa memiliki data bukan itu intinya - bisa memanipulasi data yang diambil untuk pengambilan keputusan yang tepat adalah intinya. Selain itu, menggunakan (agak tidak terbukti) danau data untuk memfasilitasi pengambilan keputusan adalah masalah.
"Gudang data sudah memiliki kemampuan untuk mendukung beragam pengguna di seluruh organisasi, " kata Nick Heudecker, direktur penelitian di Gartner. "Pemimpin manajemen informasi tidak perlu menunggu data danau untuk menyusul." (Pelajari lebih lanjut tentang mengadopsi data besar dalam 7 Hal yang Harus Anda Ketahui Tentang Data Besar Sebelum Diadopsi.)
Big Data Bekerja - Metode Manipulasi Data Baru Mungkin Tidak
Alasan Gartner mengatakan "mitos data terbesar" bukannya "mitos data besar" menjadi jelas setelah membaca laporan. Gartner tidak curiga dengan data besar. Gartner mencurigai mereka yang merasa metode baru memanipulasi data besar siap untuk "prime time."