Daftar Isi:
- Definisi - Apa yang dimaksud dengan Data Tidak Terstruktur?
- Techopedia menjelaskan Data Tidak Terstruktur
Definisi - Apa yang dimaksud dengan Data Tidak Terstruktur?
Data tidak terstruktur mewakili data apa pun yang tidak memiliki struktur yang dapat dikenali. Ini tidak terorganisir dan mentah dan bisa non-tekstual atau tekstual. Misalnya, email adalah ilustrasi yang bagus tentang data tekstual yang tidak terstruktur. Ini termasuk waktu, tanggal, detail dan subjek penerima dan pengirim, dll., Tetapi badan email tetap tidak terstruktur. Data yang tidak terstruktur juga dapat diidentifikasi sebagai data yang terstruktur secara longgar, di mana sumber data termasuk struktur, tetapi tidak semua data dalam satu set data mengikuti struktur yang sama.
Dalam bisnis yang berpusat pada pelanggan, data yang ditemukan dalam bentuk yang tidak terstruktur dapat diperiksa untuk meningkatkan pemasaran hubungan dan manajemen hubungan pelanggan (CRM). Sebagai aplikasi media sosial, seperti Facebook dan Twitter, menjadi arus utama, pengembangan data yang tidak terstruktur cenderung lebih cepat dari kemajuan data terstruktur.
Techopedia menjelaskan Data Tidak Terstruktur
Data tidak terstruktur mengacu pada data yang mengikuti formulir yang kurang teratur daripada item seperti halaman spreadsheet, tabel database atau set data linier atau teratur lainnya. Bahkan, istilah "kumpulan data" sangat membantu karena dikaitkan dengan data yang rapi, array yang dapat diakses, tanpa konten tambahan, dan yang ditautkan atau ditandai dalam struktur tertentu.
Contoh lain dari data tekstual yang tidak terstruktur termasuk dokumen Word, presentasi PowerPoint, pesan instan, perangkat lunak kolaborasi, dokumen, buku, posting media sosial dan catatan medis. Data tidak terstruktur non-tekstual umumnya dibuat di media, seperti file audio MP3, gambar JPEG dan file video Flash, dll.
Data tidak terstruktur biasanya tidak termasuk model data yang telah ditetapkan, dan mungkin tidak cocok dengan tabel relasional. Data yang tidak terstruktur biasanya berupa teks yang berat. Namun, itu mungkin termasuk angka dan tanggal, serta fakta. Ini mengarah pada ambiguitas yang sulit diidentifikasi menggunakan program perangkat lunak konvensional.
Penyimpanan sejumlah besar data tidak terstruktur yang dihasilkan dalam suatu perusahaan, jika dikelola dengan buruk, dapat menyebabkan biaya yang lebih tinggi. Data dalam dokumen cetak atau dalam format elektronik harus dipindai agar aplikasi pencarian dapat mengurai ide, tergantung pada kata-kata yang digunakan dalam konteks tertentu. Ini dikenal sebagai pencarian perusahaan atau semantik.