Daftar Isi:
Volume data besar semakin meningkat dari hari ke hari. Dari 2.500 exabytes pada 2012, big data diperkirakan akan meningkat menjadi 40.000 exabytes pada 2020. Oleh karena itu, penyimpanan data merupakan tantangan serius yang hanya dapat ditangani oleh infrastruktur cloud. Cloud telah menjadi pilihan populer terutama karena kapasitas penyimpanannya yang sangat besar dan syarat dan ketentuan penggunaannya yang tidak membebankan kewajiban apa pun pada pelanggan. Penyimpanan cloud dapat ditawarkan dalam bentuk langganan dan layanan terakhir untuk periode yang telah ditentukan. Setelah itu, tidak ada kewajiban dari pihak klien untuk memperbaruinya.
Namun, menyimpan data besar di cloud membuka tantangan keamanan baru yang tidak dapat dihadapi dengan langkah-langkah keamanan yang diadopsi untuk data statis biasa. Meskipun big data bukan konsep baru, pengumpulan dan penggunaannya mulai meningkat hanya dalam beberapa tahun terakhir. Di masa lalu, penyimpanan dan analisis data besar hanya terbatas pada perusahaan besar dan pemerintah yang mampu membeli infrastruktur yang diperlukan untuk penyimpanan data dan penambangan. Infrastruktur seperti itu adalah milik dan tidak terpapar ke jaringan umum. Namun, data besar sekarang tersedia dengan murah untuk semua jenis perusahaan melalui infrastruktur cloud publik. Akibatnya, ancaman keamanan baru dan canggih muncul dan terus berkembang biak.
Masalah Keamanan dalam Kerangka Pemrograman Terdistribusi
Kerangka kerja pemrograman terdistribusi memproses data besar dengan teknik komputasi dan penyimpanan paralel. Dalam kerangka kerja seperti itu, pemetaan yang tidak diautentikasi atau dimodifikasi - yang membagi tugas-tugas besar menjadi sub-tugas yang lebih kecil sehingga tugas-tugas tersebut dapat dikumpulkan untuk menghasilkan hasil akhir - dapat membahayakan data. Node pekerja yang salah atau dimodifikasi - yang mengambil input dari mapper untuk melaksanakan tugas - dapat membahayakan data dengan mengetuk komunikasi data antara mapper dan node pekerja lainnya. Simpul pekerja nakal juga dapat membuat salinan simpul pekerja yang sah. Fakta bahwa sangat sulit untuk mengidentifikasi pembuat peta atau node nakal dalam kerangka kerja yang sedemikian besar membuat memastikan keamanan data semakin menantang.