Q:
Bagaimana lingkungan gudang data yang ada memiliki skala terbaik untuk memenuhi kebutuhan analitik data besar?
SEBUAH:Proyek gudang data individual perlu dinilai berdasarkan kasus per kasus. Secara umum, dalam mencoba memperluas desain data warehouse yang ada untuk menangani analitik data besar dengan lebih baik, ada proses inti untuk mencari tahu apa yang perlu dilakukan. Profesional TI dapat menyebutnya "peningkatan" atau "peningkatan".
Webinar: Big Iron, Bertemu Big Data: Membebaskan Data Mainframe dengan Hadoop & Spark Daftar disini |
Peningkatan skala umumnya melibatkan upaya mendapatkan kekuatan pemrosesan yang cukup, mendapatkan memori yang cukup, dan mengakomodasi aktivitas server yang lebih kuat untuk menangani semua set data yang lebih besar yang akan diproses oleh bisnis. Sebaliknya, scaling out dapat berarti mengumpulkan kelompok perangkat keras server dan membuat jaringan mereka bersama-sama untuk mengumpulkan data besar.
Beberapa pakar TI telah menyarankan bahwa metode yang lebih umum dengan Apache Hadoop dan platform dan alat data besar populer lainnya adalah meningkatkan skala dan mengelompokkan perangkat keras untuk mencapai efek yang diinginkan. Namun, yang lain menunjukkan bahwa dengan teknologi saat ini, gudang data dapat ditingkatkan menggunakan strategi pengadaan yang menambahkan sumber daya ke server, seperti dengan mendapatkan jumlah core pemrosesan yang lebih tinggi bersama dengan jumlah RAM yang lebih besar.
Apakah mereka memperbesar atau memperkecil, gudang data membutuhkan aset perangkat keras fisik tambahan untuk dapat menangani beban kerja data yang lebih besar. Mereka juga membutuhkan administrasi manusia tambahan, yang berarti lebih banyak pelatihan untuk tim internal. Banyak perencanaan perlu dimasukkan ke dalam proyek untuk menentukan jenis tekanan dan tekanan seperti apa beban kerja data yang lebih besar pada sistem warisan yang ada untuk menyesuaikannya dengan ekosistem data besar baru. Salah satu masalah besar adalah kemacetan penyimpanan, yang membutuhkan peningkatan ke pusat penyimpanan, dan jenis kemacetan kinerja lainnya yang dapat membuat pincang sistem yang baru lahir jika tidak ditangani.