Oleh Staf Techopedia, 8 Juni 2016
Takeaway: Host Eric Kavanaugh membahas inovasi dalam teknologi basis data dengan para ahli Dez Blanchfield, Robin Bloor dan Bert Scalzo.
Anda saat ini belum masuk. Silakan masuk atau daftar untuk melihat video.
Eric Kavanagh: Saudara-saudara, ini hari Rabu, di empat waktu bagian Timur. Saya di New Orleans, musim panas akan datang, itu artinya panas! Sudah waktunya untuk Teknologi Panas, ya memang, ya memang. Nama saya Eric Kavanagh, saya akan menjadi tuan rumah Anda. Saya akan menendang bola kembali ke sini untuk Hot Technologies. Topik hari ini adalah "Maju Momentum: Memindahkan Relasional Melampaui Tradisional." Saudara-saudara, kami memiliki tiga ahli basis data di telepon hari ini, jadi pertanyaan apa pun yang Anda miliki, kirim mereka yang sulit, jangan malu-malu. Kami memiliki banyak konten yang bagus untuk Anda hari ini. Ada titik tentang dirimu benar-benar, cukup tentang aku. Tentu saja, tahun ini panas. Kami berbicara tentang semua teknologi panas dalam acara ini, yang merupakan kemitraan dengan teman-teman kami dari Techopedia. Dan kita akan sampai ke dasar manajemen informasi hari ini, yang tentu saja merupakan basis datanya. Kita akan berbicara tentang bagaimana kita sampai di sini, apa yang terjadi hari ini, dan apa yang terjadi selanjutnya. Banyak hal yang sangat menarik terjadi.
Jelas kami memiliki beberapa inovasi serius dalam ruang basis data. Itu agak tenang untuk sementara waktu; jika Anda berbicara dengan beberapa analis dalam bisnis, saya akan mengatakan mungkin dari tahun seperti, 2005 hingga 2009 atau '10, sepertinya tidak ada yang terlalu banyak dalam hal inovasi. Dan tiba-tiba saja pecah, seperti jailbreak atau semacamnya, dan sekarang ada semua hal menarik terjadi. Banyak dari itu karena skala web, dan semua properti web keren yang melakukan hal-hal menarik yang berbeda. Di situlah konsep NoSQL berasal. Dan itu berarti dua hal yang berbeda: itu berarti tidak ada SQL, karena di dalamnya tidak mendukung SQL, itu juga berarti tidak hanya SQL. Ada istilah "NewSQL" yang digunakan beberapa orang. Tapi yang jelas, SQL's - the Structured Query Language - benar-benar fondasinya, itu adalah dasar dari pencarian.
Dan sangat menarik bahwa semua mesin NoSQL ini, apa yang terjadi? Ya, mereka keluar, ada banyak kegembiraan tentang hal itu, dan kemudian beberapa tahun kemudian, apa yang kita semua mulai dengar? Oh, SQL di Hadoop. Nah, semua perusahaan ini mulai menampar antarmuka SQL ke alat NoSQL mereka, dan siapa pun yang ada di dunia pemrograman tahu bahwa itu akan mengarah pada beberapa tantangan dan beberapa kesulitan, dan beberapa kabel yang bersilangan dan sebagainya. Jadi kita akan mencari tahu tentang banyak hal hari ini.
Ada tiga presenter kami: kami menerima panggilan Dez Blanchfield dari Sydney, Robin Bloor kami sendiri yang ada di Texas, dan begitu juga Bert Scalzo, ia ada di Texas juga. Jadi, pertama-tama kita akan mendengar dari Dez Blanchfield. Teman-teman, kami akan tweet di tagar #HotTech, jadi kirimkan komentar Anda, atau kirim pertanyaan Anda melalui komponen T&J pada konsol webcast, atau bahkan melalui jendela obrolan. Dan dengan itu, Dez Blanchfield, bawa pergi.
Dez Blanchfield: Terima kasih, Eric. Halo semuanya. Jadi saya akan mencoba dan mengatur pemandangan pada sudut pandang 30.000 kaki tentang apa yang terjadi dalam dekade terakhir, dan perubahan signifikan yang telah kita lihat - atau setidaknya satu setengah dekade - dari sistem manajemen basis data, dan beberapa dampak dari sudut pandang komersial atau teknis, dan beberapa tren yang kita alami belakangan ini, dan membawa kita ke dalam percakapan yang akan kita bahas hari ini di seputar topik.
Gambar sampul saya di sini adalah gundukan pasir, dan ada angin yang meniupkan sedikit pasir dari atasnya. Dan sebagai akibatnya, yang terjadi adalah gundukan pasir perlahan berjalan dari satu ruang ke ruang lain. Dan ini adalah fenomena yang luar biasa, di mana gunung pasir raksasa setinggi 40 dan 50 kaki ini, secara efektif, mereka benar-benar bergerak. Dan mereka bergerak sangat lambat, tetapi mereka pasti bergerak, dan saat mereka bergerak, mereka mengubah lanskap. Dan itu sesuatu yang perlu diperhatikan jika Anda menghabiskan waktu sama sekali di daerah di mana bukit pasir adalah hal yang wajar. Karena Anda dapat melihat keluar jendela suatu hari, dan menyadari bahwa gunung pasir yang sangat besar ini, butiran-butiran kecil telah bergerak dengan sendirinya, pada dasarnya, dan bahwa angin perlahan-lahan menggesernya dari satu tempat ke tempat lain.
Dan saya pikir dalam banyak hal, itu adalah dunia sistem basis data untuk beberapa waktu. Sampai sangat, baru-baru ini, pergeseran yang sangat kecil dalam bentuk butiran pasir menggerakkan gunung pasir raksasa dalam bentuk gundukan pasir. Pergeseran kecil telah datang ke platform basis data selama bertahun-tahun, dan ini merupakan lingkungan yang cukup stabil dan solid di sekitar sistem dan platform basis data, melalui mainframe era menengah. Namun akhir-akhir ini, kami mengalami beberapa hal yang cukup signifikan terjadi pada kebutuhan komersial dan driver teknis kami. Saya akan memandu kita melalui semua itu.
Saya memiliki pandangan bahwa konsep dasar dari sebuah basis data, seperti yang kita ketahui selama bertahun-tahun, dan seperti yang mungkin Anda dengar di olok-olok pertunjukan, dua ahli kami yang bertugas bersama saya hari ini memiliki masa ruang ini dan mereka cukup benar dalam berbagi hak-hak membual berada di sana ketika semuanya dimulai pada awal 80-an. Tetapi kita telah melihat perubahan besar dalam dekade terakhir dan sedikit, dan saya akan dengan cepat membawa kita melalui sebelum saya menyerahkannya kepada Dr. Robin Bloor.
Kami telah melalui apa yang saya sebut, pengalaman "lebih besar, lebih baik, lebih cepat, lebih murah". Seperti yang saya katakan, definisi database telah berubah. Lanskap di mana platform basis data harus membahas kinerja, dan persyaratan teknis dan komersial juga telah bergeser. Kami telah melihat peningkatan permintaan akan solusi untuk menangani persyaratan komersial yang lebih kompleks, atau lebih kompleks. Jadi pandangan yang sangat cepat melalui apa yang sebenarnya berarti, dalam pikiran saya, adalah bahwa kita harus memilah tahun 90-an, dan kita melihat teknologi basis data dipengaruhi oleh pengenalan internet, dan jenis apa yang kita sebut saat itu internet skala. Kami tidak hanya berbicara tentang orang-orang yang duduk di depan terminal, pada awalnya orang-orang seperti terminal teletype dengan printer fisik terpasang di dalamnya dan 132 kolom teks yang keluar di kertas. Kemudian terminal layar hijau awal, meninju dengan keyboard.
Tapi tahukah Anda, dunia kita adalah terminal dan kabel serial atau kabel jaringan yang berbicara dengan komputer untuk waktu yang lama. Lalu muncullah internet, dan pertumbuhan konektivitas yang eksplosif ini, yang membuat Anda tidak harus terhubung ke komputer lagi. Untuk sampai ke sistem database Anda hanya perlu browser web. Jadi teknologi basis data harus berubah secara dramatis, untuk menangani skala segalanya, mulai dari teknologi mesin pencari dasar yang digunakan untuk mengindeks dunia, dan menyimpan indeks informasi, dalam contoh skala format basis data. Dan orang-orang seperti Google dan lainnya menyediakan platform untuk melakukan itu. Dan semua jenis penyimpanan database dan kueri dan pengindeksan baru diproduksi. Dan kemudian kami memiliki situs musik dan situs film datang.
Dan kemudian pada tahun 2000-an, kami melihat booming dot-com, dan itu menghasilkan ledakan yang bahkan lebih dramatis pada jumlah orang yang menggunakan sistem yang selalu didukung oleh database dari beberapa bentuk. Tahap ini, basis data relasional masih diatasi dengan sebagian besar beban, kami hanya menempatkan mereka pada timah yang lebih besar, dan kami semacam pergi ke sistem mid-range yang sangat, sangat, sangat besar yang menjalankan platform Unix dari orang-orang seperti IBM dan Sun dan sebagainya. . Booming dot-com hanya membuat hal-hal lebih besar dan lebih cepat dari perangkat keras, sudut pandang kinerja, dan ada beberapa perubahan signifikan dalam mesin basis data, tetapi untuk bagian yang lebih baik, itu masih hal yang sama seperti yang telah kita lihat untuk lama.
Dan kemudian kita mendapatkan era web 2.0 ini, seperti yang kita rujuk. Dan ini adalah perubahan besar, karena tiba-tiba kami membutuhkan platform basis data yang lebih sederhana, dan harus ada skala pada bentuk horizontal. Dan itu adalah perubahan yang sangat signifikan dalam cara kami mendekati gagasan tentang apa itu basis data. Kami masih benar-benar mengejar sekarang dalam pandangan saya. Dan sekarang kita berurusan dengan seluruh rawa ini, dan saya katakan bahwa dengan putaran positif, bukan konotasi negatif, rawa ini dari apa yang kita sebut sebagai data besar, dan ledakan besar, dan maksud saya ledakan. Pergeseran memalukan ini secara vertikal pada grafik jumlah opsi yang kita miliki ketika kita berbicara tentang database, dan beberapa bentuk kemampuan kueri relasional.
Dan yang cukup menarik, saya pribadi berpendapat bahwa saya pikir data besar benar-benar hanyalah puncak gunung es. Kami cenderung sedikit bersemangat tentang apa dampak big data, dan jenis pilihan yang kami miliki sekarang. Kami mendapatkan semuanya dari mesin NoSQL, kami memiliki mesin grafik, kami memiliki semua jenis platform yang berbeda yang dapat kami gunakan untuk membuang data dan melakukan hal-hal dengannya. Bahkan pada titik di mana sebenarnya, salah satu percakapan pertama saya dengan Eric Kavanagh, yang ada di sini bersama kami hari ini, adalah tentang percakapan yang berkaitan dengan sesuatu yang disebut Apache Drill, yang merupakan proyek open-source yang memungkinkan Anda untuk bertanya data di dalam memodelkan tipe data yang berbeda: mulai dari file CSE mentah yang duduk di hard drive, hingga sistem file HDFS pada skala petabyte. Dan Anda tahu, ini memungkinkan Anda untuk melakukan query gaya terstruktur dan tidak terstruktur dari semua jenis tanaman yang menarik ini.
Kami akan melihat "bangunan pintar" menjadi suatu hal, dan kami ingin berpikir bahwa kami memiliki gedung pintar keamanan dan manajemen panas, tapi saya berbicara tentang bangunan pintar yang tahu lebih banyak tentang siapa Anda dan di mana Anda berada saat Anda berjalan, dan melakukan segala macam hal yang rapi di tingkat itu, hingga ke kota-kota pintar - seluruh ekosistem di tingkat kota - yang tahu bagaimana melakukan sesuatu dengan cerdas. Dan lebih dari itu, kita memiliki hal yang luar biasa ini yang saya pikir tidak ada orang di dunia ini yang sepenuhnya memahami, dan itulah bentuk Internet of Things. Ada semua perubahan yang berbeda ini selama dekade terakhir dan sedikit, mungkin kira-kira dua dekade, jika kita mengatasinya, yang telah memengaruhi dunia dari apa yang kita anggap sebagai basis data, dalam pandangan saya.
Ada beberapa hal penting yang memungkinkan hal ini terjadi. Biaya hard drive telah turun secara dramatis, dan dalam banyak hal itulah yang memungkinkan untuk mendorong beberapa arsitektur referensi seperti model Hadoop, di mana kami mengambil banyak data dan menyebarkannya di banyak hard drive, dan lakukan hal-hal cerdas dengannya. Dan pada dasarnya, apa yang menjadi beling, dalam pandangan saya, dari database relasional atau model unit DB tradisional. Dan RAM menjadi sangat, sangat murah, dan itu memberi kami kesempatan baru untuk bermain dengan arsitektur referensi yang berbeda seperti di memori, dan untuk melakukan hal-hal seperti mempartisi gumpalan data yang sangat, sangat besar.
Jadi ini memberi kita gambaran kecil yang sedang kita lihat sekarang, yaitu diagram yang menunjukkan jenis platform yang tersedia jika Anda berada di lanskap data besar. Dan itu sangat, sangat sulit dibaca, dan alasannya, terlalu banyak informasi tentang itu. Ada begitu banyak pilihan membuat, memodelkan dan membuat cara untuk memasukkan data ke dalam sistem basis data dalam bentuk apa pun, dan menanyakannya, dan melakukan penulisan-baca tradisional. Dan mereka tidak semua patuh, bahkan sangat sedikit dari mereka yang bahkan memenuhi standar gaya dasar, tetapi mereka masih menganggap diri mereka sebagai basis data. Dan saya akan menunjukkan kepada Anda beberapa layar dalam satu detik untuk memberi Anda beberapa konteks seputar apa yang saya maksud dengan pergeseran dari tahun 90-an dan skala internet, ke web 2.0, dan kemudian seluruh pertumbuhan melalui data besar. Jika kita berpikir bahwa grafik lansekap teknologi data besar ini menarik karena ada banyak opsi di atasnya, mari kita lihat satu kunci vertikal saja.
Mari kita lihat teknologi pemasaran. Berikut adalah opsi untuk sistem manajemen basis data, atau manajemen data di dalam ruang teknologi saja, sehingga teknologi terkait dengan pemasaran. Sekarang ini pada tahun 2011, jadi beberapa tahun yang lalu; lima tahun yang lalu, seperti inilah bentang alamnya. Jika saya hanya melihat satu slide secara singkat, seperti inilah lansekap data saat ini dalam berbagai merek dan penawaran yang kami miliki dalam teknologi basis data. Inilah yang terlihat seperti vertikal lima tahun lalu, hanya dalam teknologi pemasaran.
Sekarang jika saya pergi ke tampilan hari ini, ini seperti apa, dan itu benar-benar tidak bisa ditembus. Hanya tembok merek dan opsi ini, dan ribuan kombinasi perangkat lunak yang menganggap dirinya berada dalam kelas basis data, yang dapat menangkap, membuat atau menyimpan dan mengambil data dalam berbagai bentuk. Dan saya pikir kita sedang memasuki waktu yang sangat, sangat menarik dan berani sekarang, di mana pada suatu waktu Anda bisa tahu merek-merek utama, Anda bisa tahu lima atau enam platform berbeda dari Oracle dan Informix, DB2 dan sebagainya, dan menjadi hampir ahli dalam semua merek yang tersedia sekitar 20 tahun yang lalu. Sepuluh tahun yang lalu, itu menjadi sedikit lebih mudah karena beberapa merek jatuh, dan tidak semua merek dapat mengatasi skala booming dot-com, dan beberapa perusahaan bangkrut.
Saat ini, sangat tidak mungkin untuk menjadi ahli dalam semua teknologi basis data yang ada, apakah itu basis data relasional, atau platform manajemen basis data standar yang telah kita ketahui selama beberapa dekade terakhir. Atau kemungkinan besar, mesin yang lebih modern seperti Neo4j dan tipe-tipe itu. Jadi saya pikir kita memasuki dunia yang sangat berani di mana banyak pilihan tersedia, dan kita memiliki platform dalam skala secara horizontal, baik dalam memori atau pada disk sekarang. Tetapi saya pikir ini adalah waktu yang menantang bagi para pembuat keputusan teknologi dan bisnis, karena mereka perlu membuat beberapa keputusan yang sangat besar tentang tumpukan teknologi, yang dalam beberapa kasus hanya ada selama beberapa bulan. Delapan belas bulan sekarang bukan angka yang menakutkan sekarang untuk beberapa platform database open-source yang lebih menarik dan baru. Dan mereka mulai menggabungkan platform dan menjadi lebih baru dan lebih menarik.
Saya pikir kita akan melakukan pembicaraan hebat hari ini tentang bagaimana semua ini telah berdampak pada platform database tradisional dan bagaimana mereka menanggapinya, dan jenis teknologi yang dilemparkan pada itu. Dan dengan mengingat hal itu, saya akan memberikan kepada Dr. Robin Bloor, dan mendapatkan wawasannya. Robin, ke arahmu.
Robin Bloor: Oke, terima kasih untuk itu. Ya, ini topik yang terlalu besar. Maksud saya, jika Anda hanya mengambil sepotong dari salah satu ilustrasi yang baru saja ditunjukkan Dez kepada Anda, Anda bisa berbicara panjang lebar tentang salah satu dari sliver. Tapi Anda tahu, Anda bisa menggunakan database - Saya sudah mencari di database, saya tidak tahu, sejak 1980-an, dan Anda bisa melihat database dengan cara yang berbeda. Dan salah satu hal yang saya pikir akan saya lakukan, cukup berbincang-bincang hari ini, adalah untuk membicarakan alasan mengapa hal-hal yang mengganggu telah terjadi pada tingkat perangkat keras. Dan Anda harus ingat, banyak hal-hal yang mengganggu telah terjadi di tingkat perangkat lunak juga, jadi ini bukan gambaran lengkap dari apa pun, ini hanya masalah perangkat keras.
Saya tidak akan berbicara terlalu lama, saya hanya ingin memberi Anda gambar perangkat keras. Basis data adalah kemampuan pengambilan data yang mencakup CPU, memori, dan disk, dan itu berubah secara dramatis. Dan alasan saya mengatakan itu, adalah karena saya belajar memahami basis data dari perspektif apa yang sebenarnya Anda lakukan. Anda tahu, ada perbedaan latensi antara data yang sebenarnya di CPU, dan data yang ditarik ke dalam CPU dari memori, dan data yang ditarik dari disk ke dalam memori, dan melalui CPU. Dan arsitektur basis data lama hanya mencoba menyeimbangkannya. Anda tahu, mereka hanya mengatakan, “Ya, ini berjalan sangat lambat, kami akan men-cache data pada disk sehingga tersimpan dalam memori. Kami akan mencoba dan melakukannya dengan cara yang sangat akurat sehingga sebagian besar dari data yang kami minta sudah ada dalam memori. Dan kami akan mengarahkan data ke CPU secepat yang kami bisa. ”
Dan database ditulis di masa lalu mesin ditulis untuk kelompok kecil. Dan sekarang, untuk orang-orang yang tidak mengenal paralelisme. Karena jika Anda akan mendapatkan kinerja dari sebuah cluster, Anda harus melakukan berbagai hal secara paralel. Paralelisme adalah bagian dari permainan, tidak seperti yang ada sekarang. Saya hanya akan berjalan melalui apa yang terjadi.
Pertama-tama, disk. Nah disk sudah berakhir, sungguh. Sudah cukup banyak tentang database. Saya pikir ada sejumlah konteks untuk pengarsipan data, dan bahkan danau data yang sangat besar berjalan di Hadoop, disk pemintalan terburuk mungkin dapat digunakan saat ini. Sungguh, masalah dengan disk berputar adalah bahwa kecepatan membaca tidak meningkat banyak. Dan ketika CPU naik kecepatan hukum Moore, semacam urutan besarnya, lebih cepat setiap enam tahun. Dan ingatan agak mengikuti, setelah itu, keduanya cukup sejalan satu sama lain, itu tidak sepenuhnya mulus, tetapi mereka melakukannya.
Tapi pembacaan acak ke disk di mana kepala terbang tentang disk, maksudku, terlepas dari apa pun, itu adalah gerakan fisik. Dan jika Anda melakukan pembacaan acak dari disk, itu sangat lambat dibandingkan dengan membaca dari memori, itu seperti 100.000 kali lebih lambat. Dan baru-baru ini, sebagian besar arsitektur basis data yang telah saya lihat secara mendalam sebenarnya baru saja dibaca secara serial dari disk. Anda benar-benar ingin, dengan satu atau lain cara, cukup cache sebanyak mungkin dari disk, dan tarik dari perangkat yang lambat itu dan letakkan di perangkat yang cepat. Dan ada banyak hal pintar yang bisa Anda lakukan dengan itu, tapi itu sudah berakhir.
Dan solid-state disk, atau flash drive, benar-benar seperti itu, sangat cepat mengganti disk pemintalan. Dan itu berubah lagi sepenuhnya, karena cara data diatur pada disk, apakah itu diatur menurut cara disk bekerja. Ini sebenarnya tentang kepala yang bergerak di permukaan yang berputar, sebenarnya banyak kepala yang bergerak di beberapa permukaan yang berputar, dan mengambil data saat mereka pergi. Solid-state drive hanyalah sekumpulan hal yang dapat Anda baca. Maksud saya, hal pertama adalah semua database tradisional direkayasa untuk disk pemintalan, dan sekarang sedang direkayasa ulang untuk SSD. Basis data baru mungkin - siapa pun yang menulis basis data baru sekarang mungkin dapat mengabaikan disk pemintalan, tidak memikirkannya sama sekali. Tetapi Samsung, produsen utama SSD, memberi tahu kami bahwa SSD sebenarnya ada pada kurva hukum Moore.
Mereka sudah, saya pikir, sekitar tiga atau empat kali lebih cepat dari disk berputar, tetapi mereka sekarang akan menjadi jauh lebih cepat setiap 18 bulan, pada dasarnya. Ganda dalam kecepatan, dan 10 kali dalam kecepatan hingga sekitar enam tahun. Namun, jika hanya itu, bukan itu, seperti yang akan saya sampaikan nanti. Spinning disk tentu saja menjadi media pengarsipan.
Tentang memori. Hal pertama yang pertama, RAM. Rasio CPU antara RAM per CPU hanya meningkat setiap saat. Dan itu tentu saja, dengan cara, memberikan kecepatan yang jauh lebih banyak, karena hektar memori yang dapat Anda miliki sekarang dapat menyimpan lebih banyak. Apa yang sebenarnya dilakukan adalah, ini semacam mengurangi tekanan pada jenis aplikasi MLTP, atau aplikasi baca acak, karena lebih mudah untuk memenuhi itu, karena Anda sekarang memiliki banyak memori, dan dengan cara itu, Anda dapat men-cache apa pun yang kemungkinan akan dibaca ke dalam memori. Tetapi Anda mengalami masalah dengan tumpukan data yang lebih besar, sehingga data besar sebenarnya tidak sesederhana itu, sungguh.
Dan kemudian kita memiliki Intel dengan 3D Xpoint, dan IBM dengan apa yang mereka sebut PCM, yang merupakan memori perubahan fase, memberikan sesuatu yang mereka yakini - yah, setidaknya 10 kali lebih cepat dari SSD saat ini, dan mereka percaya itu akan mendapatkan sangat dekat dengan kecepatan yang sama dengan RAM. Dan tentu saja lebih murah. Jadi sebelumnya, Anda memiliki struktur basis data CPU, memori, dan disk ini, dan sekarang kami bergerak ke arah struktur yang memiliki empat lapisan. Ada CPU, memori atau RAM, dan kemudian memori yang lebih cepat dari SSD ini, yang sebenarnya non-volatile, dan kemudian SSD. Dan teknologi baru ini tidak mudah menguap.
Dan ada memristor HP, yang belum, Anda tahu, karena diumumkan sekitar tujuh tahun yang lalu, tetapi belum muncul. Tetapi rumor yang saya dengar adalah bahwa HP akan mengubah permainan sedikit dengan memristor juga, jadi Anda hanya memiliki situasi memori baru. Ini bukan seperti kami memiliki hal-hal yang lebih cepat, ini seperti kami memiliki lapisan baru. Dan kemudian kita mendapatkan fakta bahwa akses SSD, Anda dapat membacanya secara paralel. Anda tidak dapat membaca disk pemintalan secara paralel, kecuali dengan memiliki banyak disk pemintalan yang berbeda. Tapi satu blok SSD, Anda sebenarnya bisa membaca secara paralel. Dan karena Anda dapat membacanya secara paralel, ia berjalan jauh lebih cepat daripada kecepatan baca yang sederhana, jika Anda benar-benar mengatur beberapa proses di berbagai proses pada satu CPU, dan hanya melakukannya dengan SSD.
Diperkirakan Anda bisa mendapatkan hampir hingga kecepatan RAM dengan melakukan itu. Dan semua yang dikatakan ini adalah, masa depan arsitektur memori tidak jelas. Maksudku, kenyataannya adalah bahwa berbagai vendor dominan, siapa pun mereka berubah, mungkin akan menentukan arah perangkat keras. Tetapi tidak ada yang tahu ke mana perginya pada saat ini. Saya telah berbicara dengan beberapa insinyur basis data yang mengatakan, "Saya tidak takut dengan apa yang terjadi, " tetapi mereka tidak tahu bagaimana mengoptimalkannya sejak awal. Dan Anda selalu melakukannya, jadi itu menarik.
Dan kemudian ada CPU. CPU multicore bukan hanya CPU multicore. Kami juga memiliki volume signifikan L1, L2 dan L3 cache, terutama L3, yang hingga, saya tidak tahu, puluhan megabyte. Anda bisa meletakkan banyak di sana, Anda tahu. Dan karena itu, Anda dapat menggunakan chip sebagai media caching. Jadi itu mengubah permainan. Dan tentu saja, pemrosesan vektor dan kompresi data, sejumlah vendor benar-benar melakukan itu, menyeret hal-hal itu ke CPU untuk membuat semuanya berjalan lebih cepat di CPU. Kemudian Anda mendapatkan fakta bahwa, yah, CPU dengan GPU sangat bagus untuk mempercepat analitik. Dan mereka benar-benar bagus dalam jenis pertanyaan tertentu, itu hanya tergantung pada apa permintaan Anda.
Anda dapat membuat papan dengan CPU dan GPU aktif, atau seperti AMD lakukan sekarang, Anda menghasilkan sesuatu yang disebut APU, yang merupakan semacam perkawinan antara CPU dan GPU; itu punya kedua jenis kemampuan di atasnya. Jadi itu jenis prosesor yang berbeda. Dan kemudian pengumuman oleh Intel baru-baru ini bahwa mereka akan meletakkan FPGA pada chip, kepalaku seperti itu. Saya berpikir, “Bagaimana mungkin ini akan terjadi?” Karena jika Anda sudah mendapatkan kemungkinan CPU, GPU, dan Anda memiliki kemungkinan CPU, FPGA - dan omong-omong, jika Anda benar-benar ingin, di papan yang sama Anda bisa meletakkan CPU, dan GPU, dan FPGA. Saya tidak tahu bagaimana Anda akan benar-benar menjalankan apa pun dengan cara itu, tetapi saya tahu perusahaan yang melakukan hal-hal seperti ini, dan mereka mendapatkan respons permintaan yang sangat, sangat cepat. Ini bukan sesuatu yang akan diabaikan, ini adalah sesuatu yang akan digunakan oleh vendor yang sudah mapan, dan oleh vendor baru yang muncul, mungkin. DBMS selalu paralel, tetapi sekarang kemungkinan paralel baru saja meledak, karena ini memungkinkan Anda untuk memparalelkan ini dengan itu, dengan itu, dengan itu dalam berbagai cara.
Akhirnya, untuk meningkatkan atau memperkecil? Peningkatan adalah solusi terbaik, tetapi untuk satu hal. Anda mendapatkan kinerja simpul yang jauh lebih baik jika Anda benar-benar dapat mengoptimalkan kinerja CPU dan memori pada disk pada satu simpul. Dan Anda akan menggunakan lebih sedikit node, jadi itu akan menjadi lebih murah, bukan? Dan itu akan lebih mudah untuk dikelola. Sayangnya, ini adalah desain yang bergantung pada perangkat keras, dan seiring dengan perubahan perangkat keras, menjadi semakin tidak mungkin untuk melakukan itu, kecuali jika teknisi Anda akan dapat berjalan secepat perangkat keras berubah. Dan Anda memang mendapatkan masalah beban kerja, karena ketika Anda meningkatkan, Anda membuat berbagai asumsi tentang apa yang akan dilakukan beban kerja.
Jika Anda meningkatkan skala, yaitu, jika arsitektur Anda menekankan peningkatan sebelum meningkatkan - sebenarnya Anda harus melakukan keduanya, hanya saja Anda menekankan satu. Maka Anda akan mendapatkan kinerja jaringan yang lebih baik, karena arsitektur akan menghadapinya. Dalam hal perangkat keras akan lebih mahal karena akan ada lebih banyak node, tetapi akan ada lebih sedikit masalah beban kerja, dan akan ada desain yang lebih fleksibel.
Dan saya hanya berpikir saya akan melemparkan itu, karena jika Anda benar-benar memikirkan semua perubahan perangkat keras saya hanya mengarahkan jari saya ke, dan kemudian Anda berpikir tentang, bagaimana Anda akan meningkatkan dan mengurangi hal-hal itu? Kemudian Anda menyadari bahwa para insinyur basis data, setidaknya menurut saya, kurang dibayar. Jadi jika Anda hanya merenungkan lapisan perangkat keras, tantangan basis data jelas. Sekarang saya meneruskan ini kepada Bert, siapa yang akan membuat kita semua merasa terdidik.
Eric Kavanagh: Itu dia! Bert?
Bert Scalzo: Terima kasih banyak. Biarkan saya langsung masuk ke slide ini. Saya memiliki banyak slide yang harus saya lalui, jadi pada beberapa slide saya mungkin akan berjalan lebih cepat. Kita akan berbicara tentang ini "Momentum Maju: Memindahkan Hubungan Melampaui Tradisional." Ini bukan database ayahmu lagi. Banyak hal telah berubah, dan seperti yang dikatakan pembicara sebelumnya, enam hingga tujuh tahun terakhir, lanskap telah berubah secara radikal.
Saya sendiri, saya sudah melakukan database sejak pertengahan '80 -an. Saya sudah menulis buku tentang Oracle, SQL Server, benchmarking dan beberapa hal lainnya. “Dunia berubah sangat cepat. Besar tidak akan mengalahkan kecil lagi. Itu akan menjadi yang tercepat mengalahkan yang lambat. ”Saya menambahkan“ untuk beradaptasi. ”Itu dari Rupert Murdoch. Saya benar-benar yakin ini akan benar. Anda tidak akan dapat melakukan hal-hal basis data seperti yang Anda lakukan 10, 15, 20 tahun yang lalu. Anda harus melakukannya dengan cara yang diinginkan bisnis sekarang.
Saya akan mencoba untuk tetap sedikit generik dalam apa yang saya presentasikan, tetapi sebagian besar fitur yang saya bicarakan akan Anda temukan di Oracle, Anda akan menemukan di SQL Server, MySQL, MariaDB dan beberapa lainnya. pemain. Revolusi basis data relasional, saya agak setuju lagi dengan para pembicara sebelumnya. Jika Anda melihat ke kanan sekitar 2010, kami beralih dari mobil balap merah ke mobil balap kuning. Ada perubahan signifikan, dan pada 2020, saya yakin Anda akan melihat perubahan radikal lainnya. Kami berada dalam waktu yang sangat menarik.
Sekarang, slide ini adalah kunci, itu sebabnya saya meletakkan kunci di sana. Semua perubahan ini terjadi, dan di sisi kiri saya punya teknologi, dan di sisi kanan saya punya bisnis. Dan pertanyaannya adalah, yang mana yang menyebabkan yang mana, dan mana yang mendukung yang mana? Kami memiliki semua perubahan perangkat keras ini: disk turun, ukuran disk naik, jenis disk baru, sehingga ditutupi oleh speaker sebelumnya. Harga kehabisan memori, semua versi database yang lebih baru. Tetapi di sisi kanan, kami memiliki perlindungan dan kepatuhan data, pergudangan data, intelijen bisnis, analitik, penyimpanan data wajib. Kedua sisi persamaan mengemudi, dan kedua sisi persamaan akan memanfaatkan semua fitur baru ini.
Pertama-tama, kita punya disk spinning khas SAS kami, mereka hingga 10 terabyte sekarang. Jika Anda belum melihat, Western Digital, HGST memiliki apa yang mereka sebut drive helium, yang mencapai sekitar 10 terabyte sekarang. Biaya disk pemintalan semakin rendah. Seperti yang disebutkan sebelumnya, Anda bisa mendapatkan disk solid-state hingga sekitar dua terabyte, tetapi Samsung memiliki unit 20-terabyte segera hadir. Biaya menjadi masuk akal. Satu hal yang saya akan bicarakan tentang yang lain tidak adalah, konsep flash disk. PCIe, itu PCI Express, versus NVMe, Anda mungkin atau mungkin belum pernah mendengar hal ini, memori express non-volatile. Pada dasarnya, NVMe akan menjadi pengganti SAS dan SATA, dan itu benar-benar lebih merupakan protokol komunikasi daripada yang lain. Tetapi disk-disk itu mencapai sekitar tiga terabyte sekarang.
Anda juga mungkin telah melihat bahwa beberapa drive SAS sekarang datang dengan konektor U.2, yang merupakan jenis konektor yang berbeda dari SAS atau SATA, yang mendukung NVMe dengan disk standar - tentu saja disk harus mendukungnya juga. Dan kemudian SATA dengan konektor M.2, dan mereka mulai mendapatkan NVMe. Bahkan, ada vendor notebook sekarang menjual notebook yang memiliki NVMe flash disk di dalamnya, dan hal-hal itu akan menjerit dibandingkan dengan teknologi yang telah Anda gunakan sebelumnya.
Banyak orang tidak tahu apa semua kilatan berbeda ini. Jika Anda melihat di sudut kanan bawah, itu adalah contoh dari M.2. Anda mungkin berkata, “Wah, sepertinya drive mSATA di sebelah kiri.” Tetapi seperti yang Anda lihat, ada dua celah di pin yang bertentangan dengan satu, dan itu sedikit lebih besar. Dan juga, M.2 dapat datang dalam tiga ukuran berbeda.
Dan kemudian PCI Express flash, dan NVMe flash. Sekarang, NVMe flash juga PCI Express, tetapi PCI Express biasanya masih berupa algoritma pengontrol tipe SAS atau SATA yang ditulis untuk disk pemintalan, dan NVMe adalah algoritma atau teknik yang ditulis khusus untuk flash. Dan lagi, Anda akan melihat semua ini.
NVMe menawarkan beberapa hal. Saya pikir dua peningkatan terbesar adalah, di sudut kanan atas, latensi berkurang sebanyak 70 persen. Saya sebenarnya telah melihat lebih tinggi dari itu. Selain itu, jika Anda melihat di sudut kanan bawah, ketika sistem operasi Anda berbicara ke disk NVMe, ia melewati tingkat perangkat lunak yang jauh lebih sedikit. Pada dasarnya, Anda pergi melalui driver NVMe yang termasuk sekarang dengan sistem operasi, dan berbicara langsung ke media. Ada banyak alasan mengapa teknologi ini akan mengubah dunia basis data secara radikal.
Dan sering kali, orang akan berkata, “Ya, seberapa cepat NVMe?” Anda tahu, masa lalu yang indah, tahun 2004 dan sebelumnya, kami senang jika kami memiliki Ultra-320 SCSI, 300 megabyte per detik. Kecepatan hari ini, banyak dari Anda mungkin menggunakan fiber atau InfiniBand, dan itu semacam top out. NVMe di sana di sebelah kanan, dimulai dari tempat teknologi saat ini berakhir. Yang saya maksudkan adalah, PCI Express 3.0 dengan tautan delapan jalur dimulai pada hampir 8000, dan itu akan naik ketika kita mendapatkan versi PCI Express yang lebih baru, versi empat dan seterusnya. NVMe tidak punya tempat lain kecuali naik.
Sekarang, apa saja hal-hal yang berubah dalam database? Sekarang di sudut kanan atas slide saya, saya menempatkan alasan bisnis saya pikir teknologi muncul. Dalam hal ini, karena penyimpanan data dan karena alasan peraturan untuk penyimpanan data wajib, basis data mulai menawarkan kompresi di dalamnya. Sekarang, beberapa database menawarkan kompresi sebagai add-on, beberapa menawarkannya sebagai built-in ke standar, katakanlah edisi enterprise dari database mereka, dan beberapa database, seperti di Oracle, bahkan dapat memiliki versi kompresi yang lebih baik lagi yang di, katakanlah, platform Exadata mereka, jadi mereka sebenarnya telah membangun perangkat keras yang dapat mendukung kompresi yang sangat khusus dan yang di Exadata, misalnya, mendapat tingkat kompresi 40x, dan itu sangat signifikan. Dan saya pikir itu adalah penyimpanan data wajib, orang hanya ingin data lebih lama. Bisnis, untuk melakukan analitik dan BI, mereka membutuhkan data 5, 10, 15 tahun terakhir.
Sekarang fitur lain yang mulai muncul di sekitar periode 2008, 2009 adalah partisi. Sekali lagi, Anda akan menemukan ini di database seperti Oracle, SQL Server, dan pada keduanya Anda harus membayar untuk itu. Di Oracle Anda harus membeli opsi partisi dan di SQL Server Anda harus berada di edisi pusat data. Ini adalah teknik membagi-dan-taklukkan tradisional Anda dan apa yang Anda lakukan adalah Anda memiliki konsep tabel besar yang logis di bagian atas sana dan ketika itu dimasukkan ke dalam disk, itu sebenarnya dipecah menjadi ember. Dan Anda dapat melihat bahwa bucket tersebut diatur oleh beberapa kriteria untuk dipisahkan, biasanya direferensikan atau disebut fungsi partisi Anda, dan kemudian, Anda juga dapat melakukan sub-partisi dalam beberapa platform basis data dan Anda dapat melangkah lebih jauh.
Sekali lagi, saya pikir kedua pergudangan data dan penyimpanan data wajib telah mendorong ini, dan dalam beberapa database ini Anda dapat memiliki hingga 64.000 partisi, dan saya percaya pada beberapa database lain bahkan hingga 64.000 sub-partisi. Ini memungkinkan Anda memecah data Anda menjadi bagian-bagian yang dapat dikelola. Anda juga akan mempartisi indeks; itu pilihan, Anda tidak harus melakukannya, tetapi Anda juga dapat mempartisi indeks Anda. Salah satu alasan untuk melakukan ini mungkin karena Anda memiliki jendela geser data. Anda ingin menyimpan data bernilai 10 tahun tetapi untuk menjatuhkan indeks untuk menjalankan pemuatan batch malam ini, Anda tidak ingin harus menjatuhkan indeks pada setiap baris, hanya pada baris yang ada di ember saat ini. Partisi sebenarnya adalah alat administrasi yang sangat baik meskipun kebanyakan orang berpikir bahwa manfaatnya yang besar adalah menghilangkan eliminasi partisi dalam rencana Anda dan karenanya mempercepat permintaan Anda. Itu benar-benar semacam lapisan gula pada kue.
Sekarang Anda mungkin pernah mendengar tentang sharding dan Anda mungkin berpikir, “Yah, mengapa Anda meletakkan slide ini di sini?” Ini adalah salah satu dari NoSQL - ini adalah salah satu dari lingkungan tipe Hadoop. Oracle 12c merilis dua, yang belum G8, tetapi yang sedang ditampilkan atau dipratinjau sebenarnya telah sharding di dalamnya. Anda akan memiliki sistem basis data tradisional seperti Oracle dan Anda akan dapat shard seperti yang Anda lakukan dalam model Hadoop, dan Anda akan memiliki teknik membagi dan menaklukkan yang akan membagi Anda tabel baris-bijaksana menjadi pengelompokan per node dan ini akan menjadi - seperti apa yang Anda lihat di beberapa database NoSQL Anda. Dan sebenarnya MySQL, Anda dapat benar-benar mencapai ini cukup banyak menggunakan salah satu teknik pengelompokan mereka, tetapi itu datang ke database tradisional dan tebakan saya adalah Microsoft tidak ingin ketinggalan. Dua katak lompatan ini bermain satu sama lain sepanjang waktu jadi saya akan berharap untuk melihat sharding di mungkin versi SQL Server berikutnya.
Manajemen siklus hidup data, sekali lagi penyimpanan data wajib, tetapi juga untuk intelijen bisnis dan analitik. Sungguh, ini adalah teknik membagi dan menaklukkan, dan biasanya DBA melakukan ini secara manual, dan itu adalah, “Saya akan menyimpan data tahun ini pada disk cepat, data tahun lalu pada disk yang sedikit lebih lambat, mungkin saya akan untuk menjaga dua tahun terakhir sebelum itu pada disk yang bahkan lebih lambat, dan kemudian saya akan memiliki beberapa metode pengarsipan. "Ini biasanya tidak direkam lagi, itu biasanya - Anda memiliki semacam penyimpanan yang terpasang jaringan atau beberapa perangkat yang memiliki banyak penyimpanan dan, Anda tahu, hemat biaya tetapi masih berputar disk.
Dan sekarang Anda dapat benar-benar - baik pada Oracle dan SQL Server - Anda dapat membeli opsi di mana Anda mendefinisikan aturan dan ini hanya terjadi secara otomatis di latar belakang. Anda tidak perlu menulis skrip lagi, Anda tidak perlu melakukan apa pun. Dan jika Anda telah melihat SQL Server 2016, yang baru saja keluar Juni pertama, ada fitur baru yang disebut "Stretch Databases" yang pada dasarnya memungkinkan Anda melakukannya - di sudut kanan bawah sana - Anda dapat berpindah dari berbagai lapisan langsung ke awan. dan sekali lagi ini adalah fitur yang dibangun ke dalam basis data, Anda hanya mengatakan sesuatu seperti, "Jika data lebih dari 365 hari, silakan pindahkan ke cloud dan, Anda tahu, melakukannya secara otomatis untuk saya."
Ini akan menjadi fitur yang sangat keren, pada kenyataannya saya berpikir bahwa itu mungkin apa yang akan kita lihat di masa depan, yang mana Anda akan memiliki database hybrid di mana Anda akan menyimpan beberapa lokal dan beberapa di awan. Sebelum ini, orang-orang berpikir, "Oh, aku akan melakukan on-premise atau aku akan melakukannya di cloud." Sekarang kita melihat perkawinan dua teknologi dalam mode hybrid ini. Saya pikir ini akan sangat besar dan Microsoft sampai di sana lebih dulu.
Redaksi, ini karena perlindungan data dan kepatuhan. Sekarang di masa lalu yang baik kita mungkin telah berkata, "Hei, pengembang aplikasi, ketika Anda menampilkan ini dalam laporan, ketika Anda menampilkan ini di layar di sini adalah beberapa hal keamanan yang harus Anda periksa dan tolong, Anda tahu, hanya perlihatkan data mereka seharusnya melihat atau menutupi atau mengurangi data yang tidak seharusnya mereka lihat. ”Yah, seperti biasa, ketika Anda mendorongnya ke aplikasi itu tidak dilakukan di satu tempat sehingga dilakukan secara berbeda atau tidak bisa dilakukan di beberapa tempat. Dan sekarang Anda benar-benar mendapatkan kemampuan ini dalam sistem basis data Anda.
Sekarang di SQL Server 2016, fitur ini sudah ada di dalamnya sehingga ini bukan item biaya opsional yang belum ada pada penambahan pusat data, saya percaya; dan di Oracle 12 Anda harus membeli add-on manajemen siklus hidup mereka, tetapi ini adalah sesuatu yang baru dan sekali lagi didorong oleh bisnis. Dan terutama karena Anda menyimpan begitu banyak data sekarang, dan Anda melakukan penambangan data, jadi BI dan analitiknya, Anda harus tahu siapa yang mengakses data apa dan memastikan bahwa mereka hanya diizinkan untuk melihat apa mereka diizinkan untuk melihat.
Demikian juga, sekali lagi lihat itu, perlindungan data dan kepatuhan. Anda akan menemukan bahwa banyak sistem basis data sekarang sedang membangun kompresi, atau saya minta maaf, enkripsi langsung ke dalam basis data dan apa yang penting tentang enkripsi ini, jika Anda melihat panah bawah dan panah atas pada diagram yang ditulisnya. turun ke disk terenkripsi dan kemudian membacanya kembali ke memori dan mendekripsi. Itu sebenarnya satu model, ada model lain yang akan, Anda tahu, sebenarnya hanya melakukannya ketika itu mengkomunikasikan data itu di jaringan ke aplikasi klien yang sebenarnya.
Dalam hal ini, itu bahkan masih di server database di memori itu bisa dienkripsi dan hanya didekripsi ketika dikirim ke aplikasi klien. Ada dua model yang berbeda di sini dan Anda akan menemukan ini di database, dan sebenarnya salah satu database yang baru saja menambahkan ini adalah MariaDB di versi 10.X; Saya percaya mereka berada di 10.1 atau 10.2 sekarang. Dan saya benar-benar melakukan benchmarking pada enkripsi ini, dan untuk mendapatkan enkripsi ini, saya hanya mengalami penurunan throughput atau kecepatan 8 persen. Dalam tes pembandingan, enkripsi tidak menyebabkan banyak dan karenanya fitur yang sangat berguna.
Sekarang, kami telah menyebutkan sebelumnya tentang memori flash dan SSD dan hal-hal seperti itu. Salah satu fitur yang Anda miliki di Oracle dan SQL Server yang tidak disadari oleh banyak orang adalah Anda dapat mengambil flash atau SSD yang ada di server database Anda dan Anda dapat mengatakan ke database, “Gunakan ini seolah-olah itu adalah memori. Perlakukan RAM sebagai preferensial, tetapi berpura-pura seperti ini adalah memori yang lambat dan gunakan itu sebagai cache yang diperluas. "Sekarang di SQL Server 2014 ini keluar dan disebut" Buffer Pool Extension, "gratis. Di Oracle, itu keluar dalam 11g R2 dan itu disebut "Database Flash Cache" dan juga gratis di sana.
Saran saya, adalah untuk menguji coba fitur ini dengan hati-hati. Setiap kali Anda membuat cache lebih besar ketika Anda melakukan pencarian, dibutuhkan waktu lebih lama. Jika Anda meletakkan kartu flash tiga terabyte dan berkata ke database, "Tambahkan itu ke memori Anda, " Anda sebenarnya mungkin menemukan sesuatu yang melambat karena waktu untuk melihat dan melihat apakah itu dalam flash, apakah itu kotor atau bersih? Ada titik pengembalian yang semakin berkurang. Saran saya adalah lagi test drive ini, lihat apa yang bekerja untuk Anda, tetapi sekali lagi, itu ada di database Anda dan dalam kasus Oracle, baik di SQL Server dan Oracle, sudah ada di sana selama beberapa tahun sekarang.
Dan kemudian itu membawa kita ke kakek yang merupakan database di memori dan itu karena harga database telah turun. Alasan lain mengapa Anda mungkin berpikir bahwa ini telah terjadi adalah karena banyak analitik yang mengharuskan data dapat diakses dengan sangat cepat, sehingga harus dalam memori. Perhatikan bahwa algoritme yang digunakan basis data untuk mengakses data ini, untuk mengompresnya, untuk mengenkripsi, untuk menyimpannya, Anda tahu dalam beberapa kasus beberapa basis data dapat terus menyimpan dalam memori sebagai baris.
Dalam beberapa kasus, beberapa database dapat memecah ini menjadi berorientasi kolom dan alasan mereka melakukan itu adalah mereka mendapatkan tingkat kompresi yang jauh lebih tinggi, di suatu tempat di sekitar 11 hingga 12X dengan menyimpannya dalam urutan kolom versus urutan baris. Ini pertama kali muncul di SQL Server 2014, itu disebut "Hekaton." Ini telah meningkat secara radikal di SQL Server 2016, mereka akan melihatnya direferensikan oleh beberapa nama yang berbeda dan keluar di Oracle 12c; Saya katakan rilis kedua di sini, bukan R2. Ada dua rilis berbeda dari Oracle 12c, 12.1.0.1 dan 12.1.0.2. Ini adalah rilis kedua dari versi R1 dari database.
Dan cara Anda mendefinisikannya, objek dalam memori serupa di kedua database. Di sini Anda dapat melihat di sudut kanan atas, saya membuat SQL Server dan Anda dapat melihatnya dengan memori yang dioptimalkan dan daya tahan hanya skema. Saya tidak akan membahas semua arti sintaksis ini, dan di Oracle sebenarnya lebih sederhana, Anda hanya mengubah tabel dan mengatakan dalam memori atau tidak dan Anda dapat mengubahnya. Saya bisa mengatakan hari ini di memori dan besok tidak dan jadi sangat fleksibel.
Saya melakukan beberapa tes pada Oracle dengan tabel dalam memori, saya memiliki beberapa tes yang membutuhkan waktu hampir 40 menit untuk berjalan, di sana di baris paling atas. Sekarang yang penting adalah pada saat saya sampai di dua baris terbawah, saya telah meningkatkan runtime atau menguranginya, saya harus mengatakan, kira-kira lima menit, dan ketika saya melihat faktor kompresi, data dalam memori sebenarnya 3, 6 menjadi 4, 6 kali lebih kecil. Itu penting karena dalam hal ini saya menggunakan format berorientasi kolom dan kompresinya. Dan coba tebak? Saya benar-benar pas hampir empat hingga lima kali lipat data dalam memori saya. Saya tidak hanya mendapatkan keuntungan dari memori, keunggulan berorientasi kolom, tetapi juga keuntungan dari data yang jauh lebih banyak - hingga lima kali lebih banyak data dalam cache memori, jadi ini adalah teknik yang cukup kuat. Sekali lagi Oracle dan SQL Server, Anda ingin melihatnya, mereka adalah fitur yang sangat keren. Dan dengan itu, saya pikir saya akan membukanya untuk pertanyaan.
Eric Kavanagh: Ya, pertama-tama Anda tidak mementingkan diri sendiri dalam semua pendidikan yang luar biasa ini. Bisakah kamu bicara sebentar tentang apa yang kalian lakukan? Karena Anda memiliki beberapa teknologi yang memungkinkan yang dapat memfasilitasi apa yang Anda bicarakan. Bicara sebentar tentang apa yang kalian lakukan dan mari kita turunkan Dez dan Robin dalam persamaan di sini.
Bert Scalzo: Ya, saya bekerja di sebuah perusahaan bernama IDERA. Kami di Texas, kami berkantor pusat di Houston, dan saya sebenarnya duduk di Austin sekarang tetapi saya berbasis di Dallas. Kami membuat alat basis data dan kami membuat alat basis data untuk membantu Anda memecahkan masalah. Masalah itu bisa berupa sesuatu yang sederhana seperti produktivitas dalam hal ini kami memiliki alat yang disebut DBArtisan yang memungkinkan Anda melakukan tugas administrasi basis data Anda dan itu adalah salah satu alat untuk memungkinkan Anda mengelola 12 platform basis data yang berbeda. Saya dapat mengelola SQL Server, saya dapat mengelola Oracle, saya dapat mengelola MySQL, DB2, Postgres, dan saya menggunakan satu alat, satu dapat dieksekusi, satu desain GUI dan satu set alur kerja yang konsisten. Kami juga membuat alat untuk melakukan kepatuhan, kami memiliki alat yang disebut SQL Compliance Manager untuk membantu Anda memenuhi kebutuhan kepatuhan Anda. Alat lain yang disebut SQL Security, jadi kami mencoba membuat alat yang akan membantu Anda menjadi efektif dan efisien, dan apa yang benar-benar baik jika Anda mengunjungi situs web kami, kami memiliki banyak freeware di luar sana, jadi jika tidak ada yang lain, silakan unduh - Saya pikir kami punya 20 atau 25 freewares. Ada beberapa hal freeware yang sangat bagus di luar sana seperti ada SQL Server dan Windows Help Check yang pada dasarnya hanya akan melihat apa yang Anda miliki dan memberi tahu Anda apakah Anda memiliki masalah atau hal-hal dan itu benar-benar gratis.
Eric Kavanagh: Dan Anda benar-benar baik-
Bert Scalzo: Pasti yang pertama-
Eric Kavanagh: Anda berbicara tentang heterogenitas di pasar saat ini, dulu ada semacam persamaan satu ukuran untuk semua yang sebenarnya saya ingat pernah mewawancarai Dr. Michael Stonebraker ketika di tahun 2005, ketika ia melanjutkan dorongan besar berbicara tentang vonis pada gerakan basis data berorientasi kolom dan dia berbicara tentang bagaimana model relasional satu ukuran cocok untuk semua mendominasi selama bertahun-tahun, dan dia memperkirakan bahwa semua akan berubah, dan bocah apakah dia benar tentang bahwa. Sekarang kami memiliki lingkungan yang sangat beragam dan menarik ini dengan banyak pilihan dan peluang yang berbeda, tetapi Anda memang membutuhkan seseorang untuk mengelola semua itu dan bagi saya tampaknya perusahaan Anda berfokus cukup akut untuk menyelesaikan masalah matematika, sehingga menjadi enabler dari header heterogenitas, kan?
Bert Scalzo: Tentu saja. Maksud saya akan selalu ada DBA yang mengatakan, "Saya tidak ingin menggunakan alat GUI, saya melakukan semuanya dengan skrip, " Anda tahu? Mereka pikir mereka adalah tipe DBA superman dan itu bagus, tetapi bagi kebanyakan dari kita, kita hanya ingin menyelesaikan pekerjaan dan - Anda tahu, saya menggunakan Microsoft Word untuk menulis dokumen saya. Saya menggunakan Microsoft Outlook untuk melakukan email saya. Maksudku, aku punya alat untuk melakukan tugas. Kami sedang membangun konsep yang sama, kami sedang membangun alat untuk administrator dan pengembang basis data untuk membantu mereka fokus pada apa yang ingin mereka lakukan dan bukan bagaimana mereka harus melakukannya.
Eric Kavanagh: Itu masuk akal, tetapi izinkan saya menyerahkan Anda kepada para ahli kami, dan orang-orang merasa bebas untuk menyelam. Kami mendapat beberapa komentar yang masuk dari audiensi. Mungkin, Dez, beberapa pertanyaan dan Robin beberapa pertanyaan?
Dez Blanchfield: Tentu. Salah satu pertanyaan pertama yang ingin saya sampaikan kepada Anda, mengingat rentang pengalaman yang sangat besar yang Anda dapatkan, apakah Anda melihat titik waktu segera ketika semua ini akan melambat? Atau apakah Anda pikir kita benar-benar berada di titik masuk dari garis perubahan pertumbuhan berkelanjutan ini? Saya pikir salah satu masalah terbesar yang dihadapi perusahaan, dan selalu orang-orang yang mencoba untuk mendukung teknologi yang disediakan perusahaan-perusahaan itu untuk menjalankan bisnis mereka, adalah bahwa tingkat perubahannya sangat dramatis sehingga mereka tidak bisa mengimbangi semua fitur yang berbeda, dan perangkat lunak, dan sistem, dan kerangka kerja, dan arsitektur, dan kode baru muncul, dan kemudian perangkat keras di bawahnya, apakah Anda melihat tingkat perubahan saat ini melambat sama sekali dengan segera? Maksud saya, Anda berurusan dengan berbagai macam platform dengan seluruh rangkaian IDERA, apakah kita akan segera melambat atau apakah kita akan menggunakan kereta barang pelarian yang gila ini untuk waktu yang lama?
Bert Scalzo: Saya pikir kita berada pada 20 persen pertama dari kurva pertumbuhan itu dan kita masih harus menempuh jalan panjang dan ada dua hal yang mendorongnya. Teknologi terus berkembang. Anda telah menyebutkan beberapa tipe memori baru yang akan keluar, itu akan menjadi fantastis. Samsung akan memiliki flash drive 20-terabyte di sini segera nyata. Itu akan mengubah banyak hal. Kami memiliki semua database NoSQL dan cloud ini, ini hanya akan terus berjalan. Satu hal yang agak lucu adalah ketika saya melihat basis data seperti Oracle dan SQL Server dan beberapa yang lain, mereka benar-benar bukan basis data relasional lagi. Saya dapat memasukkan data yang tidak terstruktur ke dalam Oracle dan tetap mempertahankan kepatuhan ACID. Jika Anda mengatakannya 20 tahun yang lalu, saya baru saja mengatakan Anda menggunakan narkoba.
Dez Blanchfield: Ya, ya, mereka keren. Yah bahkan sekarang mesin-mesin itu yang punya ceruk vertikal yang cukup bagus seperti GIS, hanya lebih baik daripada kemampuan asli sekarang. Anda membuat beberapa komentar hebat tentang tantangan yang dihadapi DBA dan waktu yang berbeda dari DBA yang kami harapkan untuk dilihat di sekitar tempat itu, tetapi seperti apa dunia dengan lapisan bisnis yang Anda hadapi? Maksud saya, ini adalah orang-orang yang menggunakan platform berbeda dari manajer diagnostik Anda, ke alat inventaris, dan semua jalan ke bawah ke defragging, bagaimana DBA mengatasi perubahan ini dan bagaimana mereka mengurutkannya - Anda tahu, apa yang mereka lakukan dengan alat Anda untuk menangani perubahan signifikan dalam lanskap mereka?
Bert Scalzo: Ya, saya akan kembali hampir 20 tahun yang lalu, maka saya akan mengatakan bahwa DBA menyelesaikan peran yang sangat spesifik dalam suatu organisasi. Mereka biasanya bekerja dengan satu platform basis data, mungkin dua, dan mereka mengelola sejumlah kecil basis data. Sekarang maju cepat ke hari ini dan administrator database, dia sebenarnya akan tahu 10 platform database. Dia mengelola, dan ini bukan lelucon, dalam beberapa kasus ribuan database; itu lebih pada dunia SQL Server atau dunia MySQL. Tetapi masih di dunia Oracle mereka bisa mengelola ratusan basis data. Jadi mereka mendapatkan semua fitur baru ini, mereka memiliki semua platform baru ini, dan mereka memiliki semua database yang menjadi tanggung jawab mereka. Mereka mencari alat untuk mengaktifkan produktivitas mereka dan juga membantu mereka mempelajari beberapa hal.
Dan saya akan memberikan Anda sebuah contoh - jika saya ingin mempartisi sebuah tabel, itu adalah sintaks yang cukup tidak jelas, dan jika saya ingin mem-sub-partisi itu, sintaksinya menjadi semakin sulit. Saya tahu apa yang ingin saya lakukan, saya ingin membuat ember. Jika saya punya alat seperti DBArtisan yang mengatakan, "Hei, ini layar bagus yang memungkinkan Anda berkonsentrasi pada apa yang Anda coba lakukan daripada bagaimana Anda mencoba melakukannya, dan oh omong-omong, tekan tombol Tampilkan tombol SQL setelah selesai dan kami akan menunjukkan kepada Anda apa itu SQL sehingga Anda dapat mulai benar-benar belajar dan menguasai ini. "
DBA menemukan bahwa alat yang membantu mereka menyelesaikan pekerjaan tetapi juga membantu mengajarkan mereka semua hal baru yang mereka gunakan dan hal yang sama akan benar - katakanlah saya seorang pria Oracle dan saya pergi ke MySQL dan berkata, “Oke, buat database, DBArtisan. Sekarang perlihatkan kepada saya SQL karena saya bertanya-tanya bagaimana rasanya membuat database di MySQL dan saya baru saja belajar sintaks. ”Dan kami tidak hanya membantu mereka untuk bekerja di seluruh database, kami juga mendidik mereka di seluruh database.
Dez Blanchfield: Itu menjadi lebih menarik ketika Anda keluar ke beberapa yang lebih modern - atau tidak lebih modern, itu bukan hal yang adil untuk dikatakan - tetapi suatu kali suatu database adalah database. Hari-hari ini saya melihat semua yang Anda bicarakan di sana dengan tantangan tambahan bahwa teknologi menumpuk yang secara tradisional kita lihat dari vendor dan Anda semacam open source ke dalamnya dan juga mereka bagus. Tidak hanya berurusan dengan mesin database dan bahasa query, tetapi mereka juga berurusan dengan tipe data, terstruktur dan tidak terstruktur, Anda tahu, tantangan harus berurusan dengan segala sesuatu dari ujung spektrum HDFS multi-petabyte. lingkungan ke wadah kecil kecil, dan paket file dan berbagai format file log.
Dan saya pikir itu adalah sesuatu yang sekarang kita lihat di mana tidak ada manusia, tidak peduli seberapa besar seorang superman, wanita super, apa pun yang mereka pikirkan, mereka secara fisik, mereka tidak bisa secara mental menghadapi tingkat perubahan itu dan skala variasi. Saya pikir seperangkat alat yang Anda tawarkan sekarang akan sampai pada titik di mana mereka akan hampir pada set standar dalam banyak hal sehingga kita tidak dapat menjalankan lingkungan basis data yang kita dapatkan tanpa mereka karena kita hanya secara fisik tidak bisa melemparkan banyak tubuh pada mereka. Saya sangat menikmati presentasi Anda. Saya akan menyampaikan kepada Dr. Robin Bloor, saya yakin dia punya banyak pertanyaan untuk diajukan kepada Anda juga.
Robin Bloor: Oke. Yah saya tentu punya pertanyaan. Bert, saya tidak tahu ke mana Anda akan pergi - Saya memiliki percakapan yang sangat menarik beberapa hari yang lalu di mana seseorang mulai memberi tahu saya tentang perlindungan data DU terbaru, dan bagi saya tampaknya dari apa yang mereka katakan itu sangat luar biasa. kejam dalam hal-hal yang mereka tegaskan. Saya bertanya-tanya apakah Anda benar-benar melihat itu; apakah itu sesuatu yang Anda kenal?
Bert Scalzo: Tentu saja. Ya.
Robin Bloor: 2016, Oke, beri tahu kami tentang itu.
Bert Scalzo: Dan saya sebenarnya-
Robin Bloor: Sangat menarik.
Bert Scalzo: Saya sebenarnya bekerja sebentar untuk vendor flash, di area basis data mereka membantu mereka membuat produk flash untuk basis data, dan saya dapat memberi tahu Anda bahwa draconian terus menurun. Apa yang saya maksud adalah, jika Anda ingat satu slide saya, saya katakan di beberapa database itu akan melakukan enkripsi tetapi memasukkannya ke dalam memori server dan dalam beberapa database enkripsi - itu masih dienkripsi dalam memori server, itu hanya akan didekripsi ketika itu akan dikirim ke klien. Nah, yang juga akan Anda temukan adalah beberapa standar pemerintah ini, terutama Departemen Pertahanan atau militer di sini di AS, mereka juga masuk ke tingkat flash dan mereka ingin tahu tidak hanya bahwa Anda mendukung enkripsi dan dekripsi di perangkat keras Anda, tetapi jika seseorang mencuri chip itu - Anda tahu, mengeluarkannya dari server Anda, bahwa apa yang ada dienkripsi dan meskipun mereka memiliki penyimpanan itu tidak mungkin dan mereka akan semua jalan ke aktual - bukan ke bagian flash itu sendiri tetapi ke chip individu. Mereka ingin tahu bahwa chip demi chip, semuanya dienkripsi.
Robin Bloor: Wow. Maksud saya ada banyak hal yang - Anda tahu, saya pikir hanya satu atau dua slide yang telah Anda kemukakan tentang ini, tetapi itu adalah sesuatu, sebuah skenario yang saya pikir sangat menarik. Pengurangan informasi misalnya, harus ada sedikit lebih pintar daripada hanya menutupi berbagai bidang karena terutama dengan pembelajaran mesin saat ini, Anda dapat melakukan hal-hal deduktif yang memungkinkan Anda untuk memunculkan informasi yang sebelumnya tidak dapat Anda tunjukkan.
Jika Anda mencoba untuk melindungi, katakanlah informasi kesehatan, maka itu adalah peraturan yang sangat, sangat kejam di AS terkait dengan informasi kesehatan, tetapi Anda dapat benar-benar, menggunakan berbagai teknik pembelajaran mesin, Anda sering dapat mengetahui informasi medis siapa seseorang sebenarnya. Saya hanya ingin tahu apakah Anda punya sesuatu untuk dikatakan tentang itu karena mereka semua berpikir itu adalah bidang yang menarik.
Bert Scalzo: Ya, tentu saja, dan saya hanya menggunakan ini sebagai contoh, saya tidak mencoba untuk mengatakan satu database lebih baik dari yang lain, tetapi ini adalah contoh yang sangat baik untuk apa yang baru saja Anda tanyakan. Di Oracle, jika saya tidak diizinkan melihat deretan data misalnya, seperti saya tidak diizinkan melihat catatan medis John Smith. Di Oracle jika saya berkata, "Pilih catatan itu, " saya akan diblokir atau saya akan diizinkan untuk melihat apa yang saya boleh lihat dan itu akan dihapus. Dan jika saya berkata, "Pilih bintang akun dari tabel di mana sama dengan John Smith, " saya akan mendapatkan nol.
Dalam SQL Server, ia dapat melakukan redaksi tetapi memiliki beberapa lubang. Jika saya berkata, "Pilih bintang akun dari tabel di mana itu sama dengan John Smith, " saya akan benar-benar mendapatkan satu, jadi saya tahu ada John Smith. Yang satu lebih aman dari yang lain. Sekarang saya berharap mereka memperbaikinya, mereka selalu bermain katak dengan satu sama lain. Dan lagi, saya tidak mencoba untuk membedakan antara database selain untuk menunjukkan contoh - lihat apa yang kita bicarakan sekarang, sesuatu yang sederhana seperti akun pilih juga harus dipotong oleh redaksi, meskipun, secara teknis berbicara, tidak ada yang dihapus selain keberadaan barisan.
Robin Bloor: Ya, benar. Itu agak menarik. Maksud saya, pertanyaan umum lain karena saya tidak punya banyak waktu, sebenarnya hanya tentang perbaikan. Maksud saya, Anda pernah berada di tempat di mana saya tahu bahwa Anda telah menunjukkan kepada kami contoh berbagai hasil pengujian yang telah Anda jalankan - apakah Anda berpikir bahwa basis data tradisional, sebut saja basis data yang dominan, SQL Server dan Oracle, apakah Anda berpikir bahwa mereka akan tetap berada di depan penyelesaian? Atau apakah Anda pikir mereka benar-benar akan ditangkap oleh satu atau lain dari berbagai macam gangguan di pasar yang benar-benar berjalan untuk mereka? Apa pendapatmu?
Bert Scalzo: Saya punya pendapat dan itu - Anda tahu, sekali lagi saya akan mengatakan itu pendapat saya - Microsoft misalnya, di era pasca-Ballmer hanya mengesankan neraka hidup dari saya. Maksud saya hamparan database ini mendapatkan SQL Server di Linux, mendapatkan .NET di Linux, mendapatkan PowerShell di Linux; Saya tidak berpikir bahwa vendor database tradisional akan ketinggalan. Saya pikir mereka telah memutuskan, “Hei, biarkan orang-orang baru, para startup menentukan sesuatu. Biarkan mereka mencari tahu apa itu sharding dan bagaimana itu harus disempurnakan, dan begitu mereka telah melakukan semua penelitian dan pengembangan, kita tahu persis apa yang diinginkan pengguna, sekarang mari kita tambahkan sharding ke Oracle. ”Saya pikir mereka semakin pintar dan cerdas. mengatakan, "Hei, menjadi yang kedua atau ketiga tidak buruk ketika Anda adalah pemain dominan karena dengan begitu orang tidak akan bermigrasi dari Anda."
Robin Bloor: Ya, maksud saya itu adalah strategi yang telah digunakan. Maksud saya IBM dulu melakukan itu dan seluruh - untuk seluruh rentang produk mereka dan itu menilai cukup baik sampai seseorang datang dengan sesuatu yang benar-benar keluar dari tembok yang tidak pernah terpikirkan oleh siapa pun, tetapi Anda tidak dapat merencanakan menentang itu pula.
Pertanyaan dari hadirin, Eric?
Eric Kavanagh: Ya, tapi Anda punya waktu saya pikir hanya untuk satu mungkin dan saya tahu bahwa Bert harus lari. Ada sesuatu di sini tentang - oke, arsitektur sharding pada Oracle 12c adalah indikasi - atau apa indikasi menurut Anda, menurut Anda apa yang terjadi di sana?
Bert Scalzo: Ya, Oracle menyerap atau / dan menawarkan segala yang dimiliki oleh semua vendor database lainnya. Sebagai contoh, saya bisa memasukkan data yang tidak terstruktur dalam Oracle. Saya tidak tahu bagaimana Anda bisa memasukkan data yang tidak terstruktur dan kemudian menyebutnya basis data relasional, jadi itu tidak masuk akal, tetapi Anda bisa. Dan sekarang Oracle menambahkan pecahan, jadi Oracle berkata, “Anda tahu apa? Apa pun yang diinginkan pasar, kami akan membuat penawaran basis data kami karena pasar menginginkan apa yang diinginkan pasar dan kami ingin memberikan solusi, kami ingin mereka tetap bersama kami. "
Saya pikir Anda akan melihat item tambahan. Saya tidak akan terkejut melihat pengelompokan node database seperti Hadoop tidak di rak Oracle atau aplikasi cluster nyata, tetapi pada dasarnya di lebih dari pengelompokan tipe Hadoop tradisional melakukan sharding itu. Jadi saya pikir Anda akan dapat menggunakan database seperti Oracle seperti halnya Anda menggunakan Hadoop, dan tren semacam ini akan terus berlanjut. Vendor basis data besar ini, mereka menghasilkan miliaran dolar dan mereka tidak ingin kehilangan pasar, jadi mereka bersedia beradaptasi dengan apa pun atau mengadopsi apa pun.
Eric Kavanagh: Yah, Anda tahu, itu lucu karena saya telah mengikuti vendor open-source untuk beberapa waktu dan bertanya-tanya semua itu sementara seberapa besar pengaruhnya pada teknologi tradisional pintu tertutup, dan untuk sementara itu tentu merasa seperti vendor open-source membuat kemajuan serius, dan sekarang ketika saya melihat pasar saya melihat apa yang Anda katakan, bahwa orang-orang besar telah melakukan matematika mereka, telah mengasah pensil mereka dan mereka tahu bagaimana mereka dapat menenun banyak hal itu ke dalam arsitektur mereka. Entah itu IBM, atau Oracle, atau SAP - saya baru saja di Konferensi SapphireNow bulan lalu dan Steve Lucas, yang mengepalai setengah dari perusahaan itu, membual bahwa SAP sekarang tergabung dalam platform cloud HANA mereka, lebih banyak komponen sumber terbuka daripada komponen mereka pesaing. Jika Anda menghitungnya, itu adalah pernyataan yang cukup mengesankan dan memberi tahu saya bahwa orang besar tidak akan kemana-mana dalam waktu dekat.
Bert Scalzo: Tidak, saya akan mempertaruhkan uang saya untuk keduanya. Maksud saya jika Anda melihat, stok Microsoft baru-baru ini sekitar $ 50 dan, Anda tahu, hanya beberapa tahun yang lalu pada 25. Anda tidak menggandakan harga saham Anda dalam waktu singkat kecuali Anda melakukan hal-hal yang baik dan, Anda tahu, mulai dari melakukan semuanya, mulai dari Windows 10 gratis untuk tahun pertama hingga semua hal pintar lainnya yang mereka lakukan, fitur peregangan basis data ini menurut saya fenomenal. Saya pikir apa yang akan terjadi adalah banyak orang akan berakhir di Azure, tidak secara langsung, tidak seperti yang mereka katakan, "Mari bermigrasi database saya ke Azure." Itu akan bermigrasi ke sana secara ajaib karena itu akan diarsipkan di sana menggunakan fitur peregangan basis data baru ini dan adopsi Azure akan meroket.
Eric Kavanagh: Ya, itulah salah satu tren di pasar yang bahkan dapat saya lihat, bahkan di Mac Anda. Saat Anda masuk di Mac Anda untuk menyimpan beberapa dokumen, mereka sekarang - dan Mac yang lebih baru mengikuti cloud, kan? Maksud saya, ada banyak pengertian dalam strategi itu dan saya juga melihatnya dan berkata, “Oke teman-teman, Anda mencoba untuk memikat saya sepotong demi sepotong ke lingkungan cloud Anda, dan kemudian suatu hari ketika saya ingin menonton film jika kartu kredit saya kedaluwarsa dan saya akan mendapat masalah. ”
Bert Scalzo: Ya, tetapi Anda melakukannya di Facebook.
Eric Kavanagh: Ya. Itu benar.
Bert Scalzo: Anda meletakkan semuanya di Facebook.
Eric Kavanagh: Ya, tidak semuanya.
Bert Scalzo: Tidak, maksud saya-
Eric Kavanagh: Ya, silakan.
Bert Scalzo: Tren sosial ini merambah ke bisnis. Sekarang bisnis masih memiliki banyak hal lain yang harus mereka lakukan, tetapi mereka melihat tren ini dan mereka melakukan hal-hal yang sama. Saya tidak melihat Oracle atau Microsoft pergi. Bahkan, saya akan membeli saham pada kedua setiap kali ada penurunan.
Eric Kavanagh: Ya, tentu saja. Baiklah teman-teman, buka idera.com, IDERA dot com. Seperti kata Bert, mereka memiliki banyak barang gratis di sana dan itu adalah salah satu tren baru di pasar - memberi Anda beberapa barang gratis untuk dimainkan, membuat Anda ketagihan, dan kemudian Anda pergi membeli barang-barang asli.
Teman-teman, ini telah menjadi Teknologi Panas lainnya. Terima kasih atas waktu Anda hari ini, Bert, Dez tentu saja, dan Robin juga. Kami akan berbicara dengan Anda minggu depan, teman-teman, banyak hal terjadi. Jika Anda punya ide, silakan kirim email ke alamat Anda, . Kami akan berbicara dengan Anda lain kali kawan, hati-hati. Sampai jumpa.