Rumah Ini Bisnis Cara memelihara ilmuwan data

Cara memelihara ilmuwan data

Anonim

Di antara startup teknologi, ilmuwan data adalah istilah yang semakin umum digunakan untuk merujuk pada data Geeks yang mampu menjembatani area fungsional intelijen data yang terpisah secara tradisional. Ilmuwan data adalah seseorang yang nyaman melakukan beberapa aspek proyek intelijen data (jika tidak semua):

  1. Akuisisi Data: Ini mungkin memerlukan penulisan parser khusus dan perayap web atau skrip yang menargetkan layanan web atau API tertentu untuk sumber data non-tradisional.
  2. Manajemen Data: ETL, memanipulasi, meminta dan memelihara data dalam database, penyimpanan nilai kunci, atau Hadoop.
  3. Visualisasi Informasi: Mengungkap pola melalui penggunaan perangkat visualisasi statis dan / atau platform interaktif berdasarkan Flash, JavaScript, atau Pemrosesan.
  4. Analisis: Ini dapat berkisar dari teknik sederhana hingga rumit dalam statistik multivarian, pembelajaran mesin, dan NLP.
  5. Wawasan: Mengekstrak, merangkum, dan menyajikan temuan-temuan utama kepada khalayak luas.

Ada banyak alat, keterampilan, dan rincian teknis, dan seseorang dapat menghabiskan waktu bertahun-tahun untuk menguasai setiap item yang tercantum di atas. Sementara seorang ilmuwan data mungkin tidak memiliki pengetahuan ahli sejati di bidang mana pun, ia merasa nyaman untuk bolak-balik dan melakukan tugas-tugas dasar di semua bidang tersebut. Hasilnya adalah geek data yang cukup gesit untuk dengan cepat menyelidiki proyek data dan menghasilkan jawaban atas pertanyaan (tingkat tinggi) dari manajemen. (tentang para ilmuwan data dalam Ilmuwan Data: Bintang-bintang Rock Baru di Dunia Teknologi.)

Untuk memelihara data ilmuwan, perusahaan perlu lebih fokus pada budaya dan struktur organisasi. Banyak pekerja data memiliki keterampilan dan pelatihan yang cukup untuk dengan cepat menjadi produktif di berbagai bidang kecerdasan data. Masalahnya adalah kebanyakan dari mereka tidak bekerja di lingkungan yang mendorong mereka untuk menjadi ilmuwan data. Mereka terjebak dalam silo dan terbatas pada satu atau dua area kecerdasan data. Seringkali, mereka dibatasi untuk menggunakan alat yang "disetujui" oleh manajer mereka.

Cara memelihara ilmuwan data