Rumah Audio Apa itu deteksi outlier? - definisi dari techopedia

Apa itu deteksi outlier? - definisi dari techopedia

Daftar Isi:

Anonim

Definisi - Apa yang dimaksud dengan Deteksi Outlier?

Deteksi outlier adalah proses mendeteksi dan kemudian mengeluarkan outlier dari set data yang diberikan.

Pencilan dapat didefinisikan sebagai bagian dari data atau observasi yang menyimpang secara drastis dari norma atau rata-rata yang ditetapkan dari kumpulan data. Pencilan dapat disebabkan hanya karena kebetulan, tetapi juga menunjukkan kesalahan pengukuran atau bahwa kumpulan data yang diberikan memiliki distribusi berekor berat.

Berikut ini adalah skenario sederhana dalam deteksi outlier, proses pengukuran secara konsisten menghasilkan pembacaan antara 1 dan 10, tetapi dalam beberapa kasus yang jarang terjadi, kami mendapatkan pengukuran lebih dari 20.

Pengukuran langka ini di luar norma disebut outlier karena mereka "berada di luar" kurva distribusi normal.

Techopedia menjelaskan Deteksi Outlier

Sebenarnya tidak ada metode matematika standar dan kaku untuk menentukan pencilan karena sangat bervariasi tergantung pada set atau populasi data, sehingga penentuan dan deteksi pada akhirnya menjadi subyektif. Melalui pengambilan sampel kontinu dalam bidang data yang diberikan, karakteristik pencilan dapat ditetapkan untuk membuat deteksi lebih mudah.

Ada metode berbasis model untuk mendeteksi pencilan dan mereka menganggap bahwa semua data diambil dari distribusi normal dan akan mengidentifikasi pengamatan atau poin, yang dianggap tidak mungkin berdasarkan rata-rata atau standar deviasi, sebagai pencilan. Ada beberapa metode untuk deteksi outlier:

  • Grubb's Test for Outliers - Ini didasarkan pada asumsi bahwa data berdistribusi normal dan menghilangkan satu pencilan pada suatu waktu dengan pengujian yang diulangi sampai tidak ada pencilan yang ditemukan.
  • Dixon's Q Test - Juga berdasarkan normalitas set data, metode ini menguji data yang buruk. Telah dicatat bahwa ini harus digunakan hemat dan tidak pernah lebih dari sekali dalam satu set data.
  • Kriteria Chauvenet - Ini digunakan untuk menganalisis apakah outlier palsu atau masih dalam batas-batas dan dianggap sebagai bagian dari set. Deviasi rata-rata dan standar diambil dan probabilitas bahwa outlier terjadi dihitung. Hasil akan menentukan apakah itu harus dimasukkan atau tidak.
  • Kriteria Pierce - Batas kesalahan ditetapkan untuk serangkaian pengamatan, di luar semua pengamatan akan dibuang karena mereka sudah melibatkan kesalahan besar.
Apa itu deteksi outlier? - definisi dari techopedia