Rumah Pengembangan Apa itu pembelajaran penguatan? - definisi dari techopedia

Apa itu pembelajaran penguatan? - definisi dari techopedia

Daftar Isi:

Anonim

Definisi - Apa yang dimaksud dengan Belajar Penguatan?

Pembelajaran penguatan, dalam konteks kecerdasan buatan, adalah jenis pemrograman dinamis yang melatih algoritma menggunakan sistem penghargaan dan hukuman.

Algoritma pembelajaran penguatan, atau agen, belajar dengan berinteraksi dengan lingkungannya. Agen menerima hadiah dengan melakukan dengan benar dan hukuman untuk melakukan yang salah. Agen belajar tanpa intervensi dari manusia dengan memaksimalkan hadiahnya dan meminimalkan hukumannya.

Techopedia menjelaskan Pembelajaran Penguatan

Pembelajaran penguatan adalah pendekatan pembelajaran mesin yang terinspirasi oleh psikologi behavioris. Ini mirip dengan bagaimana seorang anak belajar untuk melakukan tugas baru. Penguatan pembelajaran kontras dengan pendekatan pembelajaran mesin lainnya dalam hal algoritma tidak secara eksplisit diberitahu bagaimana melakukan tugas, tetapi bekerja melalui masalah sendiri.

Sebagai agen, yang bisa berupa mobil yang bisa mengemudi sendiri atau program bermain catur, berinteraksi dengan lingkungannya, menerima status hadiah tergantung pada bagaimana kinerjanya, seperti mengemudi ke tujuan dengan aman atau memenangkan permainan. Sebaliknya, agen menerima penalti karena melakukan kesalahan, seperti keluar dari jalan atau sedang skakmat.

Agen dari waktu ke waktu membuat keputusan untuk memaksimalkan ganjarannya dan meminimalkan denda menggunakan pemrograman dinamis. Keuntungan dari pendekatan kecerdasan buatan ini adalah bahwa hal itu memungkinkan program AI untuk belajar tanpa seorang programmer menjelaskan bagaimana agen harus melakukan tugas.

Apa itu pembelajaran penguatan? - definisi dari techopedia