Yazeka
Arama sonuçlarına göre oluşturuldu
Pekiştirmeli öğrenme (reinforcement learning), yazılımı en iyi sonuçları elde etmek üzere kararlar vermesi için eğiten bir makine öğrenimi tekniğidir 12.
Bu öğrenme şeklinde bilgisayar programları, deneme yanılma yoluyla belirli bir bağlamda en iyi eylemleri belirler ve performanslarını optimize eder 2. Bilgisayar, eylemlerine göre olumlu veya olumsuz geri bildirim alır ve bir görevi nasıl tamamlayacağını kademeli olarak öğrenir 2.
Pekiştirmeli öğrenmenin temelinde, bir ödül sistemi aracılığıyla en uygun davranışı veya eylemi pekiştirme kavramı yatar 2.
Pekiştirmeli öğrenme, aşağıdaki temel unsurları içerir:
- Ortam (environment) 12. Bir bilgisayar programının içinde çalıştığı bağlamdır 2.
- Ajan (agent) 12. Ortamdaki öğrenen veya karar vericiyi (yani bilgisayar programını) ifade eder 2.
- Eylem (action) 12. Çevre içinde bir ajan tarafından gerçekleştirilen hareketleri ifade eder 2.
- Durum (state) 12. Ajanın belirli bir zamandaki mevcut durumudur 2.
- Ödül (reward) 12. İyi davranışı pekiştirmek için pozitif veya istenmeyen davranışı caydırmak için negatif olabilir 2.
Pekiştirmeli öğrenme, çok çeşitli gerçek dünya uygulamalarına sahiptir 2. Bunlardan bazıları şunlardır:
5 kaynaktan alınan bilgiyle göre: