Yazeka
Arama sonuçlarına göre oluşturuldu
Ajan (agent), pekiştirmeli öğrenmede (reinforcement learning) ortamla etkileşime girerek öğrenen ve karar veren sistemdir 125.
Pekiştirmeli öğrenme (reinforcement learning) ise, bilgisayarların bir dizi karar vererek ve sonuçlardan öğrenerek bağımsız olarak öğrenmelerinin bir yoludur 135. Bu öğrenme şeklinde bilgisayar programları, deneme yanılma yoluyla belirli bir bağlamda en iyi eylemleri belirler ve performanslarını optimize eder 13.
Pekiştirmeli öğrenme, aşağıdaki temel unsurlara dayanır:
- Ortam (environment) 12. Bilgisayar programının içinde çalıştığı bağlamdır 1.
- Ajan (agent) 125. Ortamı keşfeden ve çevreyle etkileşime giren öğrenen veya karar vericidir 12.
- Eylem (action) 12. Ajanın çevre içinde gerçekleştirdiği hareketlerdir 1.
- Durum (state) 125. Ajanın belirli bir zamandaki mevcut durumudur 1.
- Ödül (reward) 125. Ajanın belirli bir eylem için çevreden aldığı geri bildirimdir 1.
- Politika (policy) 125. Ajanın belirli bir zamanda nasıl davranacağını belirleyen ilkedir 1.
- Değer (value) 12. Bir durum veya eylemle ilişkili potansiyel ödüller veya cezalara göre belirlenir 1.
5 kaynaktan alınan bilgiyle göre: