Yazeka
Arama sonuçlarına göre oluşturuldu
Derin pekiştirme (deep reinforcement learning), yazılımın ödül ve ceza sistemi kullanılarak zaman içinde kendini geliştirmesini sağlayan bir algoritmadır 3.
Bu yöntemde, bir makineye öğretilmek istenen her başarılı hareket için artı puan, her başarısız hareket için ise eksi puan verilir ve makine, artıları maksimize etmeyi hedefleyerek ilgili hareketi öğrenir 3.
5 kaynaktan alınan bilgiyle göre: