Buradasın
İnsan geri bildirimiyle güçlendirilmiş öğrenme nedir?
Yazeka
Arama sonuçlarına göre oluşturuldu
İnsan geri bildirimiyle güçlendirilmiş öğrenme (RLHF), yapay zeka (YZ) modellerini daha insan odaklı hale getirmek için kullanılan bir makine öğrenimi tekniğidir 15.
Bu yöntem, pekiştirmeli öğrenme (RL) paradigmasını insan geri bildirimiyle birleştirerek YZ'nin şu özellikleri öğrenmesini sağlar:
- Faydalı: Kullanıcılara yardımcı olacak çıktılar üretmek 1.
- Zararsız: Zararlı veya etik olmayan içerik üretmekten kaçınmak 14.
- Dürüst: YZ'nin niyet ve tercihlerine uygun davranışlar sergilemek 1.
RLHF süreci genellikle şu adımları içerir:
- İlk model eğitimi: YZ modeli, insan eğitmenlerin sağladığı etiketli örneklerle denetimli öğrenme yöntemiyle eğitilir 2.
- İnsan geri bildirimlerinin toplanması: Modelin performansı hakkında geri bildirim sağlamak için insan değerlendiriciler, modelin ürettiği çıktıları kalite, yardımseverlik veya zararsızlık gibi kriterlere göre sıralar 12.
- Ödül modeli eğitimi: İnsan geri bildirim verileri, hangi çıktının insan tarafından daha çok tercih edileceğini tahmin eden bir ödül modeli oluşturmak için kullanılır 12.
- Pekiştirmeli öğrenme: Orijinal YZ modeli, ödül modeli tarafından sağlanan ödül sinyali kullanılarak pekiştirmeli öğrenme yöntemiyle ince ayar yapılır 12.
5 kaynaktan alınan bilgiyle göre: