Buradasın
Batch size nedir?
Yazeka
Arama sonuçlarına göre oluşturuldu
Batch size, sinir ağlarının eğitiminde, her bir ileri ve geri yayılım işleminde kullanılan eğitim kayıtlarının sayısını belirleyen bir hiperparametredir 3.
Batch size'ın bazı işlevleri:
- Eğitim hızı 13. Daha büyük batch size'lar, GPU gibi donanımların paralel işleme yeteneklerini daha etkili kullanarak bir epoch (eğitim verilerinin tamamının işlenmesi) için gereken süreyi azaltabilir 13.
- Bellek kullanımı 13. Batch size, doğrudan eğitim için gereken bellek miktarını (CPU RAM veya GPU VRAM) etkiler 13.
- Model genelleştirme 13. Küçük batch size'lar, algoritmalarda kullanılan gradyan tahmininde daha fazla gürültü oluşturur 13. Bu gürültü, bazen düzenlileştirme görevi görerek modelin aşırı öğrenmeyi (overfitting) engellemesine ve daha önce görülmemiş verilere daha iyi genelleme yapmasına yardımcı olabilir 13.
- Öğrenme hızı etkileşimi 1. Batch size genellikle öğrenme hızı ile etkileşime girer 1. Genel olarak daha büyük batch size'lar, daha yüksek öğrenme hızlarından faydalanabilir 1.
5 kaynaktan alınan bilgiyle göre: