Yazeka
Arama sonuçlarına göre oluşturuldu
Zaman serisi analizinde train-test split yapmak için şu adımlar izlenebilir:
- Verilerin düzenlenmesi 3. Veriler, "Özellikler" (features) ve "Hedef" (target) olarak ayrılmalıdır 3.
- Verilerin bölünmesi 3. Veriler, rastgele örnekleme yöntemiyle %75'i eğitim (%train) ve %25'i test (%test) seti olacak şekilde ayrılır 35.
- Modelin eğitilmesi 3. Model, eğitim seti üzerinde eğitilir 3.
- Modelin test edilmesi 3. Model, test seti üzerinde test edilir ve performansı değerlendirilir 3.
Zaman serisi verilerinde rastgele karıştırma (shuffling) yerine kronolojik bir bölme yapılmalıdır, çünkü bu, veri sızıntısını önler 14.
Bazı train-test split yöntemleri:
- Rastgele bölme 3. Veriler rastgele karıştırılıp belirli yüzdelere göre bölünür 3.
- Tabakalı bölme 3. Verilerin sınıf veya kategori oranları korunarak bölünmesini sağlar 3.
Zaman serisi verileri için
scikit-learnkütüphanesindeki
train_test_splityöntemi kullanılabilir 5. Bu yöntemde
shuffleparametresi
Falseolarak ayarlanır 15. Ayrıca,
Group K-Foldyöntemi de kullanılabilir; burada tarih, grup olarak belirlenir, böylece bütün günler ya eğitim ya da test setinde yer alır 1.
5 kaynaktan alınan bilgiyle göre: