• Buradasın

    Time Series Analysis'de train test split nasıl yapılır?

    Yazeka

    Arama sonuçlarına göre oluşturuldu

    Zaman serisi analizinde train-test split yapmak için şu adımlar izlenebilir:
    1. Verilerin düzenlenmesi 3. Veriler, "Özellikler" (features) ve "Hedef" (target) olarak ayrılmalıdır 3.
    2. Verilerin bölünmesi 3. Veriler, rastgele örnekleme yöntemiyle %75'i eğitim (%train) ve %25'i test (%test) seti olacak şekilde ayrılır 35.
    3. Modelin eğitilmesi 3. Model, eğitim seti üzerinde eğitilir 3.
    4. Modelin test edilmesi 3. Model, test seti üzerinde test edilir ve performansı değerlendirilir 3.
    Zaman serisi verilerinde rastgele karıştırma (shuffling) yerine kronolojik bir bölme yapılmalıdır, çünkü bu, veri sızıntısını önler 14.
    Bazı train-test split yöntemleri:
    • Rastgele bölme 3. Veriler rastgele karıştırılıp belirli yüzdelere göre bölünür 3.
    • Tabakalı bölme 3. Verilerin sınıf veya kategori oranları korunarak bölünmesini sağlar 3.
    Zaman serisi verileri için
    scikit-learn
    kütüphanesindeki
    train_test_split
    yöntemi kullanılabilir 5. Bu yöntemde
    shuffle
    parametresi
    False
    olarak ayarlanır 15. Ayrıca,
    Group K-Fold
    yöntemi de kullanılabilir; burada tarih, grup olarak belirlenir, böylece bütün günler ya eğitim ya da test setinde yer alır 1.
    5 kaynaktan alınan bilgiyle göre: