• Buradasın

    Birden Fazla Bağımlı Değişken İçin Eş Zamanlı MARS Tahmin Modeli Eğitimi

    youtube.com/watch?v=g0PPAuntpgY

    Yapay zekadan makale özeti

    • Bu video, bir eğitmen tarafından sunulan, R programlama dilini kullanarak MARS (Multivariate Adaptive Regression Splines) tahmin modeli geliştirme konulu bir eğitim içeriğidir.
    • Video, birden fazla bağımlı değişken için eş zamanlı MARS modeli oluşturma sürecini adım adım anlatmaktadır. İçerikte Mersin ilinden elde edilen veri seti üzerinde Earth paketi kullanılarak model geliştirme, parametre ayarları, model uyum iyiliği ölçütleri hesaplama ve model yorumlama teknikleri gösterilmektedir.
    • Eğitimde varyasyon katsayısı, RMS, Relative RMS, performans indeksi, belirleme katsayısı (R²), Akai bilgi kriteri gibi çeşitli model uyumluluğu testleri formüllerini ve hesaplamalarını içermektedir. Ayrıca Malik Asit, C Vitamini ve O Kumarik gibi bağımsız değişkenlerin TC değerine etkisini hesaplamak için Mars modelinin nasıl kullanılacağı da gösterilmektedir.
    00:01Birden Fazla Bağımlı Değişken İçin Eş Zamanlı MARS Tahmin Modeli
    • Birden fazla bağımlı değişken için eş zamanlı bir MARS tahmin modeli geliştirilecek.
    • Mersin ilinden elde edilen dört çeşit için fenolik bileşikler ve fitokimyasal maddelerle ilgili analiz yapılmış.
    • Literatürde birden fazla bağımlı değişken için eş zamanlı MARS çözümlemesi oldukça az olduğu için bu çalışma literatür boşluğunu doldurmak amacıyla yapılmış.
    02:02Veri Setinin Hazırlanması
    • Veri seti "mersin yeni" adıyla kaydedilmiş ve R komut dosyasında "mars data" olarak tanımlanmış.
    • Veri setindeki değişkenlerin isimleri birinci satırda olduğu için "header = TRUE" parametresi kullanılmış.
    • MARS çözümlemesi yapabilmek için "library(earth)" paketi çağrılmalıdır.
    04:00MARS Modelinin Oluşturulması
    • Birden fazla bağımlı değişken için "cbind" komutu kullanılarak bağımlı değişkenler tanımlanmış.
    • "penalty = -1" ve "prune.misclassification = TRUE" parametreleri ile istenen terim sayısı ayarlanabilir.
    • "degree = 2" parametresi ile interaksiyon içeren terimler elde edilebilir.
    06:23Model Parametreleri ve Sonuçlar
    • "pmethod = backward" parametresi ile gereksiz terimlerin eleminasyonu sağlanmış.
    • "nk = 50" parametresi ile budama işlemi öncesinde olması gereken maksimum terim sayısı 50 olarak ayarlanmış.
    • "nfold = 3" parametresi ile cross validation işlemi yapılmış, büyük veri setleri için 10 alınması önerilmiştir.
    08:27Model Sonuçlarının Değerlendirilmesi
    • Her bir bağımlı değişken için tahmin denklemi elde edilmiş.
    • Cross validation R-square değerleri incelenmiş ve en iyi sonuç 0.94 ile elde edilmiş.
    • Budama işlemi öncesinde 8 terim olan modelden 2 terim çıkarılarak 6 terimli en iyi sonuç elde edilmiş.
    11:01Modelin Yorumlanması
    • MARS çözümlemesi birden fazla bağımlı değişkeni eş zamanlı şekilde tahmin etmeyi sağlıyor.
    • Malik asitin etkisinin o kumarik içeriğine bağlı olduğu interaksiyon etkisi tespit edilmiş.
    • MARS, doğrusal olmayan ilişkileri modelleme konusunda katkı sağlıyor.
    13:24Önemli Bağımsız Değişkenlerin Belirlenmesi
    • "evimp" fonksiyonu ile önemli bağımsız değişkenlerin nispi önem dereceleri belirlenmiş.
    • O kumarik içeriği %100, C vitamini %76.2 ve malik asit %6.91 öneme sahip bulunmuş.
    15:08Mars Veri Seti ve Örnek Genişliği
    • Mars veri setindeki gözlem sayısı (sample size) belirlenmek için "length" komutu kullanılabilir.
    • Mars çözümlemesi için eksik gözlem (missing data) olmaması gerekmektedir.
    • Veri setinde her değişken için aynı sayıda gözlem bulunur, örneğin 12 gözlem vardır.
    17:37Mars Çözümlemesi ve Budama İşlemi
    • "k" değeri, budama işlemi (pruning) sonrası geriye kalan terim sayısını ifade eder.
    • "demet$" komutu ile Mars çözümlemesi yapılır ve seçenekler arasından "selected terms" seçilir.
    • Budama işlemi sonrası kalan terim sayısı, "k" değeri olarak tanımlanır.
    19:14Tahmin Değerlerinin Hesaplanması
    • Birden fazla bağımlı değişken olduğunda, tahmin değerlerini saklamak için bir data frame (veri dosyası) tanımlanması gerekir.
    • "demet$fit.values" komutu ile bağımlı değişkenlerin tahmin edilen değerleri (predicted values) elde edilir.
    • Data frame içinde her bir bağımlı değişken için tahmin değerleri saklanır.
    21:24Gerçek Değerlerle Tahmin Değerleri Arasındaki Fark
    • Uyum iyiliği ölçütlerini hesaplamak için gerçek değerlerle tahmin edilen değerler arasındaki fark (hata değerleri) hesaplanmalıdır.
    • "error_tac" ve "error_qrs" komutları ile tannin ve quercetin için hata değerleri hesaplanır.
    • Hata değeri, gerçek değerlerle tahmin edilen değerler arasındaki farktır.
    24:15Korelasyon Değerlerinin Hesaplanması
    • Gerçek değerlerle tahmin edilen değerler arasındaki doğrusal ilişkiyi ölçmek için Pearson korelasyon katsayısı hesaplanır.
    • "cor.test" komutu ile korelasyon değeri ve hipotez testi yapılır.
    • Korelasyon değeri 0.99 ve p-değeri 5.18×10^-16 olarak bulunur, bu da gerçek değerlerle tahmin edilen değerler arasındaki ilişkiyi önemli gösterir.
    29:14Standart Sapma Oranı ve Uyum İyiliği
    • Standart sapma oranı (SD ratio) hesaplanarak modelin uyum iyiliği değerlendirilir.
    • Tannin için SD ratio 0.4, quercetin için ise 0.3 olarak bulunur.
    • SD ratio değeri 0.10'dan düşük olan modeller, standart sapma bakımından iyi uyum değerine sahiptir.
    31:11Model Performansı Değerlendirme Kriterleri
    • Varyasyon katsayısı (R²) ne kadar düşükse modelin çalışması daha sağlıklı olur ve tahmin performansı daha yüksektir.
    • RMS (Root Mean Square) hatası, hata terimlerinin karelerinin ortalamasının kareköküdür ve ne kadar düşük olursa o kadar iyidir.
    • Relative RMS, gerçek değerler ile tahmin değerleri arasındaki farkı hesaplar ve modelin performansını değerlendirmek için kullanılır.
    37:21Farklı Uyum İndeksleri
    • Performans indeksi ne kadar yüksekse o kadar iyi olur ve farklı uyum testleri daha informatif sonuçlar sunar.
    • Korelasyon katsayısı, gerçek değerlere tahmin edilen değerler arasındaki ilişkiyi gösterir.
    • Hata terimlerinin ortalaması sıfır olmalıdır, bu da modelin doğru çalıştığını gösterir.
    39:45Belirleme Katsayıları ve Diğer Ölçütler
    • R² (belirleme katsayısı) tek başına geçerli bir ölçüt değil, düzeltilmiş R² (adjusted R²) de verilmelidir.
    • Modifiye edilmiş relative yaklaşık hata, hata terimlerinin karesi ve gerçek değerlerin karesi üzerinden hesaplanır.
    • MAP (ortalama mutlak oransal hata) ve MAD (ortalama mutlak sapma) da model performansını değerlendirmek için kullanılan kriterlerdir.
    45:53Model Karşılaştırma Kriterleri
    • Akaike bilgi kriteri (AIC), ne kadar küçük olursa modelin tahmin performansı ve açıklayıcılığı o kadar iyidir.
    • Farklı modelleri karşılaştırmak için AIC gibi kriterler kullanılır.
    • Normal R² ile düzeltilmiş R² arasındaki farkın çok az olması modelin daha iyi olduğunu gösterir.
    47:37Model Yorumlanması
    • Tahmin denklemleri, fitokimyasal parametreleri ölçen HPLC cihazından elde edilen verilerle oluşturulur.
    • Ölçüm için kullanılan alet ve ekipmanın sonuçlara olan etkisi oldukça önemlidir.
    • Eş zamanlı iki tahmin denklemi modelin doğruluğunu artırmaktadır.
    48:32MARS Modeli ve Response Surface Analizi
    • MARS modeli birden fazla bağımlı değişkende kullanılabilir ve response surface metodunda elde edilen sonuçlar için de uygulanabilir.
    • Response surface analizi optimizasyon yapmamızı sağlar.
    • MARS modelinin en önemli özelliği birden fazla bağımlı değişkeni aynı temel fonksiyonlar üzerinden çözümleme yapmasıdır.
    50:44MARS Modeli Uygulaması
    • MARS modelinde TC değeri 8,49 olarak regresyon sabiti olarak düşünülmektedir.
    • Modelde interaksiyon terimleri bulunmaktadır ve derece 2 olarak tanımlanmıştır.
    • MARS modelinde bağımlı değişkenlerin tahmin edilen değerleri hesaplanabilir.
    53:04Tahmin Değerleri Hesaplama
    • Malik asit 2, C vitamini 20 ve o kumarin 0,5 olan bir çeşidin TC değeri hesaplanmaktadır.
    • Hesaplama sırasında maksimum fonksiyonu kullanılarak değerler belirlenmektedir.
    • Hesaplama sonucunda TC değeri 8,85 olarak bulunmuştur.

    Yanıtı değerlendir

  • Yazeka sinir ağı makaleleri veya videoları özetliyor