Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, bir eğitmen tarafından sunulan istatistiksel modelleme ve programlama eğitimidir. Eğitmen, R ve MATLAB programlama dillerinde istatistiksel analiz uygulamalarını göstermektedir.
- Video üç ana bölümden oluşmaktadır: İlk bölümde R'de Mars (Multivariate Adaptive Regression Splines) regresyon analizi uygulaması, veri setinin yüklenmesi ve farklı derecelerde model oluşturma gösterilmektedir. İkinci bölümde Mars modelinin derece ayarlaması, interaksiyonların yapılandırılması ve modelin performansını değerlendirmek için istatistiksel ölçüleri hesaplama anlatılmaktadır. Son bölümde ise MATLAB'da script kullanımı, fonksiyonlar ve matematiksel işlemler gösterilmektedir.
- Eğitim içeriğinde laktasyon süt verimi, hız laktasyon periyodu gibi değişkenler kullanılarak Mars regresyon analizi yapılmakta ve modelin uyum iyiliğini artırmak için cross validation, penalty değeri ve eleminasyon yöntemleri gibi parametreler ayarlanmaktadır. Ayrıca MATLAB'da "maximum" fonksiyonu kullanımı, desimal sayıları yönetme ve sonuçları yorumlama konuları da ele alınmaktadır.
- 00:01R'de Mars Uygulaması Tanıtımı
- Videoda farklı dereceli Mars uygulamaları yapılacak ve regresyon problemi kapsamında Zoe tekniği ile ilgili bir veri seti üzerinde farklı tunik parametreleri kullanılacak.
- Mars işlemini yapmadan önce Earth paketi ve Mars ile ilgili ilişkin ört paketi yüklenmesi gerekiyor.
- 00:53Veri Setinin Tanıtımı
- Veri seti "df" olarak tanımlanmış ve "read table" fonksiyonu ile "d'nin doktora veriler klasörleri içerisinde lm.txt" dosyasından okunmuş.
- Veri seti 7 değişken ve 133 gözlemden oluşan, 133 x 7 boyutunda bir matris şeklinde düşünülebilir.
- Veri setinde laktasyon süt verimi, laktasyon periyodu, ilk yıl ortalama günlük süt verimi, bir periyotta maksimum süt verimi, servis periyodu, ilk buzağı yaşı ve gebelik süresi değişkenleri bulunuyor.
- 03:04Veri Setinin İstatistiksel Özellikleri
- Araştırmacılar veri setindeki değişkenlerin tanıtıcı istatistiklerini merak edebilir.
- Laktasyon süt verimi minimum 4507 litre, maksimum 9865 litre, ortalama 6728 litre, medyan 6586 litre, birinci çeyrek 5836 litre ve üçüncü çeyrek 7537 litre olarak belirtiliyor.
- 04:06Mars Modelinin Oluşturulması
- Mars modeli oluşturmak için "mars" fonksiyonu kullanılıyor ve bağımlı değişken olarak laktasyon süt verimi belirleniyor.
- Birinci derece model için "degree=1", "cross.validation=10", "max.terms=200", "pruning=backward" ve "penalty=2" parametreleri ayarlanıyor.
- "penalty=2" seçeneği, modelin komplekslik derecesine esas alınarak aşırı uyumluluk problemini dengeliyor.
- 08:12Birinci Derece Modelin Sonuçları
- Birinci derece model için "mars1" adında bir çözüm oluşturuluyor ve virgülden sonra 3 haneli, stil olarak maksimum değer seçiliyor.
- Model 12 terim üretmiş ancak bunlardan 7'sini dikkate almış, 5 terimini modelden çıkarmış.
- Modelin GCV değeri 35.982, R-square değeri 0,91, R-squared değeri 0,976,6000000000000000000000000000000000000,57 değerinde.
- 10:53İkinci Derece Modelin Oluşturulması
- İkinci derece model için "degree=2" parametresi kullanılarak "mars2" adında bir çözüm oluşturuluyor.
- İkinci derece model, birinci derece interaksiyonlu bir model olarak düşünülüyor çünkü doğada genellikle birden fazla faktörün ortak etkisi olduğu düşünülüyor.
- İkinci derece modelde GCV değeri 35.982'den 7288'e düşmüş, bu da bir iyileşme olarak değerlendiriliyor.
- 12:01Mars Modelinin Derecesi Belirlenmesi
- İkinci derece bir modelde maksimum fonksiyon veya a çarpı b tarzında ikili interaksiyonların bulunduğu terimler bulunmalıdır.
- Derece üç Mars modelinde ikinci derece interaksiyonlar aktive edilir ve a çarpı b çarpı c şeklinde üçlü bir yapı oluşur.
- Derece dört Mars modelinde a çarpı b çarpı c çarpı d şeklinde dörtlü bir yapı oluşması gerekirken, uygun derece üç olarak belirlenir.
- 17:05Modelin Değerlendirilmesi
- Mars üç modelinde yıl ortalama %101, laktasyon periyodu %73,20, servis periyodu %18 civarı ve gebelik süresi %8,30'luk bir önem derecesi elde edilir.
- Gerçek değerlerle tahmin edilen değerler arasında neredeyse %1'e yakın bir korelasyon bulunur.
- RMS (karekök içerisinde ortalama hata değerleri) değeri 51,15 olarak hesaplanır ve SD ratio (standart sapma oranı) 0,6 olarak bulunur.
- 24:38Modelin Grafiksel Analizi
- Pilot Mars üç modelinde laktasyon periyodu arttıkça belli bir noktaya kadar süt verimi artar ve 365 değerine karşılık gelen bir kırılma değeri vardır.
- GRSQ grafiğinde modelin açıklayıcı gücü gösterilir ve cross validation karenin arasındaki farkın en düşük olduğu kısım on terimde elde edilir.
- Verilerin oldukça büyük olduğu, binlerle ikibinlerle üçbinlerle az önce dokuzbinbeşyüz (on tona kadar) bir değer içerdiği belirtilir.
- 28:30Mars Uygulamasında Script Kullanımı
- Kullanıcı, bir script (art arın komut) oluşturarak toplu işlem yapabileceğini gösteriyor.
- Script yazıldıktan sonra "run" butonuna basarak modeli elde edebiliyor.
- Modelin farklı stilini çıkararak farklı sonuçlar elde edilebiliyor.
- 29:37Fonksiyon Değişiklikleri ve Sonuçlar
- "Maximum" fonksiyonunun yerine "maximum(0, lp-365)" şeklinde değişiklik yapılabiliyor.
- Dijital değerlerin hassasiyeti ayarlanarak sonuçlar incelenebiliyor.
- Sonuçların 4507 litre ile 9865 litre arasında değiştiği belirtiliyor.
- 31:01Dersin Sonu
- Bugünkü dersin bu kadar olduğu ve bir sonraki derste farklı Mars uygulamalarının anlatılacağı söyleniyor.
- İzleyicilere iyi günler ve iyi çalışmalar dileniyor.