• Buradasın

    Zaman Serisi Analizi ve R Programlama Eğitimi

    youtube.com/watch?v=2J02Biqvvt0

    Yapay zekadan makale özeti

    • Bu video, bir eğitmen tarafından sunulan, Arda ve Erkan Agaslan gibi katılımcıların da yer aldığı kapsamlı bir eğitim içeriğidir. Eğitmen, zaman serisi analizi ve R programlama dilini kullanarak ekonometrik modelleri uygulama konusunda bilgi aktarmaktadır.
    • Video, zaman serisi analizinde kullanılan temel teknikleri adım adım göstermektedir. İçerik, mevsimsellik testi, mevsimsellikten ayrılma, birim kök testi (ADF testi), durağanlık analizi, VAR (Vektörel Otoregresyon) modeli, etki-tepki fonksiyonları ve grafik oluşturma tekniklerini kapsamaktadır. Özellikle Gayri Safi Milli Hasıla (GSİH) ve Cari Açık (CA) gibi ekonomik seriler üzerinde örnekler verilmektedir.
    • Eğitim, R programlama dilinde kullanılan çeşitli kütüphaneleri (adf, udf, cips, corplot, ggplot2) ve fonksiyonları detaylı olarak göstermektedir. Ayrıca, Google Colab platformunun kullanımı, veri bilimi kaynakları ve programlama için ipuçları da paylaşılmaktadır. Video, bir kitap projesi kapsamında hazırlanmış içeriklerin devamı niteliğindedir ve sonunda katılımcılara teşekkür edilerek sona ermektedir.
    00:03Zaman Serisi Veri Analizi Özet
    • Dersin önceki bölümünde zaman serisi verisi Excel'den alınarak R'de dataframe'e aktarılmış, sütun isimleri değiştirilmiş ve zaman serisi değişkenleri olarak kaydedilmiştir.
    • Verilerin mevsimsel etkileri için mevsimsel grafikler incelenmiş ve mevsimsellik testi yapılmış, test sonucunda her iki değişken için mevsimsellik tespit edilmiştir.
    • Mevsimsellikten ayrılma (travmasit) işlemi yapılarak yeni değişkenler oluşturulmuş ve bu değişkenlerin durağanlığı test edilmesi gerektiği belirtilmiştir.
    02:19Durağanlık Testi
    • Durağanlık testi için ADF (Augmented Dickey-Fuller) testi kullanılacak ve bu test üç farklı analiz türüne dayanmaktadır: hem trend hem sabit terim olan, sadece sabit terim olan ve hiçbir terim olmayan.
    • Verinin ortalaması sıfırsa en genel model kullanılabilir, ortalamadan farklıysa özele doğru gidilerek önce trend sonra sabit terim test edilmelidir.
    • ADF testi için iki farklı kütüphane bulunmaktadır: "urca" ve "tseries", ancak "urca" kütüphanesindeki "ur.df" fonksiyonu daha detaylı sonuçlar sunmaktadır.
    04:51ADF Testi Uygulaması
    • "ur.df" fonksiyonunun argümanları: zaman serisi değişkeni, model türü (trend, sabit terim veya hiçbiri), maksimum gecikme sayısı ve seçici kriterdir.
    • Seçici kriter olarak AIC (Akaike Information Criterion) kullanılabilir, bu kriter en küçük gecikmeyi verir ve daha cimri (parsimonious) model kullanmayı sağlar.
    • ADF testi sonuçlarını daha sonra kolayca hatırlayabilmek için, her testin sonucunu ayrı değişkenlere atamak önemlidir.
    09:49ADF Testi ve Model Seçimi
    • ADF testi için model türü seçimi yapılır: trend için 3, drift için 2 model seçilir.
    • Gecikme sayısı 12 olarak belirlenir çünkü 3 yıldan geriye gitmek isteniyor.
    • Akai kriteri kullanılarak ADF testi çalıştırılır.
    10:28ADF Testi Sonuçları
    • ADF testi 10 gecikmeye kadar en uygun gecikmeyi bulur ve test istatistiğini verir.
    • Test sonucunda GSYİH mevsimsellikten arındırılmış serisi durağan olmadığı (%5 anlamlılık düzeyinde) tespit edilir.
    • Trend değişkeni anlamsız olduğu için trend terimi modelden çıkarılır.
    12:05Drift Modeli ve Fark Alma
    • Drift modeli için ADF testi tekrar çalıştırılır ve sabit terimi anlamlı olduğu görülür.
    • Sabit terim anlamlı olduğunda fark alma işlemi yapılmalıdır.
    • Arda'da fark alma işlemi "diff" komutu ile yapılır: "diff(gsmh, 1)" komutu ile birinci fark alınır.
    15:07Farklı Model Uygulamaları
    • ADF testi üç farklı model için sırasıyla uygulanacaktır.
    • Trend modeli için ADF testi tekrar çalıştırılır.
    • Test komutu: "adf.test(d1, k=12, type="drift")" şeklinde çalıştırılır.
    16:04Durağanlık Testi ve Fark Alma İşlemi
    • Trendy programı çalıştırılarak trendin özet istatistikleri inceleniyor ve anlamlı trend bulunuyor.
    • Gayri safi milli hasıla serisinin bir farkı alınmasına rağmen hala durağan olmadığı tespit ediliyor.
    • Mevsimsellikten arındırma işleminde serinin karakteristiği bozulmuş olabilir, normalde GSYİH serisinin I(1) çıkması beklenirken I(2) olmuş.
    17:00İkinci Fark Alma İşlemi
    • Serinin hala durağan olmadığını anlamak üzerine ikinci fark alınması kararlaştırılıyor.
    • İkinci fark alınan seriye bakıldığında, ADF testine ağlarla çalışması için ilk iki gözlem atılması gerekiyor.
    • Vektörde satır aralığı belirlemek için köşeli parantez içinde sol taraf satırları, sağ taraf sütunları veriliyor.
    18:47İkinci Farklı Serinin Durağanlık Testi
    • İkinci fark alınan seri için ADF testi tekrar uygulanıyor.
    • İkinci fark alınan seriye bakıldığında, artık serinin durağan olduğu tespit ediliyor.
    • Grafikte durağan bir görüntü oluştuğu ancak ortalama çizgisinden uzaklaşan noktalar olduğu için tamamen durağan olmadığı belirtiliyor.
    21:50Cari Açık Serisi İçin Durağanlık Testi
    • Cari açık serisi için de aynı işlemlerin yapılması gerektiği belirtiliyor.
    • ADF testi trend içeren bir model için uygulanıyor.
    • Serinin durağan olup olmadığı için özet istatistiklere bakılıyor.
    22:12Durağanlık Testi ve Sonuçları
    • Serinin durağan olup olmadığına bakılıyor ve test istatistiği %10'dan çok büyük olduğu için seride trend olmadığı anlaşılıyor.
    • Trend ve drift (sabit terim) için yapılan testlerde sabit terim anlamlı çıkıyor ancak serinin durağan olmadığı tekrar belirleniyor.
    • Gözle durağan gibi görünen serilerin istatistiksel testlerle incelenmesi gerektiği vurgulanıyor.
    23:43Serinin Farkının Alınması
    • Serinin durağan olmadığı tespit edildiğinde, serinin birinci farkının alınması gerektiği belirtiliyor.
    • Fark alınan seride üç farklı model (trend, drift, none) deneniyor ancak trend anlamsız çıkıyor.
    • Sabit terim anlamsız çıkmasına rağmen, iktisadi serilerin ortalaması sıfır olmadığı için sabit terimler atılamıyor.
    26:19Durağanlık Sonucu ve Öğrenilenler
    • Fark alınan seride test istatistiği %1'den bile küçük çıkarak durağan olduğu belirleniyor.
    • ADF testini çağırmak, drift ve trend kullanımını, grafiği çizmek ve yorum yapmak öğr. edildiği vurgulanıyor.
    • VAR analizi için durağan değişkenlerin kullanılması gerektiği, aynı dereceden durağan olmaları genellikle tercih edildiği belirtiliyor.
    27:40Zaman Serisi Analizi ve Gecikme Uzunluğu
    • Otomatikman ortak vektörleri alıp gecikme uzunluklarını analiz ediyor, ancak bu durumda iki serinin uzunlukları eşit değil.
    • Gecikme uzunlukları eşit olmadığı için, bir seriden bir gözlem atılması gerekiyor.
    • Değişkenin adını yazdıktan sonra köşeli parantez kullanılarak içinde kalınmasını istenen gözlemler seçilir.
    29:10Veri Ön İşleme ve Var Modeli Hazırlama
    • Var modelinde girecek değişkenlerin kombine edilip tek bir matrise verilmesi gerekiyor.
    • Var modeli için kol fonksiyonu kullanılarak sütunların adları atanıyor.
    • Verinin uzunluğu önemli değil, önemli olan düzenli giden bir frekans olması ve belirli bir aydan başlamasıdır.
    31:54Korelasyon Analizi
    • İki değişken için korelasyon analizi yapmak için corvar fonksiyonu kullanılıyor.
    • Cips fonksiyonu hem korelasyonu hem de serpilme diyagramını (scatter plot) veriyor.
    • Corvar fonksiyonu korelasyon değerini gösterir ve değer sıfırın altındaysa kutucuk mavi renkte olur.
    33:27Var Modeli İçin Gecikme Uzunluğu Belirleme
    • Var modeli için önce değişkenler durağan hale getiriliyor.
    • Var modelinde gecikme uzunluğu belirlenirken Akaike, Schwartz ve Hannan-Queen kriterleri kullanılıyor.
    • Varselect fonksiyonu kullanılarak gecikme uzunluğu seçiliyor ve sabit terimli model tercih ediliyor.
    35:43Gecikme Uzunluğunu Belirleme
    • Gecikme uzunluğu belirlenmek için "varselect" fonksiyonu kullanılıyor.
    • Fonksiyona değişkenlerin matrisi, sabit terim, maksimum gecikme sayısı (12) ve diğer parametreler veriliyor.
    • Gecikme uzunluğu 4 olarak belirlendi ve bu sonuç Schwarz kriterine göre minimum değer bulduğu için seçildi.
    39:24VAR Modelinin Tahmini
    • VAR modeli tek başına yorumlanabilir bir model değil, iktisadi temeli olmadığı için sistem birliği içinde çalışmak gerekir.
    • VAR modelinden etki-tepki fonksiyonlarına geçilerek değişkenler arasındaki etkileşimler incelenecek.
    • VAR modeli tahmin edildikten sonra "varforecast" fonksiyonu kullanılarak tahmin sonuçları elde edilebilir.
    43:00Etki-Tepki Fonksiyonlarının Hesaplanması
    • Etki-tepki fonksiyonları için "irf" fonksiyonu kullanılıyor ve tahmin edilen VAR modeli argüman olarak veriliyor.
    • Fonksiyona etki eden değişken (milli gelir), etkilenen değişken (cari açık) ve tahmin sayısı (20) gibi argümanlar veriliyor.
    • Bootstrap yöntemi kullanılarak 1000 kez deneme yapılarak etki-tepki fonksiyonları hesaplanıyor.
    44:39Etki Tepki Fonksiyonları
    • Etki tepki fonksiyonları, milli gelir değişkeninde bir standart sapmalık şok verildiğinde cari açıkın nasıl tepki verdiği gösterir.
    • Grafikte ilk dönemde pozitif tepki, sonra azaltıcı etki ve tekrar yükseltme şeklinde bir döngü görülür, ancak anlamlı tepkiler elde edilemedi.
    • Sistem çok yavan olduğu için etki tepki fonksiyonları yorumlanabilir bir grafik vermedi.
    46:16Etki Tepki Sonuçlarını Dışa Aktarma
    • Etki tepki sonuçları konsola veya inline olarak gösterilebilir.
    • Grafikleri dışa aktarmak için "export" ve "copy to clipboard" seçenekleri kullanılabilir.
    • Çözünürlük ayarları manuel olarak girilebilir ve sistem uygun çözünürlük değerini otomatik olarak belirler.
    47:51Varyans Ayrıştırması
    • Varyans ayrıştırması için "fvde" komutu kullanılır ve tahminin varyans ayrıştırması yapılır.
    • Varyans ayrıştırmasında, açıklayıcı değişkenlerin tahmin edilen değişkenin varyansını ne kadar açıklediği gösterilir.
    • Bu analiz, iktisadi yorumlamalar yerine sadece arda nasıl yapıldığını göstermek için kullanılır.
    51:26GGPlot Kütüphanesi ile Grafik Oluşturma
    • GGPlot kütüphanesi, her argümandan sonra artı ile devam eden katmanlar üzerinden grafik oluşturmaya yarar.
    • GGPlot ile grafik oluşturmak için önce kütüphaneyi çağırıp, sonra ggplot fonksiyonunu kullanmak gerekir.
    • Estetik (aes) argümanı, x ve y koordinatlarını belirlemek için kullanılır ve her katman diğerini örtmeden eklenir.
    55:42R Grafik Yapısı ve Özellikleri
    • R programında grafik yapısı ve özelliklerinin değiştirilmesi gösterilmektedir.
    • Grafik rengi ve kalınlığı değiştirilebilmektedir.
    • Grafikte katmanlar oluşturulabilir, her katman bir önceki katmanın üzerine eklenir.
    56:16Zaman Serisi Grafiklerinde Nokta Gösterimi
    • Zaman serisi grafiklerinde çizgi kullanıldığında gözlem noktalarını tespit etmek zordur.
    • Noktalar eklenerek hangi gözlem noktalarının grafiği oluşturduğunu rahatça görebilirsiniz.
    • Katmanlar oluşturmak için "+" işareti kullanılır ve her katman bir önceki katmanın üzerine eklenir.
    58:29Grafik Düzenleme ve Temalar
    • X ekseni ve y ekseni başlıkları belirlenebilir.
    • Grafik başlığı eklenerek açıklama yapılabilir.
    • Siyah beyaz tema kullanılarak kareli arka plan eklenebilir.
    59:44Eksen Ayarları ve Çözünürlük
    • Y ekseni için sürekli değişken ayarı yapılabilir ve ölçekler belirlenebilir.
    • X ekseni için zaman aralıkları ayarlanabilir (örneğin her altı ayda bir gösterim).
    • Grafik çözünürlüğünü korumak için dışa aktarma işlemi yapılabilir.
    1:04:37Eksen Metin Ayarları
    • Eksen metinlerinin boyutu ayarlanabilir.
    • Eksen metinlerinin dik durması için element_text(angle=90) komutu kullanılabilir.
    • Grafik düzenlemeleri için farklı komutlar kullanılabilir.
    1:06:13R kodu ve grafik düzenlemesi
    • R kodunda adların karışıklığını önlemek için komutlar dikine çevrilmesi gerekiyor.
    • Angle (açı), dikey ayarlaması ve uzaklık gibi parametreler kullanılarak grafik düzenlenebiliyor.
    • R ile oluşturulan grafikler Excel'in çirkin grafiklerine göre daha kibar ve göze hitap eden sonuçlar veriyor.
    1:08:16Google Colab ile R kullanımı
    • Google Colab, R kodlarını çalıştırmak için internet üzerinden kullanılabilen bir platform sunuyor.
    • Google Colab, kullanıcıya yüksek performanslı işlemci ve RAM sunuyor, örneğin 12 GB RAM ve çift çekirdekli işlemci.
    • Google Colab ile R kodları hızlı çalıştırılabiliyor ve veri üretimi gibi işlemler kolayca gerçekleştirilebiliyor.
    1:12:02Google Colab'ın avantajları
    • Google Colab, iyi bir bilgisayar olmayan kullanıcılar için online çalışan, hiçbir kurulum gerektirmeyen bir R platformu sunuyor.
    • Google Drive ile entegre olduğu için veriler kaybolmuyor ve Gmail hesabına sahip herkes kullanabiliyor.
    • Google Colab ile simülasyonlar daha hızlı çalıştırılabiliyor ve her yerden erişilebiliyor.
    1:14:48Önerilen Kaynaklar
    • Data science için temel bir kitap öneriliyor, özellikle yeni başlayanlar için.
    • Ekonomi metrikleri için Türkçe kaynaklar ve Emre Toros'un sosyal bilimler alanlarında kullanılan kaynakları da öneriliyor.
    • Stack Overflow, hata kodlarıyla karşılaşıldığında çok faydalı bir site olarak tanıtılıyor, hata kodlarını kopyalayıp Google'a yapıştırıldığında genellikle en üstte bu site çıkıyor.
    1:16:46Stack Overflow Kullanımı
    • Stack Overflow'da hata kodlarıyla karşılaşıldığında, en çok puan alan cevaplar genellikle en iyi çözümleri sunuyor.
    • Site üzerinde puanlaması yüksek olan kullanıcılar bilgisayar firmaları tarafından iş teklifi alabiliyor.
    • Üyelik açılıp takip edildiğinde, günlük olarak yeni başlıklar ve kod örnekleri mail olarak gelmekte.
    1:18:29Grafik Oluşturma Kaynakları
    • Grafikler için özel bir site tanıtılıyor, burada farklı grafik türleri ve kod örnekleri bulunabiliyor.
    • Site üzerinden histogram, harita, world cloud gibi çeşitli grafik türleri oluşturulabiliyor.
    • R Studio Cloud, R Studio'yu indirmeden kullanabilmek için ücretsiz bir alternatif olarak öneriliyor.
    1:20:18Kod Yazma Deneyimi
    • İlk kodlar uzun sürebilir, ancak deneyim kazanıldıkça bu süre kısalıyor.
    • Hata yapmak önemli, çünkü hatayı çözmek öğrenmek için gereklidir.
    • Tesadüfen doğru kod yazmak, nerede ne işe yaradığını anlamak için zor olabilir.
    1:22:34Bilgi Kriterleri
    • Her regresyon modelinden sonra bilgi kriteri değerleri elde ediliyor.
    • Akaike bilgi kriteri, diğer kriterlere göre daha küçük değerler veren "cimrilik ilkesine" göre en iyi modeli seçiyor.
    • Durağanlık testinde aynı düzeyde durağan olmayan seriler birlikte analiz edilmemeli.
    1:24:18Otoregresif Distribütör Modeli
    • Otoregresif distribütör modeli, kendi ile bağlaşımlı ve gecikmesi dağıtılmış bir modeldir.
    • Bu modelin kullanımında literatürde karmaşa vardır; bazı kaynaklar farklı dereceden entegre olmuş değişkenlerle kullanılabilirken, diğerleri farklı dereceden durağan değişkenlerle analiz yapılamaz diye yorum yapar.
    • Konuşmacı, bu yöntemi kendisinin kullanmadığını ve öğrencilerin farklı derece durağan değişkenlerle çalışmayı erken bulduğunu belirtiyor.
    1:25:39Simülasyon Çalışmaları
    • Arda ile simülasyon çalışmaları yapılabilir, ancak genel denge analizi için ne yapmak istediğini bilmeden kesin bir yorum yapılamaz.
    • Arda, Python'dan daha kullanıcı dostu olmasına rağmen, bazı temel kütüphaneler (pandas gibi) yüklü olmayabilir.
    • Bilimsel gösterimi kapatmak için "pd.set_option('display.float_format', '{:.4f}'.format)" kodu kullanılabilir.
    1:28:29Panel Veri Eğitimi
    • TÜBİTAK'ın panel veri ile ilgili ücretsiz bir eğitim programı bulunmaktadır.
    • Eğitimde Bilkent'ten Eray Hoca ve Gazi'den Furkan Hoca gibi uzmanlar bulunacaktır.
    • Eğitimde 25 kişi sınırlı katılım olacak ancak kayıtlı olanlar için online video linki paylaşılacaktır.
    1:30:11Eğitim ve Kaynaklar
    • Konuşmacı, Twitter hesabından (Erkan Agaslan) duyurular yapacağını belirtiyor.
    • ggplot gibi kütüphanelerin çok fazla özelliği vardır ve bu konuda 600 sayfalık kitaplar bulunmaktadır.
    • Ar ve Armark arasındaki fark, Armark'ta PDF, HTML oluşturma ve çeviri işlemlerinde daha az hata yapmasıdır.
    1:32:17Not Almanın Önemi
    • Konuşmacı, not almanın programlama öğreniminde çok önemli olduğunu vurguluyor.
    • Programlama yaparken hata yapmak insanın doğasıdır, ancak not alarak unutma riskini azaltabilirsiniz.
    • Etkinliklerine devam edeceklerini ve her seviyeye uygun eğitimler koymaya çalıştıklarını belirtiyor.
    1:34:03İletişim Bilgileri ve Yardım Teklifi
    • Konuşmacı, adım adım ilerleyen içerikler hazırladığını ve duyurularını ara ara yaptığını belirtiyor.
    • Konuşmacı, öğrencilere destek olmak için var olduğunu ve yardımsever olduğunu vurguluyor.
    • Konuşmacı, öğrencilerin kendisine mail atabileceklerini, ancak okul mail adresi yerine kendi Gmail adresini (erkanagaslan@gmail.com) kullanmalarını öneriyor.
    1:35:25Sorun Götürme Yöntemi
    • Konuşmacı, sorunları mail atarken ekran görüntüsü göndermelerini ve kişisel olmayan durumlarda kodu da paylaşmalarını istiyor.
    • Bilgisayar sorunları hakkında "bir sorun var" diyerek yardım istemek yerine, ekran görüntüsü göndermenin daha etkili olduğunu belirtiyor.
    1:35:56Kitap Projesi
    • Konuşmacı, notlarının üzerine çok emek verdiği ve bunların bir kitap projesi için kullanılacağını açıklıyor.
    • Savaş hocasıyla birlikte zaman serisi ekonomisi üzerine bir akademik kitap çıkarmak istediklerini belirtiyor.
    • Kitabın maddi kaygısı olmayan, minimum fiyatında tutulacağını ve herkesin erişebileceği bir proje olduğunu vurguluyor.
    1:37:04Kapanış ve Teşekkürler
    • Konuşmacı, kayıtların RLadesAnkara'nın YouTube hesabında paylaşılacağını duyuruyor.
    • İlayda'ya aracı olduğu için teşekkür ediyor.
    • Öğrencilere bayramda geldikleri için teşekkür ediyor ve sonraki etkinliklerde görüşmek üzere veda ediyor.

    Yanıtı değerlendir

  • Yazeka sinir ağı makaleleri veya videoları özetliyor