Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, Dr. Erkan Aaslan tarafından sunulan bir eğitim içeriğidir. Dr. Aaslan, akademisyen ve ekonometrist olarak panel veri analizi konusunda bilgi paylaşmaktadır.
- Video, panel veri analizine giriş yaparak başlıyor ve temel ekonometri bilgisinin önemi vurgulanıyor. Ardından kesit veri, zaman serisi veri ve panel veri kavramları açıklanıyor ve R programlama dilinde bu veri tiplerinin nasıl oluşturulacağı adım adım gösteriliyor. Son olarak, panel dataframe'in oluşturulması, plm kütüphanesinin kullanımı ve yatay kesit bağımlılığının test edilmesi için Pra'nın CD testinin önemi anlatılıyor.
- Eğitim, özellikle finansçılar, işletme alanında faaliyet gösteren akademisyenler ve öğrenciler için hazırlanmış olup, panel veri analizine yeni başlayanlar için temel bir kaynak niteliğindedir. Video, bir serinin parçası olup, konuşmacı bir sonraki videoda CD testi ile devam edeceğini belirtmektedir.
- YouTube Kanalının Yeniden Başlangıcı
- Dr. Erkan Aaslan, COVID-19 salgını nedeniyle uzun bir ara verdiğini belirtiyor.
- İlk aylarda COVID-19 nedeniyle şaşkınlık ve kaygılar yaşanırken, akademisyenlerin ekstra sorumluluklar yüklenmesine neden oldu.
- Finansçılar ve işletme alanında faaliyet gösteren akademisyenler, panel veri analizi konusunda sıkça başvuruyor.
- 01:53Temel Eğitimin Önemi
- Panel veri analizine ilişkin içerik oluşturulmuş olsa da, öncelikle temel eğitimi videosunun izlenmesi öneriliyor.
- Temel eğitim, ekonometri derslerinin temeli gibi önemli ve üstüne bir şey çıkabilmesi için gerekli.
- Dr. Aaslan, sosyal sorumluluk edinerek bu videoları ücretsiz olarak insanlara ulaştırmayı amaçlıyor.
- 03:55Ekonometri Model Kurma Aşamaları
- Ekonomide model kurma aşamaları: çalışmanın kısıtlarının konması, iktisadi sorunun belirlenmesi ve matematiksel modelin kurulması.
- Matematiksel model kurulmadan hangi değişkenlerle çalışılacağı belirlenemez.
- Econometrik modelde, gözlemlerle tahminler arasındaki farkları temsil eden hata terimi modele eklenir.
- 07:32Verilerin Toplanması
- Verilerin toplanması aşamasında verilerin kategorize edilmesi gerekir.
- Hangi tür verilerin toplanacağı ve neye ihtiyaç duyulacağı belirlenmelidir.
- 07:54Veri Tipleri ve Ekonomik Model Kurma
- Çalışmanın ekonomik sıralaması ve model kurma aşamaları vardır, bu aşamalara göre veri tipi ve tahmin yöntemi belirlenir.
- Ekonomide sıklıkla kullanılan üç veri tipi vardır: kesit veri, zaman serisi veri ve panel veri.
- Kesit veri (cross-sectional data), yatayda verilerin birden bire değişen ama belirli bir zaman kesit noktasında (örneğin 2013 yılının dördüncü çeyreği) toplanan verilerdir.
- 09:08Kesit Veri Örneği
- Kesit veri örneğinde 100 birim ve 66 değişken (y bağımlı değişken ve x1-x5 açıklayıcı değişkenler) oluşturulmuştur.
- Kesit verisinde sol tarafta 1'den 100'e kadar devam eden gözlem numaraları bulunur ve her bir gözleme ilişkin veriler (ülke, şirket gibi) yer alır.
- Kesit verisinde her bir gözlem belirli bir zaman noktasında (örneğin bir ülkenin milli geliri, enflasyon oranı) toplanır.
- 11:09Zaman Serisi Veri
- Zaman serisi verisi, zamanın bir fonksiyonu olan ve zamanla değişen verilerdir.
- Zaman serisi oluşturmak için "ts" fonksiyonu kullanılır ve başlangıç tarihi, frekans (yıllık, altı aylık, çeyreklik, aylık, haftalık) belirtilir.
- Zaman serisi örneğinde 1980'den 2020'ye kadar giden bir seri oluşturulmuş ve zaman etiketleri eklenmiştir.
- 12:48Panel Veri
- Panel veride gözlem maddesi hazırsa ve Excel'de zaman ve birimleri temsil eden iki sütundan oluşan değişkenler yoksa, panel veriyi bilgisayara tanıtamazsınız.
- Panel veri örneğinde 2000'den 2022'ye kadar giden 3 yıl için 20 firma incelenmiştir.
- Panel veri oluşturmak için her bir birimi temsil eden kimlik numarası ve zaman etiketine ihtiyaç vardır, bu nedenle "rap" komutu kullanılarak tekrar eden değerler oluşturulabilir.
- 16:41Döngüler ve Veri Oluşturma
- Döngüler, veri işleme için çok faydalı bir araçtır ve "for" döngüsü kullanılarak belirli bir matris veya vektör boyunca işlem yapılabilir.
- "Append" komutu, boş veya dolu bir değişkenin arkasına yeni değerler eklemek için kullanılır.
- "For" döngüsü ile 1'den 20'ye kadar olan sayılar otomatik olarak bir değişkene eklenebilir.
- 18:38Frekanslar ve Veri Birleştirme
- Frekanslar adı altında bir vektör oluşturulabilir ve içinde 2000-2002 yılları arasındaki veriler yer alabilir.
- Ardışık sayı üretmek için iki nokta üst üste kullanılır ve bu sayılar belirli bir sayıda tekrar edebilir.
- İki değişken yan yana birleştirilerek, bir ülkenin hangi birime ait olduğu ve hangi dönemki verileri olduğu bilgisi oluşturulabilir.
- 20:50Panel Veri Oluşturma
- Panel veri formatı için 60 satır ve 5 sütunlu bir matris oluşturulabilir.
- Panel veri setinde birimler, frekanslar ve bağımlı değişkenler yer alabilir.
- Excel dosyalarında da benzer şekilde verilerin yıllar boyunca aynı birimlerde değişmesi gerekir.
- 23:42Veri Çerçeveleri (DataFrame)
- Panel veri analizi için veri çerçeveleri (dataframe) kullanılmalıdır.
- Veri matrisinin içerisinde hem karakter hem sayı olamaz, aksi takdirde verinin yapısı bozulur ve hiçbir işlem yapılamaz.
- DataFrame, hem sayısal verileri hem de karakterleri bir arada tutabilen bir veri yapısıdır.
- 26:51Veri Çerçevesi ve Veri Analizi
- Veri çerçevesi oluşturulduğunda, her sütuna karakterler veya başka değerler atanabilir.
- Veri çerçevelerinde basit fonksiyonlar çalıştırırken hata alabilirsiniz, örneğin sütun ortalamasını alırken tek köşeli parantez yerine çift köşeli parantez kullanmanız gerekir.
- Tek köşeli parantez kullanıldığında değişken adı çağrılırken, çift köşeli parantez kullanıldığında veri seti olarak gösterilir.
- 28:21Panel Veri Çerçevesi Oluşturma
- Panel analizi yapabilmek için veri tipinin panel dataframe olması gerekir, matris veya değişkenlerle çalışamazsınız.
- Panel dataframe oluşturmak için önce "plm" kütüphanesini yüklemeniz ve aktif etmeniz gerekir.
- Panel dataframe oluşturmak için "pdata.frame" fonksiyonu kullanılır ve argümanları sırasıyla veri seti, birimlerin sütunu ve frekansın sütunudur.
- 32:42Panel Veri Çerçevesi Örneği
- Panel veri çerçevesinde birimlerin sütunu "c" ile başlar ve "i" (iyi) ile "d" (dönem) olarak tanımlanır.
- Oluşturulan panel dataframe'de "i" ve "d" değişkenleri faktör (kategorik değişken) olarak tanımlanır.
- Panel dataframe oluşturulduktan sonra panel veri analizi ile ilişkili testlere giriş yapılabilir.
- 34:13Panel Veri Analizinin Temelleri
- Panel veri analizinin anahtarı, veri yüklendikten sonra yatay kesit bağımlılığının olup olmadığının test edilmesidir.
- Pra'nın CD testi, yatay kesit bağımlılığını test etmek için en çok kullanılan ve hem ellere hem de tellere karşı duyarlılığı yüksek olan bir testtir.
- Yatay kesit bağımlılığı varsa analiz farklı bir şekilde yapılır, yoksa farklı bir yöntemle ilerler.
- 36:28Veri Hazırlama Süreci
- Excel'den veri yüklendiğinde dataframe olarak gelir ancak aileler ve yıllar eksik olabilir.
- Excel'de veri hazırlamak için ilk satıra aileler, ikinci satıra yıllar konulmalıdır.
- Panel dataframe oluşturmak için "dfp" olarak adlandırılabilir.
- 37:53Gelecek Videolar Hakkında Bilgi
- Video sosyal medya platformlarından ilan edilecek ve küçük bir edit işlemi yapılacak.
- Bir sonraki videoda CD testi ile daha kısa ve özet bir içerik sunulacak.
- 30 değişken için CD testi yapılacak ve tüm değişkenler için yatay kesit bağımlılığı sorunu kontrol edilecek.