Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, bir konuşmacının SPSS programı kullanarak çok değişkenli doğrusal regresyon analizini adım adım anlattığı kapsamlı bir eğitim içeriğidir.
- Video, dört değişkenli bir veri seti üzerinden (yetenek, sosyallik, tutuculuk ve popülerlik) regresyon analizi yapma sürecini dört ana bölüme ayrılmış olarak ele almaktadır: hipotez oluşturma ve analiz başlatma, varsayım testleri (korelasyon, çoklu doğrusallık, uç değerler), regresyon sonuçlarının yorumlanması ve rapor yazma, son olarak regresyon denkleminin kurulması ve tahmin yapma.
- Eğitim içeriğinde özellikle çoklu doğrusallık sorununa çözüm olarak mean centering yöntemi, hataların normal dağılımı ve eş varyans varsayımlarının test edilmesi, model summary, ANOVA ve coefficients tablolarının yorumlanması gibi konular detaylı olarak işlenmektedir. Ayrıca, F değerleri, p değerleri, beta değerleri, t değerleri ve etki büyüklükleri gibi istatistiksel değerlerin nasıl yorumlanacağı ve raporlanacağı da gösterilmektedir.
- Çok Değişkenli Doğrusal Regresyon Analizi
- Video, SPSS kullanarak çok değişkenli doğrusal regresyon analizinin nasıl yapılacağını göstermektedir.
- Analiz için dört değişkenden oluşan bir veri seti kullanılmaktadır: yetenek, sosyallik ve tutuculuk (bağımsız değişkenler) ile popülerlik (bağımlı değişken).
- Hipotezler şu şekilde formüle edilmiştir: yokluk hipotezinde bağımsız değişkenlerin hiçbiri bağımlı değişkeni yordamamaktadır, alternatif hipotezde ise en az bir bağımsız değişkenin bağımlı değişkeni anlamlı olarak yordamaktadır.
- 01:05SPSS'de Regresyon Analizi Yapma
- Analiz için "Analyze" > "Regression" > "Linear" menüsüne gidilir.
- Popülerlik değişkeni dependent (bağımlı değişken) bölümüne, yetenek, sosyallik ve tutuculuk değişkenleri ise independent (bağımsız değişken) bölümüne atılır.
- Statistics bölümünde descriptive, partial correlations, collinearity diagnostics ve confidence interval seçenekleri seçilir.
- 02:46Varsayım Testleri ve Sonuçlar
- İlk çıkan tabloda değişkenlerin ortalamaları, standart sapmaları ve veri sayısı görüntülenir.
- Korelasyon tablosu, bağımsız değişkenlerin arasında düşük korelasyon (80'in altında) olması beklenir, aksi halde çoklu doğrusallık sorunu yaşanır.
- Bağımlı değişkenle bağımsız değişkenler arasında orta seviyede korelasyon olması (yaklaşık %20-22) beklenir.
- 04:53Varsayım Kontrolü
- Çoklu doğrusallık varsayımının başka bir ölçümü olan VIF (Varyans Inflation Factor) değeri, bazı referanslara göre 1'e ne kadar yakınsa o kadar iyi olmalıdır.
- VIF değeri 3'ün altında ise sorun yoktur, 5'in veya 10'un üzerindeyse mean centering yöntemi uygulanabilir.
- Uç değerler kontrolü için Mahalanobis distance, Cook's distance ve centered leverage value değerleri incelenir.
- 08:07Uç Değer Tespiti Yöntemleri
- Uç değerleri bulmak için cut-off değeri hesaplanır: (2k+2)/n formülü kullanılır, burada k bağımsız değişken sayısı, n katılımcı sayısıdır.
- Hesaplama örneğinde bağımsız değişken sayısı 3 olduğunda cut-off değeri 0,15 olarak bulunur.
- Leverage, Cooks ve Mahalanobis değerlerine göre uç değerler tespit edilebilir, ancak genellikle sadece bir ölçütte uç değer olan gözlemler silinmez.
- 10:17Regresyon Analizinin Varsayımlarının Kontrolü
- Hataların normal dağılması gerekmektedir, bu varsayım kontrol edilir.
- Eş varyanslık (homoscedasticity) varsayımı için bağımsız değişkenlerin bağımlı değişkende eşit şekilde dağılması beklenir.
- Adjusted predicted value değerleri ile bağımlı değişken arasındaki scatter plot, tez veya makale için görselleştirilmiş regresyon modelini oluşturur.
- 12:53Regresyon Sonuçlarının Yorumlanması
- Regresyon sonuçları üç ana tablo içerir: Model Summary, ANOVA ve Coefficients tabloları.
- Model Summary tablosunda R değeri bağımsız değişkenlerin kombinasyonunun bağımlı değişkenle olan korelasyonunu gösterir, R-square ise bağımsız değişkenlerin bağımlı değişkende açıkladığı varyansı gösterir.
- Çoklu regresyonlarda rapor edilmesi gereken değer adjusted R-square'tır, ANOVA tablosunda ise modelin anlamlılık düzeyi (F değeri ve significance değeri) rapor edilir.
- Coefficients tablosunda bağımsız değişkenlerin bağımlı değişkenle olan bireysel ilişkileri görülür, B değerleri değişkenlerin etkisini, standartlaştırılmış B değerleri ise değişkenlerin etkilerinin büyüklüğünü gösterir.
- 15:27Regresyon Analizi Sonuçlarının Yorumlanması
- 380 değeri, yetenekteki bir standart sapma artışının popülerlikte 380 standart sapma artışına neden olduğu anlamına gelir.
- T değeri, ilişkiin anlamlı olup olmadığını belirlemek için kullanılır ve bu örnekte 0,5'ten küçük olduğu için anlamlıdır.
- %95 güven aralığı, yetenek değişkeninin popülerlik üzerindeki etkisinin 149 ile 513 aralığında olacağını gösterir ve bu aralıktaki sıfır olmaması anlamlılığı gösterir.
- 16:33Korelasyon Değerleri ve Etki Büyüklüğü
- Korelasyon değerleri, etki büyüklüğünü belirlemek için kullanılabilir ve parçalı korelasyon değerinin karesi raporlanabilir.
- Yetenek değişkeninin popülerlik üzerindeki etki büyüklüğü, 0,392'nin karesi olan 0,15 olarak hesaplanabilir.
- 17:20Rapor Yazma Yöntemi
- Rapor yazarken öncelikle "X, Y ve Z değişkenlerini kullanarak DV (bağımlı değişken) yordamak amacıyla çok değişkenli doğrusal regresyon analizi yapılmıştır" şeklinde başlanabilir.
- F değeri, serbestlik dereceleri ve p değeri raporlanmalıdır; örneğin "F(3,72) = 7,96, p < 0,001" şeklinde.
- Bağımlı değişkenin varyansının %22'sini açıkladığı belirtilmelidir (adjusted R² = 0,22).
- 19:15Bağımsız Değişkenlerin Etkilerinin Raporlanması
- Çoklu regresyon analizinde B değerleri yerine Beta değerleri kullanılır çünkü Beta değerleri ölçüm tiplerinden bağımsızdır.
- Beta değerleri, tüm değişkenlerin ölçüm aralıklarını standartlaştırarak z değerine dönüştürerek etkileri karşılaştırılabilir hale getirir.
- Yetenek değişkeninin popülerlik üzerindeki etkisi olumlu ve anlamlı olarak yorumlanabilir (β = 0,38, t(72) = 3,62, p < 0,001, pr² = 0,15).
- 22:15Anlamsız Bağımsız Değişkenlerin Raporlanması
- Anlamsız çıkan bağımsız değişkenler (örneğin tutuculuk değişkeni) raporlanmalıdır.
- Anlamsız değişkenlerin değerleri belirtilerek, "bu değişkenle ilgili daha fazla yorum yapmadan ilerleyebilirsiniz" şeklinde ifade edilebilir.
- Regresyon denklemi ve tahmin yapma yöntemi hakkında da bilgi verilmelidir.
- 23:06Çoklu Regresyon Denklemi
- Çoklu regresyonda bağımlı değişken (popülerlik) ve bağımsız değişkenler (yetenek, sosyallik, tutuculuk) arasındaki ilişkiyi gösteren denklem kurulur.
- Denklemde constant (intercept) değeri 3,60, yetenek slope'u 331, sosyallik slope'u 184 ve tutuculuk slope'u 2,20 olarak belirlenir.
- Yeni bir kişinin yeteneği 2, sosyalliği 3 ve tutuculuğu 1 olduğu durumda, popülerliğinin yaklaşık 4,29 civarında olacağını hata payıyla tahmin edebiliriz.
- 25:46Çoklu Regresyon Sonuçlarının Tablolaştırılması
- Çoklu regresyon analizinin sonuçlarını tablo haline getirmek için iki farklı örnek gösterilmiştir.
- Tablolarda constant, değişken isimleri, non-standard coefficients ve standard coefficients bölümleri bulunur.
- Tablolarda R değerleri, R-square, t değeri, p değeri, standart hata ve bootstrapping güven aralığı gibi bilgiler rapor edilebilir.
- 27:25Mean Centering Yöntemi
- Mean centering, çoklu doğrusallığı (multicollinearity) önlemek için kullanılan yöntemlerden biridir.
- Çoklu doğrusallık, iki bağımsız değişkenin hemen hemen aynı şeyi ölçmesi durumudur ve bu durumda bir değişkeni çıkarmanın daha iyi olabileceği belirtilmiştir.
- Mean centering yapmak için önce değişkenin ortalaması bulunur, sonra bu ortalamadan çıkarılarak yeni bir değişken oluşturulur.
- 28:00Mean Centering Uygulaması
- SPSS'te mean centering yapmak için önce tutuculuk değişkeninin ortalaması bulunur (2,84).
- Transform menüsünden compute variable seçeneği kullanılarak tutuculuktan ortalamayı çıkararak yeni bir değişken oluşturulur.
- Mean centering yapılan değişkeni kullanarak tekrar regresyon analizi yapılır ve bu değişkenin ortalaması 0 olmalıdır.