Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, bir eğitmen tarafından sunulan istatistiksel analiz eğitim içeriğidir. Dersin sonunda Mehmet Ceyhan hoca olarak tanıtılan bir epidemiyoloji uzmanı hakkında bilgi verilmektedir.
- Video, iki örneklem t testi ile başlayıp, Minitab programında aykırı değer testi, normallik testi ve t-testi uygulamalarını göstermektedir. Ardından ANOVA (Varyans Analizi) testinin teorik açıklaması ve pratik uygulamaları ele alınmaktadır. Eğitim, hipotez kurma, test istatistiği hesaplama, p-değerlerinin yorumlanması ve post-hoc testlerinin kullanımı gibi konuları kapsamaktadır.
- Video, biyo-istatistik ve epidemiyoloji alanlarındaki uygulamaları örneklerle anlatmakta, özellikle Cawwot-19 tedavilerinin etkinliğini test etmek için kontrollü deneylerin önemine değinilmektedir. Ayrıca paket servisi şirketlerinin sipariş sürelerini karşılaştırmak ve farklı boya fırçalarının sertliklerini karşılaştırmak gibi pratik örnekler üzerinden ANOVA testinin nasıl uygulanacağı gösterilmektedir.
- T Testi Tanıtımı
- Dört haftadır regresyon analizine bakılan konu, artık iki örneklemin ortalamalarını test etmek için t testi konusuna geçilecek.
- T testi, normal dağılıma uyan bir veya iki örneklemin ortalamaları arasındaki farkı test etmeye yarar.
- Örneklem boyutu büyükse normallik varsayımında esneklik tanınabilir, ancak küçük örneklemde normallik yoksa parametrik olmayan testler kullanılmalıdır.
- 02:26Tek Örneklem ve İki Örneklem T Testi
- Tek örneklem t testinde tek bir popülasyonun ortalamasının hedef değeri eşit olup olmadığı test edilir.
- İki örneklem t testinde iki farklı ana kütlenin veya bir ana kütlenin farklı grupları arasındaki ortalama fark test edilir.
- Eğer değişkenler birbirine bağımlıyorsa ikili t testi, gözlemler arasında bağımlılık ilişkisi varsa ise paired t testi yapılır.
- 04:31T Testinin Kullanım Alanları
- T testi, regresyonda bağımsız değişkenlerin bağımlı değişkeni ne kadar etkilediğini test etmek için de kullanılabilir.
- Güncel bir örnek olarak, COVID-19 tedavilerinin etkinliğini test etmek için kontrollü deneyler yapılması gerekebilir.
- Bu tür testler genellikle biyo-istatistikçiler ve epidemiyoloji uzmanları tarafından yapılır.
- 06:49T Testinin Varsayımları
- T testinde veriler sürekli, nümerik ve sürekli olmalıdır, kategorik veriler için oran testi yapılmalıdır.
- Örneklem sayısı 15'ten büyük olmalı, normal dağılıma uymalı ve aykırı veri içermemelidir.
- Örneklemler rastgele seçilmeli, birbirinden bağımsız olmalı ve ortak veri içermemelidir.
- 07:59Hipotez Kurma ve Uygulama
- T testinde önce araştırma hipotezi (H1) kurulur, sonra yokluk hipotezi (H0) kurulur.
- Araştırma hipotezinde iki örneklem arasında fark var mı yok mu test edilir.
- Uygulama örneğinde, bir sınıftaki kız ve erkek öğrencilerin ortalama uzunlukları arasında önemli bir fark var mı yok mu test edilecektir.
- 10:07Aykırı Değer Testi
- Outlier test, verilerde aykırı değer olup olmadığını test eden bir yöntemdir.
- Uzunluk değerleri cinsiyete göre iki gruba ayrılır: kadın ve erkek.
- Hipotez testinde H0 hipotezi tüm değerlerin aynı normal dağılımdan geldiğini, H1 hipotezi ise bir veya daha fazla aykırı değerin olduğunu belirtir.
- 11:17Aykırı Değerlerin Tespiti ve Temizlenmesi
- Erkek değerleri için p değeri 0,05'ten küçük olduğu için H0 hipotezi reddedilir ve en az bir normal dağılıma uymayan değer olduğu söylenir.
- Kadın değerleri için p değeri 0,05'ten büyük olduğu için H0 hipotezi kabul edilir ve tüm kadın uzunluklarının aynı normal dağılımdan geldiği belirtilir.
- Erkek verilerindeki aykırı değer (153. satır) veri setinden kaldırılır ve tekrar test edildiğinde her iki grup için de p değeri 0,05'ten büyük çıkar.
- 13:25Normallik Testi
- Normallik testi için Anderson-Darling testi kullanılır ve p değeri 0,05'ten küçük olduğu için uzunluk değerlerinin normal dağılıma uymadığı belirlenir.
- Cinsiyete göre gruplandırıldığında hem erkek hem kadın değerleri için p değeri 0,05'ten büyük çıkar ve ikisinin de normal dağılıma uyduğu söylenir.
- Kadın değerleri daha çok normal dağılıma uyuyor ancak ikisi de anlamlı bir şekilde normal dağılıma uyuyor.
- 15:30Bağımsız İki Örneklem T Testi
- Erkek ve kadın grupları arasında bağımsızlık olduğu için bağımsız iki örneklem t testi yapılır.
- Veriler aynı sütunda olduğundan ve Minitab'te tablo üzerinde tanımlı olduğu için uygun seçenek seçilir.
- T testi sonucunda p değeri 0,05'ten küçük olduğu için H0 hipotezi reddedilir ve erkeklerin ortalama kadınlardan 14,14 santim daha uzun olduğu, 95% güven aralığı ise 12,50-16,24 olarak belirlenir.
- 20:38İstatistiksel Testler ve Örneklem Farkları
- Grafiklerde erkeklerin ve kadınların dağılım ortalamaları arasındaki fark görülebilir, ancak bu farkın anlamlı olup olmadığı istatistiksel olarak gösterilmelidir.
- Örneklemde erkek uzunlukları 180 santim, kadın uzunlukları 165 santim olarak çıkmış olup, bu farkın anlamlılığı istatistiksel açıdan önemlidir.
- İki örneklem t testi, örneklemdeki farkın şansa dayalı olup olmadığına dair hipotez testi yaparak anlamlılığını belirler.
- 23:03T Testi ve ANOVA Testi
- T testi, iki farklı değişken arasındaki ortalama farklarını test etmek için kullanılır; z testi ise ana kütlenin varyansı bilindiğinde, t testi ise bilinmediğinde kullanılır.
- Üç veya daha fazla örneklem varsa, her iki değişken kombinasyonu için ayrı t testleri yapılması gerekir, bu durumda ANOVA testi daha genel bir çözüm sunar.
- ANOVA testi, ikiden fazla örneklem arasında ortalama farkların anlamlılığını test etmek için geliştirilmiş bir yöntemdir.
- 24:58ANOVA Testinde Kullanılan Kavramlar
- Faktör, nitel özelliğini belirten bir değişkendir ve faktörün aldığı değerler faktör düzeyleri olarak adlandırılır.
- ANOVA testi, faktörlerin ortalamaları arasındaki farkın anlamlılığını belirlemek için kullanılır.
- ANOVA testi örneğin, üç farklı paket servis şirketi arasındaki teslimat süresi farkını belirlemek için kullanılabilir.
- 28:16ANOVA Testinin Uygulanması
- ANOVA testi uygulaması için öncelikle normallik testi ve varyansların homojen dağılması gereklidir.
- Faktörler, grupların isimlerini temsil ederken, faktör düzeyleri o grupların aldığı değerleri ifade eder.
- ANOVA testinde, her bir grubun aritmetik ortalaması ve tüm grupların genel ortalaması hesaplanır, ardından her bir grubun genel ortalamayı ne kadar etkilediği belirlenir.
- 31:03ANOVA Hipotez Testi Adımları
- ANOVA testinde hipotez testlerindeki adımlar benzer şekilde uygulanır: hipotez kurma, kritik alan belirleme, serbestlik dereceleri hesaplama ve test istatistiği ile karar verme.
- Serbestlik dereceleri iki türdür: grup içi serbestlik derecesi ve gruplar arası serbestlik derecesi.
- Hipotez testinde araştırma hipotezi "en az bir grubun ortalama etkisi farklıdır" şeklinde kurulurken, yokluk hipotezi "tüm grupların ortalamaları arasında fark yoktur" şeklinde belirtilir.
- 32:39Serbestlik Dereceleri ve Anlamlılık Düzeyi
- İkinci adımda anlamlılık düzeyi belirlenir, genellikle 0,05 veya 0,01 seviyesi tercih edilir.
- Gruplar arası serbestlik derecesi, grup sayısı eksi bir şeklinde hesaplanır (örneğin 3 grup için 2).
- Grup içi serbestlik derecesi, her bir grubun eleman sayısı eksi bir şeklinde hesaplanır ve toplam eleman sayısı eksi grup sayısı ile belirlenir.
- 33:57F Değerinin Hesaplanması
- F değeri, gruplar arası karelerin ortalaması ve grup içi karelerin ortalaması kullanılarak hesaplanır.
- Gruplar arası karelerin ortalaması, her bir grubun ortalamasını genel ortalamadan çıkartıp karesini alıp o grubun eleman sayısıyla çarpılır.
- Grup içi karelerin ortalaması, her bir grubun faktör düzeylerinin ortalamasını o grubun ortalamasından çıkartıp karesini alır.
- 35:08Grup İçi ve Gruplar Arası Değişim
- Grup içi değişim, grup içindeki dağılımı ve ortalama lardan sapmaları gösterir.
- Gruplar arası değişim, grupların birbirine uzaklığı gösterir; değişim azsa grupların birbirine yakın olduğu anlamına gelir.
- Gruplar arası mesafe, gruplar arası karelerin ortalaması bölü (grup sayısı eksi bir) şeklinde hesaplanır.
- 36:44Hipotez Kararı ve Post-Hoc Testleri
- Hesaplanan F değeri tablodaki değerden büyükse sıfır hipotezi reddedilir, araştırma hipotezi kabul edilir.
- Anlamlı farklıoluşturan grubu bulmak için post-hoc testleri yapılır.
- Post-hoc testler arasında Scheffé, Tukey ve Bonferroni gibi testler kullanılır; Scheffé genellikle eleman sayıları eşit olmayan gruplarda tercih edilir.
- 38:09Örnek Uygulama
- Üç şirketin sipariş teslim sürelerinin karşılaştırılması örneği verilmiştir.
- Her şirket için dört faktör düzeyi bulunmaktadır.
- Analiz, şirketlerin teslim sürelerinde anlamlı farklılık olup olmadığını ve hangi şirketin en iyi performans gösterip göstermediğini belirlemek için yapılmaktadır.
- 39:22ANOVA Testi ve Hipotezler
- ANOVA testinde önce tüm grupların ortalamaları hesaplanır ve genel ortalamaya bölünür; eleman sayıları eşit olduğunda grup sayısıyla, farklıysa toplam eleman sayısına bölünür.
- ANOVA hipotezleri kurulur: yokluk hipotezinde (H0) şirketlerin teslim sürelerinin birbirine eşit olduğu, araştırma hipotezinde (H1) en az birisinin farklı olduğu belirtilir.
- K değeri 3, n değeri 12 (3 şirket × 4 eleman), gruplar arası serbestlik derecesi 2, grup içi serbestlik derecesi 9 olarak hesaplanır.
- 41:02F Dağılımı ve Hipotez Testi
- F dağılımı, t ve z dağılımı gibi belirli karakteristik özelliklere sahip olup, en düşük değeri sıfır olan pozitif değerler alır.
- %5 anlamlılık düzeyinde çalışıldığında, F değeri 4,25'ten büyükse H0 reddedilir, küçükse H0 kabul edilir.
- H0 kabul edildiğinde (ortalamalar arasında fark yok) post-hoc testi yapılmaz, H0 reddedildiğinde ise hangi grupların arasında fark olduğu belirlenir.
- 42:43ANOVA Testinin Uygulanması
- Hesaplanan F değeri 1,68 olarak bulunmuş ve 4,25'in sol tarafında kaldığı için H0 kabul edilmiştir, yani şirketlerin ortalamaları arasında anlamlı bir fark yoktur.
- Paket program kullanıldığında (Minitab gibi) önemli olan p değeri olup, p değeri 0,05'ten küçükse H0 reddedilir, büyükse H0 kabul edilir.
- Minitab'te ANOVA testi için "Stat" sekmesinden "ANOVA" seçilir ve tek faktörlü ANOVA (one-way ANOVA) uygulanır.
- 44:20Minitab ile ANOVA Uygulaması
- Minitab'te şirketlerin değerleri sıralı değişken olarak girilir ve "Stat" sekmesinden "ANOVA" seçilerek tek faktörlü ANOVA uygulanır.
- Minitab'te p değeri 0,05'ten büyük çıkmış, bu da H0'nun kabul edildiğini gösterir ve ortalamalar arasında anlamlı bir fark olmadığını belirtir.
- İkinci bir örnek olarak boya fırçalarının sertliklerinde anlamlı bir fark olup olmadığı incelenir ve tek faktörlü ANOVA uygulanır.
- 50:04Anava Test Sonuçları ve Hipotez Değerlendirmesi
- Dört faktör içeren bir analiz yapılmış ve anava testinden çıkan sonuçlarda f değeri 6,2 çıkmıştır.
- Önemli olan p değeri 0,05'ten küçük olduğundan hipotez reddedilmiş ve alternatif hipotez kabul edilmiştir.
- Alternatif hipotez, en az bir ortalamanın diğerlerinden farklı veya bütün ortalamaların birbirine eşit olmadığını belirtmektedir.
- 51:09Farklılık Oluşturan Faktörün Belirlenmesi
- Hangi faktörden dolayı ortalama arasındaki farkın olduğu belirlenmek için Türkiye testi uygulanmıştır.
- Türkiye testi sonuçlarına göre, farklılığı oluşturan faktörün ikinci boya fırçası olduğu tespit edilmiştir.
- Birinci grupta (A grubunda) ikinci boya fırçasının ortalamalar arasındaki farkı oluşturduğu, ikinci grupta (B grubunda) ise dördüncü boya fırçasının ortalamalar arasındaki eşitliği bozduğu belirtilmiştir.