• Buradasın

    İstatistik Dersi: Merkezi Eğilim ve Dağılım Ölçüleri

    youtube.com/watch?v=a-8j_SFgTYo

    Yapay zekadan makale özeti

    • Bu video, bir eğitmen tarafından sunulan istatistik dersinin kapsamlı bir eğitim içeriğidir.
    • Video, merkezi eğilim ve dağılım ölçüleri konusunu detaylı şekilde ele almaktadır. İlk olarak dağılım ölçüleri (değişim aralığı, varyans, standart sapma) açıklanmakta, ardından çeyreklikler (katiller) ve kartil hesaplamaları anlatılmaktadır. Son bölümde ise kutu grafiği (box plot) oluşturma ve yorumlama yöntemleri adım adım gösterilmektedir.
    • Videoda normal ve sınıflandırılmış frekans tabloları üzerinden varyans ve standart sapma hesaplamaları, tek ve çift sayıda gözlemli veri setlerinde çeyrekliklerin hesaplanması, aykırı değerlerin tespit edilmesi için alt ve üst sınırların belirlenmesi ve kutu grafiğinin verilerin dağılımını, ortanca değerini ve aykırı gözlemleri teşhis etmede nasıl kullanıldığı örneklerle açıklanmaktadır.
    Dağılım Ölçüleri Tanıtımı
    • Merkezi eğilim ölçülerinden sonra dağılış ölçüleri konusu ele alınacak.
    • Dağılım ölçüleri, gözlem değerlerinin birbirlerine göre konumlarını, yakınlık ve uzaklıklarını yansıtan değerlerdir.
    • Dağılım ölçüleri arasında değişim aralığı, standart sapma, varyans, değişim katsayısı ve kartel aralığı bulunmaktadır.
    00:33Eğilim Ölçülerinin Yetersizliği
    • A ve B örneklemleri için aritmetik ortalama, mod ve medyan değerleri hesaplanarak karşılaştırılması isteniyor.
    • A serisi (13, 16, 16, 17, 18) ve B serisi (2, 4, 16, 16, 42) için aritmetik ortalama, mod ve medyan değerleri eşittir.
    • Eğilim ölçüleri kullanılarak iki seriyi karşılaştırmak yetersiz kalabilir, bu durumda dağılım ölçülerine ihtiyaç duyulur.
    02:47Değişim Aralığı
    • Değişim aralığı, bir veri setinde en büyük değer ile en küçük değer arasındaki farkı gösterir ve yayılımı ifade eder.
    • A serisi için değişim aralığı 42-2=40, B serisi için değişim aralığı 42-2=40 olduğundan, B serisinin yayılımı daha fazladır.
    • Değişim aralığı, veri setinin değişkenliğini gösterir ve daha yüksek değişim aralığı, daha fazla değişkenlik anlamına gelir.
    03:54Varyans ve Standart Sapma
    • Varyans, veri setindeki gözlem değerleri ile aritmetik ortalamanın farklarının karelerinin ortalamasıdır.
    • Varyansın karekökü standart sapma olarak adlandırılır.
    • Ana kütle için varyans σ², örneklem için varyans s² olarak gösterilir ve hesaplamaları farklıdır.
    06:01Varyans Hesaplama Örneği
    • A serisi için varyans hesaplaması: (13-16)² + (16-16)² + (16-16)² + (17-16)² + (18-16)² / 5 = 3,5 olarak bulunur.
    • B serisi için varyans hesaplaması: (2-16)² + (4-16)² + (16-16)² + (16-16)² + (42-16)² / 4 = 254 olarak bulunur.
    • Varyansı büyük olan veri setinde değişkenlik daha fazladır ve bu durum tahminlerde daha fazla sapma anlamına gelir.
    09:28Frekans Serilerinde Varyans Hesaplama
    • Frekans serilerinde varyans hesaplaması için her bir gözlem değerini ortalamasından çıkartıp karesini alıp, bu karesel farkı ilgili frekansla çarpıp toplamak gerekir.
    • Örnek olarak yaşlara ilişkin örneklem standart sapması hesaplanırken önce ortalama hesaplanır.
    • Ortalama hesaplaması için her bir gözlemle ilgili frekansı çarpıp toplayıp, toplam frekansa bölmek gerekir.
    11:17Varyans ve Standart Sapma Hesaplama
    • Varyans hesaplanırken her gözlemden ortalama çıkarılıp karesi alınır, sonra bu kareler frekanslarıyla çarpılıp toplanır ve gözlem sayısı eksi bir ile bölünür.
    • Örneklemin varyansı 4,64 olarak hesaplandıktan sonra, standart sapma olarak varyansın karekökü alınarak 2,15 bulunmuştur.
    • Sınıflandırılmış frekans tablosunda ortalama hesaplanırken orta noktalar bulunur ve her orta noktadan örnek ortalaması çıkarılıp kareleri frekanslarıyla çarpılarak toplanır.
    13:17Sınıflandırılmış Frekans Tablosu Örneği
    • 100 öğrencinin istatistik dersinden aldıkları notlara ilişkin sınıflandırılmış frekans tablosunda, orta noktalar alt ve üst aralık değerlerinin toplamının ikiye bölünmesiyle hesaplanır.
    • Ortalama hesaplanırken orta noktalarla frekansların çarpımlarının toplamı toplam frekansa bölünür.
    • Varyans hesaplanırken y-x ortalamaların kareleri frekanslarıyla çarpılıp toplanır ve gözlem sayısı eksi bir ile bölünür.
    17:16Değişim Katsayısı
    • Değişim katsayısı, gözlemlerin birbirinden arındırılmış birimlerinden arındırılmış bir dağılım ölçüsüdür ve farklı verileri karşılaştırmak için kullanılır.
    • Değişim katsayısı ne kadar küçükse, veri seti değişkenlik bakımından o kadar homojen ve tercih edilir.
    • Ana kütle için değişim katsayısı ana kütle standart sapmasını ana kütle ortalamasına, örnek için ise örnek standart sapmasını örnek ortalamasına bölerek hesaplanır.
    19:37Çeyreklikler (Katiller)
    • Çeyreklikler (katiller), veri setinin değişim aralığını dört eşit parçaya bölen değerlerdir.
    • İkinci çeyreklik (Q2) medyan değerini gösterir ve verilerin yüzde elli'si medyanın altındadır.
    • Birinci çeyreklik (Q1) verilerin ilk yüzde beşinin altında bulunduran değer, üçüncü çeyreklik (Q3) ise verilerin yüzde yetmişbeşinin altında bulunduran değerdir.
    21:37Katil Aralığı ve Aykırı Değerler
    • Katil aralığı, üçüncü çeyreklikten birinci çeyreklik çıkarılarak hesaplanır ve yayılma ölçüsü olarak kullanılır.
    • Aykırı gözlemler tespit edilirken Q1-1,5×katil aralığı ve Q3+1,5×katil aralığı değerleri kullanılır.
    • Veri setinde bu aralıkların dışına düşen gözlemler aykırı gözlem olarak değerlendirilir.
    22:49Tek Sayılı Veri Setinde Çeyreklikler
    • Veri seti büyükten küçüğe sıralanmış halde ve tek sayılı bir seri gözleme sahip olduğunda, birinci çeyreklik (Q1) 11+1/4=3. gözlemle (101) bulunur.
    • İkinci çeyreklik (Q2) 2×11+1/2=6. gözlemle (108) bulunur ve aynı zamanda medyanın değeri olarak kabul edilir.
    • Üçüncü çeyreklik (Q3) 3×11+1/2=9. gözlemle (120) bulunur.
    23:59Çeyreklik Aralığı ve Aykırı Değerler
    • Çeyreklik aralığı, üçüncü çeyreklik değerinden birinci çeyreklik değerinin çıkarılmasıyla hesaplanır (Q3-Q1=120-101=19).
    • Aykırı değerler (outlier) tespit etmek için alt sınır Q1-1.5×Q aralığı (101-1.5×19=72.5) ve üst sınır Q3+1.5×Q aralığı (120+1.5×19=148.5) hesaplanır.
    • Veri setinde 72.5'ten küçük veya 148.5'ten büyük değer olmadığı için aykırı gözlem bulunmamaktadır.
    25:11Çift Sayılı Veri Setinde Çeyreklikler
    • Çift sayıda gözlemli veri setinde çeyreklikler hesaplanırken küsuratlı sayılar elde edilir.
    • Birinci çeyreklik (Q1) 3.25. gözlemle bulunur ve 3. gözlem ile 4. gözlem arasında hesaplanır (3. gözlem+4-3×1. çeyreklik=101.75).
    • İkinci çeyreklik (Q2) 6.5. gözlemle bulunur ve 6. gözlem ile 7. gözlem arasında hesaplanır (6. gözlem+110-6.8×0.5=109).
    • Üçüncü çeyreklik (Q3) 9.75. gözlemle bulunur ve 9. gözlem ile 10. gözlem arasında hesaplanır (9. gözlem+124-120×0.75=123).
    27:04Sınıflandırılmış Veri Setinde Çeyreklikler
    • Sınıflandırılmış veri setinde çeyreklikler hesaplanırken özel formüller kullanılır.
    • Birinci çeyreklik (Q1) formülü: L1 + (1/f1) × (n-4)/(4-f1)
    • Üçüncü çeyreklik (Q3) formülü: L3 + (1/f3) × (3×4-f3) × (n-4)/(4-f3)
    29:11Sınıflandırılmış Veri Seti Örneği
    • Sınıflandırılmış frekans tablosunda toplam gözlem sayısı 70'dir ve medyan değeri 35-36 gözlemlerin olduğu 58-65 aralığındadır.
    • İkinci çeyreklik (Q2) değeri 64.59 olarak hesaplanır.
    • Birinci çeyreklik (Q1) değeri için n+1/4=17.75 formülü kullanılarak 17. ve 18. gözlemler arasında bir değer olduğu belirlenir.
    31:46Kartil Hesaplama
    • Birinci katil, 51 ile 58 aralığındaki gözlemlerden hesaplanır ve değeri 57,4 olarak bulunur.
    • Üçüncü katil, 72 ile 79 aralığındaki gözlemlerden hesaplanır ve değeri 73,5 olarak bulunur.
    • Kartil aralığı, üçüncü katil ile birinci katil arasındaki farktır ve 16,1 olarak hesaplanır.
    34:48Aykırı Değerlerin Belirlenmesi
    • Aykırı değerlerin alt sınırı Q1 - 1,5 × kartil aralığı, üst sınırı ise Q3 + 1,5 × kartil aralığıdır.
    • Örnek veri setinde 33,12'den küçük ve 97,7'den büyük değerler olmadığı için aykırı değer yoktur.
    • Aykırı değerler genellikle veri setinden atılır, ortalama, medyan veya tahmin değeri atanabilir.
    35:52Kutu Grafiği
    • Kutu grafiği, veri setinin merkez, yayılım, simetri ve aykırı değer gibi özellikleri hakkında bilgi veren bir grafik türüdür.
    • Kutunun içindeki medyan çizgisi verinin konumu, kartil aralığı ise verinin yayılımı hakkında bilgi verir.
    • Kutu grafiğinde maksimum değer, Q3 (üçüncü çeyrek), medyan (Q2), Q1 (birinci çeyrek), minimum değer ve kartil aralığı gösterilir.
    40:20Kutu Grafiği Oluşturma
    • Kutu grafiğinde alt sınır en küçük değeri (96) gösterir.
    • Kutunun üst çizgisi üçüncü katil değeri (123), ortasındaki çizgi ikinci katil değeri (109), alt çizgisi birinci katil değeri (101,75) gösterir.
    • Kutu grafiği, veri setinin özet tablosunu ve dağılımını görsel olarak sunar.
    41:41Kutu Grafiğinin Yorumlanması
    • Kutu grafiği verilerin dağılım yeri, ortanca değeri ve değişim aralığı hakkında bilgi verir.
    • Tek bir veri seti için karşılaştırma yapılamaz, ancak farklı veri setleri karşılaştırılarak karar verilebilir.
    • Kutu grafiği, özet bilgileri ve outlier'ları (aykırı gözlemleri) gösterir.
    42:40Aykırı Gözlem Örneği
    • Aynı veri setinde 12. gözlem değeri 130'dan 160'a değiştirildiğinde, Q1, Q2 ve Q3 değerleri değişmez.
    • Yeni veri setinde 12. gözlem değeri (160) aykırı gözlem olarak belirlenir çünkü alt sınırdan daha küçük bir değer yoktur.
    • Kutu grafiğinde aykırı gözlem, noktacık şeklinde gösterilir ve verilerin yayılımını ifade eden üç eksik değer (Q1, Q2, Q3) görülebilir.

    Yanıtı değerlendir

  • Yazeka sinir ağı makaleleri veya videoları özetliyor