Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, bir eğitmen tarafından sunulan Python programlama dili ile betimsel istatistik hesaplama konulu bir eğitim içeriğidir.
- Videoda, betimsel istatistikin ne olduğu açıklandıktan sonra, numpy, pandas ve matplotlib gibi gerekli kütüphanelerin nasıl yükleneceği gösterilmektedir. Eğitmen, 2016-2017 ve 2017-2018 futbol veri seti üzerinde ortalama, mod, medyan, minimum, maksimum, varyans, standart sapma, çarpıklık, basıklık ve çeyreklik değerler gibi istatistiksel ölçüleri hesaplama yöntemlerini adım adım kod örnekleriyle açıklamaktadır.
- Video ayrıca pandas kütüphanesinin describe() fonksiyonunu kullanarak tüm istatistiksel değerlerin bir kez gösterilebileceğini de göstermektedir. Bu içerik, veri analizi yapmak isteyenler için temel bir kaynak niteliğindedir.
- Betimsel İstatistik Nedir
- Betimsel istatistik, veri setimiz hakkında genel bilgi edinmek için kullanılan metriklerdir.
- Ortalama, standart sapma, varyans, basıklık, çarpıklık, minimum ve maksimum değerler gibi değerler kullanılarak veri setinin dağılımı incelenir.
- Betimsel istatistik, veriyi betimlemeye çalışır ve istatistikte en temel metriklerden biridir.
- 00:59Python'da Betimsel İstatistik İçin Kütüphaneler
- Python'da betimsel istatistik yapabilmek için numpy ve pandas kütüphaneleri kullanılır.
- Numpy matematiksel işlemleri, pandas ise veri seti üzerinde manipülasyonlar yapmaya yarayan kütüphanelerdir.
- Histogram ve qplot grafiklerini çizebilmek için matplotlib.pyplot kütüphanesi de eklenir.
- 02:36Veri Setini Okuma ve İnceleme
- CSV dosyası pandas kütüphanesi ile okunur ve veri seti "file" değişkenine atanır.
- Veri setinin ilk beş satırını görmek için "head" komutu, son beş satırını görmek için "tail" komutu kullanılır.
- Veri setindeki "gol" sütunu "data" değişkenine atanır.
- 04:49Betimsel İstatistik Hesaplamaları
- Ortalama (aritmetik ortalama) hesaplamak için "data.mean()" komutu kullanılır.
- Mod değeri (en çok tekrarlanan değer) hesaplamak için "data.mode()" komutu kullanılır.
- Medyan değeri hesaplamak için "data.median()" komutu kullanılır.
- 07:17Minimum, Maksimum ve Toplam Değerler
- Toplam atılan gol sayısını hesaplamak için "data.sum()" komutu kullanılır.
- Minimum gol sayısını görmek için "data.min()" komutu kullanılır.
- Maksimum gol sayısını görmek için "data.max()" komutu kullanılır.
- 09:40Standart Sapma, Varyans ve Dağılım Katsayıları
- Standart sapma, verilerin ortalama değerden uzaklığının ölçüsüdür ve "data.std()" komutuyla hesaplanır.
- Varyans, standart sapmanın karesi olup "data.var()" komutuyla hesaplanır.
- Çarpıklık katsayısı, dağılımın sağa mı yoksa sola mı çarpık olduğunu gösterir, basıklık katsayısı ise dağılımın dikliğini gösterir.
- 11:46Betimsel İstatistik Hesaplama
- Çeyreklik değerleri hesaplamak için "quart" komutu kullanılır ve Q1, Q2, Q3 değerleri elde edilir.
- Hesaplanan değerler arasında mod değeri 45, toplam 12.255 gol atılmış, maksimum atılan gol sayısı 106, minimum atılan gol sayısı 20 ve toplam 16 satır bulunmaktadır.
- Veri setinde pozitif çarpıklık (sağa çarpık) ve 0,81 değerde basıklık bulunmakta, bu da dağılımın basık bir eğriye sahip olduğunu göstermektedir.
- 12:44Python'da Betimsel İstatistik
- Python'da betimsel istatistik yapmak için "describe" komutu kullanılabilir ve bu komut verinin ortalamasını, standart sapmasını, minimum değerini, maksimum değerini ve çeyreklik değerlerini gösterir.
- Python'da pandas ve numpy kütüphaneleri kullanılarak betimsel istatistik işlemleri basit komutlarla yapılabilir.
- Daha detaylı bilgi almak için farklı komutlar kullanılabilir, ancak bu video ile verinin temel istatistiksel özellikleri incelenmiştir.