Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, bir eğitim içeriği olup, konuşmacı veri görselleştirme tekniklerini göstermektedir.
- Video, veri görselleştirme kütüphaneleri (Matplotlib ve SIBORN) kullanarak veri setlerini nasıl görselleştirebileceğimizi adım adım anlatmaktadır. Konuşmacı, gün, cinsiyet, fiyat, sigara durumu ve kişi sayısı gibi farklı değişkenler arasındaki ilişkileri pasta grafikleri, bar grafikleri ve farklı boyutlarla görselleştirerek göstermektedir. Video, veri setlerini daha iyi anlamak ve makine öğrenmesi için sayısal hale getirmek için gerekli temel görselleştirme tekniklerini içermektedir.
- 00:01Verileri Görselleştirme Kütüphaneleri
- Videoda önceden işlenmiş verilerin sütun adları ve içeriği değiştirilerek görselleştirilmesi ve ilişkilerin daha iyi anlaşılabilmesi amaçlanıyor.
- Görselleştirme için matplotlib kütüphanesi kullanılıyor ve seaborn, matplotlib'in gelişmiş ve daha kullanıcı dostu bir versiyonu olarak tanımlanıyor.
- 00:34İlk Görselleştirme Örneği
- Verilerin günler (pazar, cumartesi vb.) üzerinden dağılımı df['gün'].value_counts() fonksiyonuyla hesaplanıyor.
- Verileri doğrudan plot() fonksiyonuyla görselleştirdiğimizde anlamak zorlanılıyor, bu nedenle pasta grafiği (pie chart) kullanılıyor.
- Pasta grafiğinde değerlerin yüzdelik oranlarını göstermek için autopct='%1.1f%%' argümanı kullanılıyor.
- 03:06Farklı Veri Setleri Görselleştirme
- Cinsiyet verileri için de benzer şekilde pasta grafiği oluşturuluyor ve erkeklerin %64, kadınların %35 oranında olduğu görülmektedir.
- sns.barplot fonksiyonu kullanılarak farklı veri setleri arasında ilişki araştırılıyor.
- Gün ve fiyat verileri arasında ilişki inceleniyor ve perşembe ve cuma günlerinde fiyatların diğer günlerden daha yüksek olduğu gözlemleniyor.
- 05:14Çok Boyutlu Görselleştirme
- Veriler arasında ikinci bir boyut eklemek için argümanlar kullanılıyor, örneğin günlerle sigara içme durumu karşılaştırılıyor.
- Zaman ve kişi sayısı verileri incelendiğinde akşam saatlerinde 6 kişilik grupların en fazla olduğu görülmektedir.
- Görselleştirme sonuçlarının daha doğru yorumlanması için standart sapma ve istatistiksel hesaplamaların yapılması gerektiği belirtiliyor.
- 07:45Sonraki Adımlar
- Bu bölümde alınan verilerin seaborn ve matplotlib ile nasıl grafik haline getirileceği gösterildi.
- Sonraki derste kategorik verilerin (kadın, erkek, evet, hayır gibi) sayısal değerlere dönüştürülmesi öğretilmesi planlanıyor.
- Kategorik verilerin sayısal değerlere dönüştürülmesinin nedeni makine öğrenmesinde rahat kullanabilmek için.