Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, bir eğitim içeriği olup, konuşmacı Python programlama dilini kullanarak veri manipülasyonu ve makine öğrenimi uygulamalarını göstermektedir.
- Video, R ve Python ortamlarını birbirine bağlama ile başlayıp, veri setinin tanımlayıcı istatistiklerinin incelenmesi, dengesiz veri probleminin çözümü (down sampling) ve lojistik regresyon modelinin oluşturulması aşamalarını kapsamaktadır. Konuşmacı, ROC curve (Receiver Operating Characteristic curve) kavramını detaylı olarak açıklamakta ve modelin performansını değerlendirmek için AUC (Area Under the Curve) değerini hesaplamaktadır. Video, bir sonraki bölümde görselleştirmelerin ve konjon matrisi çizdirilmesinin yapılacağı bilgisiyle sonlanmaktadır.
- 00:09Python Ortamında Veri İşleme
- Python ortamında büyük manipülasyon işlemlerinin gerçekleştirilmesi amaçlanmaktadır.
- R ve Python ortamları arasında bağlantı kurmak için özel yapılar oluşturulmaktadır.
- Emel datalar üzerinden lojistik regresyon ve tahmin işlemleri yapılacak.
- 01:18Veri Hazırlığı
- Tesla verisi Python ortamına aktarılmakta ve machine learning modelleri için hazırlanmaktadır.
- Bağımlı değişken "decision" numerik olarak tanımlanmamış olduğundan, integer türüne dönüştürülmesi gerekmektedir.
- Veri setinde dengesiz veri problemi bulunmaktadır ve bu problemi çözmek için down sampling işlemi uygulanacaktır.
- 04:25Dengesiz Veri Problemi ve Çözümü
- Veri setinde 802 tane bir değer ve 228 tane sıfır değeri bulunmaktadır.
- Model, bir değerleri daha çok deneyimleyeceği için, bir demesi ihtimali sıfır demesi ihtimaline göre daha yüksektir.
- Dengesiz veri problemi için majority sınıfı (bir değerler)den down sampling işlemi uygulanarak dengeli bir veri seti oluşturulmaktadır.
- 07:44Lojistik Regresyon Modeli
- Lojistik regresyon modeli sklearn kütüphanesinden import edilerek oluşturulmaktadır.
- Model nesnesi "logistic regression" ile oluşturulup, X bağımsız değişkenleri ve y bağımlı değişkeni kullanılarak eğitilmektedir.
- Model tahminleri için probability değerleri hesaplanmaktadır.
- 09:51ROC Eğrisi ve Performans Değerlendirmesi
- ROC eğrisi için gerekli komponentler (FP rate, TP rate, threshold) sklearn kütüphanesinden import edilmektedir.
- ROC eğrisi, belirli bir threshold değeriyle olasılıkların yuvarlanarak tahmin edilmesi ve gerçek değerlerle karşılaştırılmasıyla oluşturulmaktadır.
- ROC eğrisinin altında kalan alan (AUC) değeri, modelin performansını değerlendirmek için kullanılmaktadır.