Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, bir eğitim dersi formatında olup, bir eğitmen tarafından makine öğrenmesi konuları anlatılmaktadır.
- Video, önceki derste ele alınan veri tiplerini (sayısal ve kategorik) hatırlatarak başlıyor ve ardından sınıflandırma ve regresyon kavramlarını açıklıyor. Daha sonra veri ön işleme konusuna geçiliyor ve normalize etme, randomize etme ve eksik veri tamamlama gibi ön işleme teknikleri örneklerle gösteriliyor. Video, Principle Component Analysis (PCA) konusuna da değinerek sonlanıyor ve ilerleyen derslerde bu konuların daha detaylı işleneceği belirtiliyor.
- 00:06Veri Tipleri ve Sınıflandırma
- Önceki derste sayısal numerik değerlerle yapılan ölçümlerin hangi çiçeğe ait olduğunu bulma çalışması yapılmıştır.
- Sınıflandırma verileri sadece numerik olmayıp, kategorik veriler de kullanılabilir.
- Kalp krizi ihtimalini ölçen veri setinde hem numerik hem de kategorik veriler bulunur ve bunlar sınıflandırma işleminde kullanılır.
- 02:36Kategorik Verilerin Kullanımı
- Veri setinde cinsiyet, göğüs ağrısı ve dinlenme EKG gibi kategorik veriler bulunmaktadır.
- Kategorik veriler de sayısal olarak değerlendirilebilir ve renkle sınıflandırma yapılabilir.
- Kategorik veriler nedeniyle ANOVA çalışmadığı için, verilerin sınıflandırma başarısı açısından hangilerinin daha etkili olduğu görülebilir.
- 04:09Veri Ön İşleme
- Ham veri genellikle eksiklikler, sıradışı değerler ve işe yaramayan veriler içerdiği için sorunlara yol açabilir.
- Ön işleme uygulamaları sayesinde veri daha sınıflandırılabilir ve düzgün hale getirilebilir.
- Normalize etme işlemi, sayısal değerleri belirli aralıklara (örneğin -1 ile +1) yerleştirerek veriyi düzenler.
- 06:33Ön İşleme Teknikleri
- Randomize işlemi, verilerin sıralı gelmesi durumunda makine öğrenmesi algoritmalarının ezberleme yapmasını engeller.
- Eksik verileri tamamlama işlemi, veri setindeki eksik değerleri ortalamasıyla, rastgele değerle değiştirmek veya tamamen ortadan kaldırmak gibi yöntemlerle doldurur.
- Ön işleme sonucunda 303 veri girişi yerine 297 normalize edilmiş veri elde edilir ve daha düzgün sonuçlar alınmaya çalışılır.