Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, bir eğitim içeriği olup, konuşmacı RapidMiner programında eksik verilerle nasıl çalışılacağını göstermektedir.
- Video, Titanic veri kümesi üzerinde eksik veri işleme yöntemlerini adım adım anlatmaktadır. Konuşmacı, eksik verileri temizleme için üç temel yöntem göstermektedir: özellik bazlı filtreleme (select attributes), eksik verileri belirli bir değerle değiştirme (replace missing values) ve eksik verileri içeren satırları silme (filter). Video, veri ön işleme aşamasının önemini vurgulayarak, eksik verilerin temizlenmesinin makine öğrenme algoritmalarının doğru çalışması için gerekli olduğunu belirtmektedir. Ayrıca, inputation yöntemleri hakkında daha detaylı bir video çekileceği de duyurulmaktadır.
- 00:01Eksik Verilerle Çalışma Yöntemleri
- Bu videoda eksik verilerle nasıl çalışılacağı gösterilecek ve Rapid Miner'ın eksik veriler için geliştirdiği yöntemler anlatılacak.
- Titanic verileri, batan ve battıktan sonraki yolcuların durumunu gösteren bir veri kümesidir ve bu verilerde yaş kolonunda 263, kabin kolonunda 104, passenger fair kolonunda 1 eksik veri bulunmaktadır.
- 00:39Kolon Bazlı Eksik Verileri Silme
- Eksik verilerin olduğu kolonları almak istemiyorsanız "Select Attribute" kullanarak özellik bazlı filtreleme yapabilirsiniz.
- "Attribute Filter" ile "Subset" seçeneği ile istenmeyen kolonları seçebilir veya "Invert Selection" ile bunların dışındakileri seçebilirsiniz.
- 01:50Eksik Verileri Değiştirme
- Eksik verileri değiştirmek için "Replace Missing Values" özelliği kullanılabilir.
- "Replace by Average" yöntemi ile eksik yaş değerleri, tüm yaş verilerinin ortalaması ile değiştirilebilir.
- Bu yöntemle eksik yaş değerleri 29.881 ile değiştirilmiş ve yeni veri kümesinde yaş kolonunda eksik değer kalmamıştır.
- 04:10Satır Bazlı Eksik Verileri Silme
- Eksik verileri içeren satırları silmek için "Filter Examples" kullanılabilir.
- "No Missing Value" seçeneği ile eksik veri içeren satırlar filtrelenebilir.
- Bu yöntemle passenger fair ve port ambercation kolonlarında eksik veri içeren satırlar silinmiştir.
- 05:22Sonuç ve Gelecek İçerikler
- Veri ön işleme aşamasında eksik verileri temizlemek, makine öğrenme algoritmalarını beslemek için gerekli bir adımdır.
- "Inputation" denilen yöntem için ayrı bir video çekilecektir.
- Rapid Miner'ın kendisini tahmin etmesi gibi diğer inputation yöntemleri de ilerleyen serilerde ele alınacaktır.