Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, Trenez Academy kanalında yayınlanan bir makine öğrenmesi eğitim içeriğidir. Eğitmen, k en yakın komşu algoritmasını detaylı bir şekilde anlatmaktadır.
- Video, denetimli öğrenme, sınıflandırma ve regresyon kavramlarını açıklayarak başlıyor, ardından k en yakın komşu algoritmasının temel prensiplerini ve çalışma mantığını anlatıyor. Eğitmen, mglearn ve sklearn kütüphanelerini kullanarak grafiksel örnekler gösteriyor ve göğüs kanseri veri seti üzerinde uygulama yapıyor. Ayrıca model oluşturma, doğruluk oranını hesaplama ve modelin performansını değerlendirme süreçlerini adım adım anlatıyor.
- Video, farklı komşuluk sayılarına göre model performansını karşılaştıran grafiklerle sonlanıyor ve Python programlama dilinde k en yakın komşuluk regresyon algoritmasını öğrenmek isteyenler için faydalı bir kaynak niteliğindedir.
- Makine Öğrenmesi ve Denetimli Öğrenme
- Derste k en yakın komşu algoritması anlatılacak.
- Denetimli öğrenme (supervised learning), en yaygın kullanılan makine öğrenmesi çeşididir.
- Denetimli öğrenme algoritmaları girdilerden belirli sonuçları tahmin etmek için kullanılır ve eğitim verisini oluşturmak için insan yardımına ihtiyaç vardır.
- 01:29Sınıflandırma ve Regresyon
- İki önemli denetimli öğrenme çeşidi vardır: sınıflandırma ve regresyon.
- Sınıflandırmada amaç, önceden belirlenmiş listeden seçilecek sınıf etiketini tahmin etmektir ve ikili sınıflandırma (evet/hayır) ve çoklu sınıflandırma şeklinde ikiye ayrılır.
- Regresyonda amaç sürekli değerleri tahmin etmektir ve sonuç değişkeni sürekli bir değişken ise regresyon yöntemi, kategorik bir değişken ise sınıflandırma yöntemi kullanılır.
- 03:20K En Yakın Komşu Algoritması
- K en yakın komşu algoritması, en basit makine öğrenme algoritmalarından biridir ve yeni bir veri öznitelik değerlerine göre en yakın komşu ve komşuların sınıfına atanır.
- En basit versiyonu bir en yakın komşuluğa göre sınıflandırmadır.
- MGlearn kütüphanesi kullanılarak bir en yakın komşuluğa ve üç en yakın komşuya göre sınıflandırma grafikleri çizdirilebilir.
- 05:45K En Yakın Komşu Algoritmasının Kullanımı
- Veri seti parçalamak için train test split fonksiyonu kullanılır.
- K en yakın komşuluğu sınıfı import edilip, komşuluk sayısına göre sınıf değişkenine atanır.
- Model kurulduktan sonra test verisinde tahmin yapmak için predict metodu, modelin doğruluğunu değerlendirmek için ise score metodu kullanılır.
- 07:16Gerçek Dünya Veri Seti Uygulaması
- Cct learn'deki load brass cancer fonksiyonu kullanılarak göğüs kanseri tümörü ölçümleri içeren bir veri seti yüklenir.
- Veri setinde 569 örnek ve her birinde 30 öznitelik mevcuttur; 212 kanserli ve 357 zararsız tümör bulunur.
- 1'den 10'a kadar komşuluk sayılarına göre modeller kurularak, en iyi performansı gösteren modelin yaklaşık 6 komşuluk sayısına göre oluşturulduğu grafikte görülmüştür.
- 10:56K En Yakın Komşuluk Regresyonu
- K en yakın komşuluk regresyonu, mglearn kütüphanesindeki veri seti kullanılarak gösterilmiştir.
- Komşuluk sayısı olarak 1 alınarak, yeşil renkteki yıldızlar yeni eklenen noktalar, mavi renkteki yıldızlar ise test verisinin tahmin değerlerini göstermektedir.
- Komşuluk değeri 3 alınarak model oluşturulduğunda, doğruluk oranı 0,83 olarak hesaplanmış ve bu değer modelin nispeten iyi olduğunu göstermektedir.
- 12:32Kanal Bilgileri
- Kanalda 400'den fazla eğitim videosu bulunmaktadır.
- Özellikle Python ve kütüphaneleri dersleri şiddetle tavsiye edilmektedir.