Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, veri madenciliği eğitim serisinin 21. videosu olup, bir konuşmacı tarafından KNN (En Yakın K Komşu) sınıflandırma algoritması hakkında bilgi verilmektedir.
- Video, KNN algoritmasının temel prensiplerini açıklayarak başlıyor ve ardından Veka programında bu algoritmanın nasıl uygulanacağını gösteriyor. Konuşmacı, KNN'nin Euclidean mesafesi kullanarak en yakın k komşuya bakarak sınıflandırma yaptığını, majority voting (çoğunluk oylaması) özelliğini ve meta classification tekniklerindeki kullanımını anlatıyor.
- Videoda ayrıca KNN'nin diğer algoritmalara göre avantaj ve dezavantajları ele alınıyor ve K değerinin nasıl ayarlanabileceği ile bu ayarların başarı oranına etkisi üzerinde duruluyor. Konuşmacı, bir sonraki videoda yapay sinir ağları ile ilgili bilgiler vereceğini belirtiyor.
- 00:01K-Nearest Neighbor (KNN) Algoritması Tanıtımı
- Bu video, veri madenciliğinde kullanılan K-Nearest Neighbor (KNN) algoritması hakkında bilgi vermektedir.
- KNN, sınıflandırma grubu altında benzerlik fonksiyonlarının kullanıldığı bir algoritmadır.
- KNN algoritması 1950'lerden itibaren istatistik dünyasına kazandırılmış ve hala kullanılan bir yöntemdir.
- 01:13KNN Algoritmasının Çalışma Prensibi
- KNN algoritması, verilerin iki boyutlu bir uzayda özellik çıkarımından sonra yerleştirildiği bir sistemde çalışır.
- Yeni bir veri geldiğinde, en yakın K komşuya bakarak hangi sınıfa dahil edileceğini belirler.
- K değeri genellikle tek sayı olarak seçilir ki eşitlik durumu olmasın.
- 03:14Mesafe Ölçme Yöntemleri
- KNN algoritmasında mesafeler Euclidean distance (Euklides mesafesi) olarak hesaplanır.
- Ayrıca Manhattan distance (apartman blokları mesafesi) ve Minkowski distance gibi farklı mesafe ölçme yöntemleri de kullanılabilir.
- Weka'da KNN algoritması varsayılan olarak Euclidean distance kullanır.
- 04:26Weka'da KNN Uygulaması
- Weka'da "glass.arff" veri seti kullanılarak KNN algoritması test edilmiştir.
- ZeroR ile sınıflandırma yapıldığında başarı oranı %35 olarak bulunmuştur.
- KNN algoritması kullanıldığında K değeri değiştirildiğinde başarı oranı değişmektedir.
- 05:52K Değerinin Etkisi
- K değeri belli bir noktaya kadar arttırıldıkça başarıyı artırabilir, ancak belli bir noktadan sonra düşüşe neden olabilir.
- Çok yüksek K değerleri kullanıldığında, hatta ZeroR'dan daha kötü sonuçlar elde edilebilir.
- KNN algoritması, bütün veri setini taradığı için diğer algoritmalarına göre daha yavaş çalışabilir.
- 07:40KNN Algoritmasının Avantajları ve Dezavantajları
- KNN algoritması anlaşılması ve anlatılması basit bir yöntemdir.
- Tüm veri kümesi ile uğraşması gereken KNN, diğer algoritmalarına göre daha karmaşık veri yapıları gerektirir.
- Kodlama sırasında KNN algoritması diğer algoritmalarına göre daha karmaşık gelebilir.
- 09:17Ensembling Teknikleri ve Majority Voting
- Ensembling teknikleri, birden fazla tekniğin aynı anda kullanılması yöntemleridir.
- Meta classification, birden fazla sınıflandırma yöntemlerinin üzerinde çalışan sınıflandırma yöntemleridir.
- Majority voting (çoğunluk oylaması), birden fazla sınıflandırma algoritmasının çoğunluğun oyu neyse o sınıflandırma sonucunu verir.
- 10:22Meta Sınıflandırma Teknikleri
- Meta kelimesi Latince'den gelir ve "üst sınıflandırma" veya "öte sınıflandırma" anlamına gelir.
- Meta sınıflandırma teknikleri, birden fazla sınıflandırma tekniğinin kullanıldığı alanlarda çoğunluğun oyu ne olduğunu belirleyerek sınıflandırma yapar.
- KNN algoritması, majority voting özelliğinden dolayı bu tür bir yaklaşımı temsil eder.
- 11:07Video Kapanışı
- Bir sonraki videoda archal neural network konusu ele alınacaktır.
- Sorular için sadevrenseker.com adresine başvurulabilir.
- Videolar takip edilmeye başladığı için gelen sorular cevaplanmaya çalışılıyor ve hatalar mümkün olduğunca düzeltilmeye çalışılıyor.