K-Nearest Neighbors (KNN) algoritması şu şekilde çalışır:
- Vektörleştirme: Veri kümesindeki her veri noktası, çok boyutlu bir alanda vektör olarak temsil edilir 12.
- Uzaklık Hesaplaması: Yeni bir veri noktasını (sorgu noktası) sınıflandırmak için algoritma, uzaklık işlevini kullanarak sorgu noktası ile veri kümesindeki diğer tüm noktalar arasındaki uzaklığı hesaplar 13.
- Komşuları Bulma: Algoritma, hesaplanan mesafelere göre sorgu noktasına en yakın k veri noktalarını (komşular) tanımlar 12. Burada k, komşu sayısını belirten bir parametredir 24.
- Tahminde Bulunma: Sınıflandırma için kNN, k komşular arasında en yaygın olan sorgu noktasına sınıf etiketini atar (çoğunluk oyu prensibi) 12. Regresyon için ise sorgu noktasının değerini, k komşularının değerlerinin ortalaması (veya bazen ağırlıklı ortalaması) olarak tahmin eder 13.
5 kaynaktan alınan bilgiyle göre: