Yazeka
Arama sonuçlarına göre oluşturuldu
Etiket kodlama, kategorik verileri sayısal forma dönüştürmek için kullanılan bir tekniktir 2. Bu süreçte şu adımlar izlenir:
- Benzersiz kategorilerin tanımlanması 2.
- Sayısal etiketlerin atanması 2. Her kategoriye 0 veya 1'den başlayarak benzersiz bir tamsayı değeri verilir 2.
- Orijinal değerlerin değiştirilmesi 2. Kategorik değerler, karşılık gelen sayısal etiketlerle değiştirilir 2.
Örnek: "Meyve" sütunu "Elma", "Muz" ve "Portakal" değerlerini içeriyorsa, etiket kodlamadan sonra "Elma" 0, "Muz" 1 ve "Portakal" 2 ile temsil edilebilir 2.
Yaygın etiket kodlama türleri:
- Sıralı etiket kodlaması: Kategoriler önceden tanımlanmış bir sıraya göre etiketlenir 2.
- Sayımı etiket kodlaması: Kategoriler, veri kümesindeki sıklık sayılarıyla değiştirilir 2.
- Frekans etiketi kodlaması: Sayım kodlamasına benzer, ancak sayım toplam veri noktalarına bölünerek normalleştirilir 2.
Python'da etiket kodlama için
LabelEncodersınıfı kullanılabilir 5. Örneğin,
df['my_column'] = lab.fit_transform(df['my_column'])kodu ile "my_column" üzerindeki etiket kodlama işlemi gerçekleştirilir 5.
Etiket kodlama sırasında veri sızıntısı ve yüksek kardinalite gibi sorunlara dikkat edilmelidir 2.
5 kaynaktan alınan bilgiyle göre: