Yazeka
Arama sonuçlarına göre oluşturuldu
DF (Döküman Sıklığı) değeri, ilgili kelimenin geçtiği döküman sayısının tüm dökümanlardaki toplam döküman sayısına bölünmesiyle hesaplanır 1.
Formül: DF = toplam döküman sayısı / (ilgili kelimenin geçtiği döküman sayısı) 1.
Örneğin, 4 döküman olduğunu ve "d" kelimesinin 3. dökümandan 3 kez geçtiğini varsayarsak:
- doc3.count(key) = 3 1;
- len(doc3) = 5 1;
- TF = 3 / 5 = 0,6 1;
- total_doc_number = 4 1;
- DF = 4 / 3 = 1,33 1.
DF değerinin logaritması alınarak IDF (Ters Döküman Sıklığı) değeri hesaplanır 1. Bir kelime diğer dökümanda ne kadar sık geçiyorsa DF değeri artar, IDF değeri o kadar azalır 1.
TF-IDF (Terim Sıklığı - Ters Döküman Sıklığı) değeri ise TF ve IDF değerlerinin çarpılmasıyla elde edilir 1.
5 kaynaktan alınan bilgiyle göre: