Buradasın
BERTopic hangi algoritmayı kullanıyor?
Yazeka
Arama sonuçlarına göre oluşturuldu
BERTopic, konu modelleme için aşağıdaki algoritmaları kullanır:
- Dönüştürücü tabanlı gömme (embedding) 13. Belgeler, BERT gibi dönüştürücü tabanlı dil modelleri kullanılarak yüksek boyutlu yoğun vektör temsillerine dönüştürülür 13.
- Boyutluluk azaltma (dimensionality reduction) 13. UMAP (Uniform Manifold Approximation and Projection) kullanılarak yüksek boyutlu embeddingsler daha düşük boyutlu bir alana indirgenir 13.
- Kümeleme (clustering) 13. HDBSCAN (Hierarchical Density-Based Spatial Clustering of Applications with Noise) algoritması ile benzer belgeler kümelere ayrılarak konular oluşturulur 13.
- Konu gösterimi (topic representation) 13. c-TF-IDF (class-based TF-IDF) kullanılarak her konu, otomatik olarak oluşturulan etiketlerle temsil edilir 13.
5 kaynaktan alınan bilgiyle göre: