Yazeka
Arama sonuçlarına göre oluşturuldu
Yandex'in konuşma tanıma teknolojisi, SpeechKit adı verilen bir sistem üzerinden çalışır 23. Bu sistem, aşağıdaki adımlarla işlev görür:
- Akustik Model: Ses sinyaline karşılık gelen düşük seviyeli özellik kümesini belirler 2.
- Dil Modeli: Akustik model çıktısını kullanarak metni kelimelerle oluşturur 2.
- Metin İşleme: Hizmet, metin üzerinde noktalama işaretleri ekleme, rakamları sayıya çevirme gibi işlemler yapar 2.
Ayrıca, sinir ağları kullanılarak argo ifadeleri, gayri resmi ve olumsuz ifadeler tespit edilir, konuşan kişinin cinsiyeti ve diyalog sırasında söylediği ifadeler belirlenir 1.
SpeechKit, API veya Python SDK aracılığıyla erişilebilir ve gerçek zamanlı konuşma tanıma (streaming recognition) ile ses kayıtlarının tanınması gibi çeşitli kullanım alanlarına sahiptir 2.
5 kaynaktan alınan bilgiyle göre: