Apache Tika
Yazeka
Arama sonuçlarına dayanarak oluşturuldu
Apache Tika, Apache Software Foundation tarafından geliştirilen açık kaynaklı bir içerik analiz ve dosya formatı algılama aracıdır. PDF, Word, Excel, görüntü ve ses dosyaları dahil 1000'den fazla dosya türünü tanıyarak metin, meta veri ve dil bilgisi çıkarabilir.
Kurumsal arama sistemleri, dijital arşivleme ve makine öğrenimi gibi alanlarda kullanılır. OCR desteğiyle görüntülerden metin çıkarabilir ve REST API ile farklı platformlara entegre edilebilir.
Java tabanlıdır ancak Python ve diğer dillerle de uyumludur. Güvenlik önlemleri ve modüler yapısıyla geniş bir kullanım alanına sahiptir.
Kısa bilgiler
- Yayın tarihi:22 Mart 2007
- Platformu: