Yazeka
Arama sonuçlarına göre oluşturuldu
Spark Streaming akış şeması, sürekli veri akışlarının işlenmesini içeren Spark Streaming sürecinin adımlarını gösteren bir şemadır 12.
Bu süreç genellikle şu şekilde özetlenebilir:
- Veri Alımı: Veriler, Kafka, Kinesis veya TCP soketleri gibi kaynaklardan gerçek zamanlı olarak alınır 14.
- Mikro-Parti Oluşturma: Gelen veriler, belirli bir zaman aralığına göre (örneğin, her 2 saniyede bir) mikro-partilere ayrılır 12.
- İşleme: Her mikro-parti, dönüşümler (örneğin, filtreleme, gruplama) ve eylemler (örneğin, bir hedefe yazma) için işlenir 12.
- Çıktı: Sonuçlar, dosya, veritabanı veya konsol gibi bir hedefe yazılır 12.
- Hata Toleransı: Checkpointing kullanılarak, arızalarda veri kaybını önlemek için durum kaydedilir 1.
5 kaynaktan alınan bilgiyle göre: