Tekilleştirme, bir veri kümesi içindeki veya birden çok veri kümesindeki tekrarlayan verilerin kaldırılması işlemidir. Bu işlem, verilerin boyutunun küçültülmesine yardımcı olarak depolamayı, iletmeyi ve işlemeyi daha kolay ve hızlı hale getirir. Tekilleştirme yöntemleri arasında: - Bit düzeyinde tekilleştirme: Dosyaların ikili değerlerinin karşılaştırılması; - Blok düzeyinde tekilleştirme: Daha büyük veri bloklarının karşılaştırılması; - Dosya düzeyinde tekilleştirme: Tüm dosyaların karşılaştırılması; - Veri parmak izi alma: Her bir veri parçası için benzersiz bir tanımlayıcı oluşturulması; - Makine öğrenimi tabanlı tekilleştirme: Benzerliklerine göre yinelenenlerin tanımlanması ve kaldırılması bulunur.