Verilerin istatistiksel güvenilirliği

Yandex.Metrica, sitenizin çalışmasıyla ilgili hesaplama metotları açısından size sağlam, güvenilir ve ayrıntılı veriler sağlar. Ancak sitenin işleyişini analiz etmek açısından bu her zaman böyle değildir: Örneğin, bir ziyaretçinin siteye gelip 20 dakika boyunca sayfalara bakması durumunda ortalama site ziyaret süresinin 20 dakika olduğu teknik olarak doğrudur. Fakat gerçekte bu doğru değildir ve sadece bu verilere dayanarak gerçeği yansıtan bir sonuca varılamaz.

Bir örnek daha verelim: Dönüşümlerle sonuçlanan ziyaretlerin genellikle başladığı site sayfalarını bulmamız gerektiğini düşünelim. İlk bakışta görev çok basit görünüyor: Varış sayfaları raporunu açıyor, uygun hedefi seçiyor ve raporu "dönüşüme göre" sıralıyoruz.

Rapor, üzerinde bir ziyaretçinin bulunduğu pek çok sayfa içeriyor ve aynı zamanda hedefe ulaşmış; bu sayfalardan başlayan ziyaretlerin dönüşümü %58. Ancak bu tür sayfaların yapmamız gereken analiz açısından değerinin 0'a yakın olduğu da belli. Sayfa görüntüleme sayısına bir sınır belirlemeyi deneyebilirsiniz; örneğin, en az 100 görüntüleme.

100 görüntülemenin yeterli olmadığını görüyoruz: 100'den fazla kez izlenen sayfalar var, ancak tek ziyaret (ve aynı zamanda hedefe ulaşma ziyareti) çerçevesindeler. Bu durum, sayfa yenilenmesi veya robot ziyaretlerinden kaynaklanabilir. Nedeni ne olursa olsun raporumuzda bulunan bu satırlar bizi ilgilendiren veriler görmemizi engellediği için raporu bunlardan arındırmamızda yarar var. 1000 görüntüleme verelim.

Böylece raporumuzu gereksiz bilgilerden arındırmış olduk. Ancak burada dikkat edilmesi gereken bir husus vardır; ziyaret sayısı için uygulayacağımız sınırlama değeri doğal olarak seçtiğimiz raporlama süresine göre değişmelidir.

Bu örnek göstermektedir ki site işleyişini analiz etmek için önemli olan hesaplanan dönüşüm değil, çok sayıda ziyaret olsaydı göreceğimiz gerçek dönüşümdür. 1000 ziyaret üzerine bakıldığında hesaplanan ile gerçek dönüşüm oranları arasında fark çok fazla olmazken Tek bir ziyaret içinse gerçek dönüşüm, çok küçük bir değerden %100'e kadar herhangi bir yerde olabilir.

Matematiksel istatistik yöntemleri, hesapladığımız bir dönüşüm değerinin gerçek dönüşüm değerinden çok az farklı olduğunu (örneğin, en fazla %5) güvenle ifade etmemize (örneğin, %95 olasılıkla) imkan verecek gerekli ziyaret sayısını hesaplamamızı sağlar.

Yandex.Metrica bu tür hesapları otomatik yapmayı ve içindeki değerlerin teorik gerçek değerlerden çok az farklı olacağından emin olunamayacağı rapor satırlarını gizlemeyi sağlar. Bu işlev, İstatistiksel olarak güvenilemeyen verileri gizle alanıyla sağlanır.

Bu filtreleme özelliği, verilerin an itibarıyla sıralanmış olduğu sütunun değeri için uygulanır. Ayrıca gerektiğinde filtreleme eşik değerlerini de (başka bir deyişle, yukarıda sözü edilen %95'lik olasılık ve %5'lik sapma yüzdelerini) istediğiniz gibi düzenleyebilirsiniz: