Arama kalitesini ölçme ve iyileştirme

Yandex, Arama’yı iyileştirmek için hedefli çabalar sarf etmektedir. Arama sonuçlarını üreten algoritmadaki her değişiklik, Arama geliştirme ilkelerini karşılamalıdır.

Arama geliştirme ilkeleri

Aramanın amacı, kullanıcıya tam, faydalı ve ilgili bilgileri, görevleri hızlı ve kolay bir şekilde gerçekleştirebileceğiniz şekilde sağlamaktır.

Arama sonuçları, tarafsız sıralama ve veri sunumunu sağlamak için tamamen makine öğrenimi algoritmaları tarafından üretilir. Arama sonuçları manuel olarak yeniden sıralanamaz.

En alakalı sayfaları bulmak için Arama, sorgunun, sayfa içeriğinin ve bu sayfalarla kullanıcı etkileşimi geçmişinin yanı sıra dil, konum, farklı sayfalar arasındaki ilişkiler ve birçok diğer faktörün otomatik analizini gerçekleştirir. Makine öğrenimi sıralama algoritmalarının kalitesi, otomatik olarak hesaplanan ölçümlere dayalı olarak izlenir.

Arama sonuçlarıyla kullanıcı etkileşimleri hakkında otomatik olarak toplanan veriler ve arama sonucu seçeneklerini manuel olarak işaretleyen değerlendiricilerin değerlendirmeleri, sıralama algoritmalarının makine öğrenimi için girdi olarak hizmet eder. Değerlendirici değerlendirmeleri, algoritma tarafından üretilen arama sonuçlarının kalite ve sorgulara uygunluk açısından kontrol edilmesi için de kullanılır. Değerlendiricilerin tarafsızlığı, işe alım, eğitim, talimatlar ve araçlara kadar uzanan bir kontrol sistemi ile sağlanır. Değerlendiriciler için talimatlar, belge kalitesini ve sorguya uygunluğunu nasıl değerlendireceklerini açıklar. Bunlar, objektif değerlendirmeleri sağlamak için tasarlanmıştır. Bireysel önyargılı değerlendirmelerin etkisini telafi etmek için her zaman bir miktar örtüşme vardır. Ayrıca, değerlendirmeler asla doğrudan sıralamada kullanılmaz, çünkü bunlar yalnızca sıralama algoritmalarının makine öğrenimi için hizmet eder.

Tüm sıralama sistemi değişiklikleri, manuel müdahaleyi ortadan kaldırmak için sıralama algoritmalarının uygulanması yoluyla gerçekleşir. Tüm değişiklikler gözlemlenebilir, her birine kişisel sorumluluk atanır ve bunlar değerlendirici değerlendirmelerine (Proxima) ve arama sonuçları öğeleriyle kullanıcı etkileşimine (Proficit) dayalı ölçümlerle otomatik olarak kontrol edilir.

Yandex, dizinleme için kullanılabilir birçok kaynaktan toplanan bilgileri bulmayı mümkün kılar. Bilgi dizinlemesinin tamlığı en yüksek önceliktir. Veri dizinleme, her tür kaynak için eşit şekilde gerçekleştirilir. Dizinlenen içerik, yalnızca sayfalar spamdexing olarak kategorize edilirse, kullanıcıya zarar verebilecekse veya geçerli yasaları ihlal ediyorsa arama sonuçlarından kaldırılabilir.

Arama’nın amacı, kullanıcıların zamanını tasarruf ederek bilgiyi en kullanışlı biçimde sunmaktır. Bireysel sonuçların ve genel arama sonuçlarının faydası, Arama sonuçlarıyla kullanıcı etkileşimlerinin analizi yoluyla incelenir. Veri sunumunun biçimi ve tamlığı, kullanıcının amacını karşılama olasılığı ve sunulan bilginin türü tarafından belirlenir ve belirli veri kaynağına bağlı değildir.

Arama algoritmalarındaki değişiklikler nasıl değerlendirilir

Arama algoritmalarındaki potansiyel değişiklikler iki ölçüm temelinde değerlendirilir:

  • Proxima — Yandex tarafından toplanan veritabanındaki (dizin) sayfaların değerlendirilmesine ve diğer veri kalitesi sinyallerine dayalı olarak hesaplanan bir sayfa kalite ölçümü.
  • Proficit — Arama sonuçlarının kullanılabilirliğini kullanıcı etkileşimlerine dayalı olarak hesaplayan bir ölçüm.

Yandex, arama kalitesi sonuçlarını değerlendirmek için profesyonellerin (değerlendiricilerin) hizmetlerini geniş çapta kullanır. Kalite ve uygunluk açısından bireysel siteleri ve diğer arama sonuçları öğelerini değerlendirirler. Değerlendiricilerin değerlendirmeleri arama sonuçlarını doğrudan etkilemez. Bunun yerine, sıralama algoritmasındaki belirli bir değişikliğin uygun olup olmadığını belirlemeye yardımcı olurlar.

Uygun olduğu düşünülen değişiklikler çevrimiçi bir deneyle kontrol edilir. Böyle bir deneyde, kullanıcılar rastgele iki gruba ayrılır: bir grup yeni işlevselliği alırken, diğer grup mevcut arama seçeneğini alır. Deney sırasında gerekli miktarda veri toplandıktan sonra, Yandex ekibi önerilen değişikliğin kullanıcılar için olumlu olup olmadığına karar verir. Bu karar, Proficit’in ana ölçüm olarak kabul edildiği Arama kalite ölçümlerinin kabulüne dayanır.

Proxima

Proxima, değerlendiricilerin değerlendirmeleri ve ek sinyaller üzerine inşa edilmiş bir sayfa kalite ölçümüdür. Proxima, algoritmanın sayfa kalitesini daha hassas bir şekilde ayırt etmesini sağlamak için birçok yönü dikkate alır, bunlar arasında:

  • sorguya sayfa uygunluğu (çeşitli konu uzmanlarından uzman değerlendirmeleri dahil);
  • belirli bir sayfa ve sitede kullanıcının amacını karşılama olasılığı;
  • içeriğin kalitesi, faydası ve benzersizliği;
  • faydalı ve müdahaleci içerik arasındaki denge;
  • içeriğin kalitesi ve karmaşık konularda yazarın güvenilirliği hakkında ek sinyaller (sağlık hizmetleri, hukuki ve finansal hizmetler gibi);
  • kullanıcının içeriği tüketme kolaylığı.

Daha fazla ayrıntı ve örnekler, 8, 9 ve 10 Webmaster atölyelerimizdeki Proxima hikayelerimizde mevcuttur. Ekibimiz, sayfaların kalitesini ve kullanıcı hedeflerinin çözümünü ölçmek için yeni sinyaller ekleyerek ölçümü geliştirmeye devam ediyor.

Proficit

Proficit’in amacı, arama sonuçlarının faydasını ölçmektir (kullanıcının amacının ne kadar hızlı karşılanabileceği).

Proficit, tüm bağımsız arama sonuçlarıyla ve diğer arama sonucu öğeleriyle kullanıcı etkileşimlerinin kalitesini ve miktarını dikkate alır. Daha yüksek tahmin edilen Proficit değerlerine sahip veri sunum biçimleri, arama sonuçlarını oluşturmak için seçilir.

Arama sonuçları sayfasındaki öğelerin karşılıklı düzeni ve kümesi, sayfanın bir bütün olarak maksimum tahmin edilen Proficit ve Proxima değerlerine ulaşmak için yapılandırılmıştır. Tahmin edilen değer, arama sonuçları sayfasındaki öğelerin çeşitli kombinasyonları için ölçülür. Bu öğeler, belirli düzenleme için maksimum tahmin edilen Proficit değerine ulaşmak amacıyla düzenlenmiştir. Öğeler farklı şekilde düzenlenirse, arama sonuçlarının tamamının nihai hesaplanan Proficit’inin daha düşük olması yüksek ihtimaldir. Belirli arama sonuçlarının gerçek Proficit’i tahmin edilen değerden farklıysa, algoritma bu durumu yeniden eğitim sırasında dikkate alır.

Proficit’i ölçme kuralları ve etkileyen ana faktörler

Proficit (arama sonuçlarının tamamı ve bireysel öğeler) aşağıdaki kurallara göre hesaplanır:

  • Kullanıcının arama sonuçlarının bir öğesiyle olan her etkileşimi başarılı veya başarısız olarak kabul edilir.
  • Eğer etkileşim başarılı kabul edilirse (örneğin, kullanıcı bir sorgu yaptı, harici bir siteye gitti ve uzun süre Arama’ya dönmediyse), ölçüm olumlu bir şekilde artırılır.
  • Buna karşılık, eğer etkileşim başarısız kabul edilirse (örneğin, kullanıcı kısa bir süre sonra arama sonuçları sayfasına döndüyse veya gerekli bilgiyi bulmak için sorguyu yeniden yapmak zorunda kaldıysa ya da kullanıcının amacı başka bir öğe kullanılarak karşılandıysa), ölçüm azaltılır. En büyük ceza, arama sonuçlarında büyük bir alan kaplayan ve kullanıcıya çekici gelen en görünür öğeler için uygulanır.
  • Arama sonuçları bütünüyle kullanıcının amacını karşılayamazsa ve sorgu yeniden yapılmak zorunda kalırsa, ölçüm de azaltılır.

Ölçüm, arama sonuçlarındaki tıklamaları (örneğin, bağlantılar, işletme profilleri, telefon numaraları) ve tıklamasız etkileşimleri (kullanıcının gerekli bilgiyi gerçek yanıt içinde bulduğu durumlar ve diğerleri) dikkate alır. Her ikisi de ölçüm değerini artıran başarılı bir etkileşimin parçası olabilir.

Sayfa güncelleme tarihi: 22 Mart 2024.




Ayrıca şuraya gidebilirsiniz: