Yandex’in arama sonuçlarını sıralama ilkeleri

İnternet, milyonlarca sitenin içerdiği exabaytlarca bilgiyle oluşuyor. Arama motorları ise; bir kullanıcının, o bilginin web’de varolduğunu tespit edip bundan (ve daha genel bir bakışla, insanın bilgiye erişim hakkından da) yararlanmasına olanak sağlayan bir araç olarak karşımıza çıkmaktadır. Kısacası bir arama motoru, kullanıcıların internetteki bilgilere kolay ve çabuk erişimlerini sağlayan teknik bir araçtır.
Kulanıcılar web’de, bilimsel makalelerden erotik resimlere kadar çok farklı şeyler arar. Ve Yandex’in genel ilkesi, sorgunun konusu ister belirli bir konu üzerindeki bilimsel bir makale, isterse erotik içerik olsun, arama motorunun kullanıcıya sunduğu arama sonuçlarının her zaman sorguya yüzde yüz uymak zorunda olduğu yönündedir. Tabii ki, bu bağlamda her arama motorunun sadece web’de varolan ve halka açık bilgiyi bulup kullanıcıya sunabildiğini akılda tutmamız gerekmektedir.
Arama indeksinde asla sansür uygulamayan Yandex, indekslediği web sitelerinin içeriği için sorumlu değildir. Bu ilke, Yandex.ru sitesinin kurulduğu 1997 yılına ait ve Yandex şirketinin ilk resmi belgelerinden biri olan “Yandex Arama Motoru Kullanım Lisansı”nda şöyle geçer: “Bağımsız insanlar ve kuruluşların kurduğu web sitelerini indeksleyen Yandex, arama motoru aracılığıyla bulduğunuz sayfaların içeriği veya kalitesi için sorumlu tutulamaz. Web’de hoşumuza gitmeyen birçok şey olmasına karşın biz Yandex olarak internetin sansürcüsü değil, aynasıyız.”
Bir bilgi parçası internetten kaldırılırsa Yandex’in arama indeksinden de kaldırılır. Yandex’in indeksleme robotları, daha önce indekslenmiş siteleri düzenli olarak yoklayarak bir tanesinin web’den kaldırıldığını veya indeksleme için kapatıldığını tespit ettiğinde, ilgili içeriği hemen arama indeksinden de kaldırır. Webmasterler bu işlemi hızlandırmak için “URL Sil” formundan yararlanabilirler.
Kullanıcı, arama satırına bir sorgu yazınca arama motoru, arama indeksinde bulunan tüm sitelerden sorguda bulunan sözcüklerin geçtiği (ve ayrıca ilgili meta etiketleri ve bağlantıları da o sorgudaki sözcükleri içeren) siteleri seçer. Bu işlemin sonucunda bulunan sitelerin sayısı genellikle kullanıcının tamamını inceleyemeyecegi kadar fazla olur. Kullanıcının işini kolaylaştırmak için ilgili arama sonuçlarının, sorguya en uygun olanları (başka bir deyişle, sorguyla en yakından ilgili olanı) listenin başında bulunacak şekilde sıralanır. Yanıtların sorguyla ilgililik derecesi, sorgu ve belgenin binlerce özelliğinin hesaba katıldığı oldukça karmaşık formüller sayesinde tamamen otomatik olarak tespit edilir. Aramanın kalitesini belirleyen bu otomatik işleme, sıralama denir. Sıralama formülleri, makine öğrenimi sayesinde otomatik olarak geliştirilerek sürekli iyileştirilir. Nedeni açıktır; arama kalitesi, bir arama motorunun kullanıcılar arasında popülerliğini belirleyen en önemli özelliktir; aramayı kötü yapan arama motoru, kullacılarını çabuk kaybeder.
Dolayısıyla arama algoritmalarının sürekli iyileştirilmesi ve webmasterlerin arama algoritmalarını aldatma girişimleri gibi dış etkilere karşı dayanıklılığının pekiştirilmesi çok önemlidir.
Bu varsayımdan dolayı Yandex, arama sonuçlarında konulandırma üzerinden asla para kazanmaz.
Ve bu nedenle Yandex çalışanlarının politik, dini ya da diğer konulardaki tercihleri, Yandex arama sonuçlarını kesinlikle etkilemez.
Kullanıcıların arama sonuçlarını genellikle listeler halinde, baştan aşağıya doğru inceledikleri unutulmamalıdır. Buna göre Yandex, sorguya en uygun yanıtları listenin başına yerleştirir. Sorguya uygun olan birden fazla yanıt varken bunları uygunluk derecesine göre otomatik olarak sıralayan Yandex algoritmaları, web sitelerini aşağıda sıralanan belirli birkaç kurala göre işler:
  • 1.Kasıtlı olarak arama kalitesini düşürmek isteyenler; bu amaçla görünmeyen veya tamamen anlamsız metinler içeren ya da İngilizce “doorway” olarak adlandırılan ve kullanıcıları başka sitelere yönlendiren “ara” sayfalar kurarak arama motorunu “aldatmaya” çalışırlar. Ayrıca bazıları, kullanıcının web’i tarama tarihçesinde az önce terkettiği arama sonuçları sayfasının bağlantısını başka bir sayfaya yönlendiren bağlantıyla değiştirir. Böylece kullanıcı o arama sonuçlarına geri dönmek istediğinde, tamamen farklı bir sayfaya ulaşır.
  • Kullanıcı kitlesinin ilgisini hiç çekmeyen, kullanıcının güvenini aldatan ve arama kalitesini önemli ölçüde düşüren bu tür “sahte” kaynaklar Yandex tarafından otomatik olarak ya arama indeksinden kaldırılır ya da sıralamadaki yerleri daha aşağıda yer alır.
  • 2.Diğer bir örnek, içeriği anlamlı ve yararlı olan fakat sayfanın kaydırma çubuğunu takip eden “popunder” bannerleri veya kullanıcı bulunduğu sayfanın herhangi bir yeri tıklayınca sayfanın üzerine aniden çıkan “clickunder” reklamları yüzünden anlaşılması zor olan sitelerdir. Anılan reklam türlerinin ikisinin de sayfadaki bilginin anlaşılmasını zorlaştırdığını varsayan Yandex, böyle siteleri arama sonuçları listesinde içeriği kolay anlaşılır sitelere göre daha düşük pozisyonlara koyar.
  • 3.Gelen sorgu açık bir şekilde erotik içeriğe yönelik olmadıkça Yandex, yetişkinlere yönelik siteleri arama sonuçları listesinde ya hiç göstermez ya da listenin en alt kısmında gösterir. Erotik kaynaklarla ilgili olarak yürütülmekte olan yoğun ve agresif tanıtım faaliyetlerinden dolayı, kullanıcılar özellikle erotik içerik arayışında olmasalar bile bu sitelere beklenenden çok daha fazla gösterim sağlanmaktadır. Örneğin erotik içerikli sitelerin, erotikle hiç ilgisi olmayan sorgulara cevaben çıkması da mümkündür. Bu web sitelerinin erotik veya pornografik içerik aramayan kullanıcılarla hiçbir ilgisinin olmamasının yanı sıra arama sonuçlarında beklenmedik bir şekilde bu sitelere rastlanması da doğal olarak söz konusu kullanıcılarda kafa karışıklığına yol açabilir. Yandex’in bu konudaki ilkelerine dair ayrıntılı bilgi için buraya tıklayınız.
  • 4.Sistemlerine zarar verebilecek her türlü tehlikeye karşı internet kullanıcılarını uyarmayı kendine görev bilen ve dolayısıyla indekslediği web sayfalarına virüs bulaşıp bulaşmadığını otomatik olarak kontrol eden Yandex, zararlı yazılım kodlarının bulunduğu siteleri arama indeksinden kaldırmaz ancak bu sitelere yönlendiren arama sonuçları sayfalarındaki bağlantılara bunların risk taşıdığını bildiren bir uyarı simgesi ekler.
Web arama servisinin kalitesini ölçümlemek için Yandex’in uyguladığı ana kriter, arama sonucunda elde edilen sonuçların kullanıcının niyetlerine uygunluk derecesidir. Örneğin, sadece [iphone 4] şeklinde yapılan bir sorgudan hareketle kullanıcının, ürünün özelliklerini öğrenmek ve buna diğer kullanıcıların görüşlerini almak mı, ürünü satın alabileceği bayileri öğrenmek mi istediğini tam olarak saptamak zordur. Dolayısıyla Yandex, çok anlamlı sorguların analizi için özel olarak geliştirdiği Spectrum teknolojisi aracılığıyla bu olasılıkların ikisine de uygun olacak belgeleri, ilgili arama sonuçları listesinin baş kısmına yerleştirerek mümkün olduğu kadar kullanıcıya yardımcı olmaya çalışır.