Webmaster

Site indekslenmesi

  1. Yandex arama sistemine siteyi ekleyin.

  2. Sitemap. Web uzmanlarına ve arama sistemlerine kolaylık olması açısından sitemap adında özel bir site haritası biçimi geliştirilmiştir. Sitemap, XML biçiminde sunulan ve sitenin iç sayfa bağlantılarının yer aldığı bir bağlantı listesidir. Bu biçimi Yandex de destekler. İlgili servis bölümünde siteniz için sitemap öğesini yükleyebilirsiniz. Bu, sitenizin bazı sayfalarının robot tarafından gezilme önceliğini etkilemeyi sağlar. Örneğin, bazı sayfalar diğerlerine göre çok daha sık yenileniyorsa, Yandex robotunun işini doğru planlayabilmesi için bu bilgilerin belirtilmesi gerekir.

  3. Robots.txt, arama sistemi robotlarına hizmet eden bir dosyadır. Web uzmanı bu dosyada sitesinin dizin parametrelerini tüm robotlar için tek seferde belirtebileceği gibi, her arama sistemi için ayrı ayrı da belirtebilir. Bu dosyada belirtebileceğiniz en önemli üç parametreye bakalım:

    • Disallow. Bu yönerge, sitenin belirli bölümlerinin dizinlenmesini yasaklamak için kullanılır. Bunun yardımıyla, teknik sayfaların ve gerek kullanıcılar gerekse arama sistemleri için bir değeri olmayan sayfaların dizinlenme işlemini devre dışı bırakmak gerekir. Böyle sayfalara örnek olarak site araması sonuçlarını içeren sayfalar, sitenin ziyaret istatistikleri, yinelenen sayfalar, çeşitli günlükler, veritabanı servis sayfaları vb. verilebilir. Bu konuda ayrıntılı bilgi için, robots.txt dosyasına ayrılmış özel yardım bölümünü okuyun.

    • Crawl delay. Sitenin sayfalarına yapılan çağrılar arasındaki minimum zaman aralığını (saniye cinsinden) dizinleme robotuna belirtmeyi sağlar. Bu parametre on bin ve daha fazla sayfa içeren büyük site projeleri için yararlıdır. Yandex arama robotu dizinleme işlemi sırasında böyle bir siteye ağır yük getirerek sitenin çalışmasında kesintilere ve gecikmelere yol açabileceğinden, saniyedeki çağrı sayısını sınırlandırmanız gerekebilir. Örneğin, Crawl-delay: 2 yönergesi, robotun sunucuya yapılan çağrılar arasında 2 saniye beklemesi gerektiğini belirtir.

    • Clean param. Arama robotlarına, sayfa adresindeki hangi cgi parametrelerinin önemsiz sayılması gerektiğini belirtmek için kullanılır. Sayfa adresleri bazen oturum tanımlayıcıları içerir; biçimsel olarak farklı tanımlayıcılara sahip sayfalar ayırt edilir, ancak içerikleri aynıdır. Sitede bu tür sayfaların sayısı fazlaysa, dizin robotu yararlı içeriği indirmek yerine bu sayfaları dizinlemeye başlayabilir. İlgili yardım bölümünde, clean param yönergesinin kullanımı hakkında daha ayrıntılı bilgi alınabilir.

      Yandex.Webmaster servisi, sitenizin dizinlenmiş URL listesine göz atmaya olanak sağlar. Kod içindeki küçük hatalar bile sitedeki gereksiz URL sayısının büyük ölçüde artmasına yol açabileceğinden ve sitenin yükünü artırabileceğinden bu listeyi düzenli olarak kontrol edin.

  4. Yandex, Internet'te yaygın olarak bulunan ana belge türlerini dizinler. Ancak bazı sınırlamalar vardır ve belgenin dizinlenme yöntemi ya da dizinlenip dizinlemeyeceği bu sınırlamalara bağlıdır:

    • URL'de çok sayıda cgi parametresi olması, iç içe eklenmiş çok sayıda yinelenen dizin olması ve URL'nin toplam uzunluğunun çok fazla olması belgelerin kötü dizinlenmesine yol açabilir.

    • Dizinleme açısından belgenin büyüklüğü önemlidir; 10 MB'tan büyük belgeler dizinlenmez.

    • Flash dizinleme:

      1. *.swf dosyaları, doğrudan bağlantıları varsa veya html'ye object ya da embed etiketleriyle katıştırılmışlarsa dizinlenir;

      2. flash yararlı içeriğe sahipse, kaynak html belgesi swf dosyasında dizinlenmiş içeriğe göre bulunabilir.

    • PDF belgelerinde yalnızca metin içeriği dizinlenir. Resim olarak sunulmuş metinler dizinlenmez.

    • Yandex, Open Office XML ve OpenDocument biçimindeki belgeleri (özellikle de Microsoft Office ve Open Office belgeleri) doğru şekilde dizinler. Ancak, yeni biçim desteğinin uygulanmasının biraz zaman alabileceği göz önünde bulundurulmalıdır.

    • <frameset> ve <frame> etiketlerinin kullanımına izin verilir; Yandex robotu bunların arasına eklenen içeriği dizinler ve çerçeve içeriğine göre kaynak belge bulma olanağı sağlar.

  5. Varolmayan URL için sunucu davranışını yeniden tanımladıysanız, sunucunun 404 hata kodunu döndürdüğünden emin olun. Arama sistemi 404 yanıt kodunu aldıktan sonra bu belgeyi dizinden siler. Sitenin tüm gerekli sayfalarının 200 OK kodunu döndürmesine dikkat edin.

  6. http başlıklarının doğru olmasına dikkat edin. Özellikle de sunucunun “if-modified-since” sorgusuna verdiği yanıtın içeriği önemlidir. Last-Modified başlığı belgenin son değişiklik tarihini doğru olarak vermelidir.

  7. Mobil aygıtlarda görüntülenmek üzere uyarlanmış site sürümlerinin, sitenin farklı dillerdeki sürümleri gibi, alt etki alanına alınması daha iyidir.

Not. 

Kullanıcılara yönelik olmayan sayfaların dizinlenmesini yasaklayarak, Yandex arama robotunu yönlendirin.

Sonraki bölüm

Makaleyi değerlendirin
Geri bildiriminiz için teşekkür ederiz!