Robots.txt dosyasını kullanma
Robots.txt arama motoru robotları için site dizinleme parametrelerini içeren bir metin dosyasıdır. İçinde robots.txt, botların web sitesi sayfalarını dizinlemesini kısıtlayabilir, bu da sitenin yükünü azaltabilir ve performansını hızlandırabilir.
Not
Kısıtlanan sayfalar robots.txt içinde Yandex aramasına katılabilir. Sayfaları aramadan kaldırmak için, sayfanın HTML kodunda noindex direktifini belirtin veya HTTP başlığını yapılandırın. Bu tür sayfaları robots.txt dosyası içinde kısıtlamayın, aksi takdirde Yandex botu bunları dizinleyemez ve talimatlarınızı algılayamaz. Ayrıntılar için Sayfaları aramadan nasıl çıkarılır bölümüne bakın.
Yandex, gelişmiş özelliklerle Robots Exclusion Protocol destekler.
Robots.txt dosyasına yönelik gereksinimler
Yandex robotları robots.txt
dosyasını doğru bir şekilde işler, eğer:
-
Dosya boyutu 500 KB’yi geçmez.
-
"Robots" adında bir TXT dosyasıdır,
robots.txt
. -
Dosya, sitenin kök dizininde bulunur.
-
Dosya endeksleme botları tarafından erişilebilir:
- Siteyi barındıran sunucu bir HTTP 200 OK durum kodu döndürür.
robots.txt
dosyası, sunucunun 200 OK kodu döndürdüğü başka birrobots.txt
dosyasına yönlendirir.
Daha fazla bilgi için, bakınız Sunucu yanıt kontrolü.
Yandex, bir sitede bulunan
robots.txt
dosyasından başka bir sitede bulunan dosyaya yönlendirmeyi destekler. Bu durumda, hedef dosyadaki direktifler dikkate alınır. Bu yönlendirme, siteyi taşırken faydalı olabilir.
Dosya gereksinimleri karşılamıyorsa, site dizinlemeye açık kabul edilir.
Dosyanın içeriği hakkında öneriler
Yandex aşağıdaki direktifleri destekler:
Yönerge |
Ne yapar |
Kuralların |
|
Sitenin bölümlerinin veya bireysel sayfalarının taranmasını yasaklar. |
|
Sitede yayınlanan |
|
Sayfa URL’sinin dizinlenirken göz ardı edilmesi gereken parametreler (örneğin UTM etiketleri) içerdiğini robota belirtir. |
|
Site bölümlerinin veya bireysel sayfaların dizinlenmesine izin verir. |
|
Arama robotunun bir sayfayı yükledikten sonra başka bir sayfayı yüklemeye başlamadan önce beklemesi gereken minimum süreyi (saniye cinsinden) belirtir. Bu direktif yerine Yandex Webmaster’da tarama hızı ayarını kullanmanızı öneririz. |
* Zorunlu direktif.
En sık Disallow, Site haritası ve Clean-param direktiflerine ihtiyacınız olacaktır. Örneğin:
Kullanıcı Aracısı: * #direktiflerin hangi botlar için ayarlandığını belirtir
İzin Verme: /bin/ # “Alışveriş Sepetinden” bağlantıları yasaklar.
İzin Verme: /search/ # sitenin yerleşik aramasından bağlantıları yasaklar
İzin Verme: /admin/ # yönetici panelinden bağlantıları yasaklar
Site Haritası: http://example.com/sitemap # botu sitenin Site Haritası dosyasına yönlendirir
Clean-param: ref /some_dir/get_book.pl
Diğer arama motorları ve hizmetlerin robotları, direktifleri farklı şekilde yorumlayabilir.
Not
Robot, alt dizelerin (dosya adı veya yol, robot adı) büyük/küçük harf duyarlılığını dikkate alır ve direktiflerin adlarındaki büyük/küçük harf duyarlılığını göz ardı eder.
Kiril karakterlerinin kullanımı
Robots.txt
dosyasında ve sunucu HTTP başlıklarında Kiril alfabesi kullanımı izin verilmez.
Alan adları için Punycode kullanın. Sayfa adresleri için, mevcut site yapısının kodlamasıyla aynı kodlamayı kullanın.
Robots.txt
dosyası örneği:
#Yanlış:
Kullanıcı Aracısı: Yandex
İzin Verme: /alışveriş sepeti
Site Haritası: the website.com/sitemap.xml
#Doğru:
Kullanıcı Aracısı: Yandex
İzin Verme: /%D0%BA%D0%BE%D1%80%D0%B7%D0%B8%D0%BD%D0%B0
Site Haritası: http://xn--80aswg.xn--p1ai/sitemap.xml
Robots.txt nasıl ayarlanır
- Metin düzenleyicide,
robots.txt
adlı bir dosya oluşturun ve içine ihtiyacınız olan direktifleri ekleyin. - Dosyayı kontrol edin Yandex Webmaster’da.
- Dosyayı sitenizin kök dizinine yerleştirin.
Örnek dosya. Bu dosya, tüm arama motorları için sitenin tamamının dizinlenmesine izin verir.
Sorular ve cevaplar
“Sunucu, /robots.txt isteğine yönlendirme ile yanıt veriyor” hatası Yandex Webmaster’daki “Site teşhisi” sayfasında oluşur
Yandex’in endeksleme botunun robots.txt dosyasına uymasını sağlamak için, bu dosya sitenizin kök dizininde bulunmalı ve bir HTTP 200 kodu döndürmelidir. Eğer robots.txt
dosyası başka bir robots.txt
dosyasına yönlendiriyorsa (örneğin, sitenizi taşıdığınızda), Yandex hedef dosyaya uyar.
robots.txt
dosyanızdaki direktiflerin istenildiği gibi çalışması için, dosyanın doğru bilgi içerdiğinden emin olun. Dosyayı test etmek için, hedef siteyi Yandex Webmaster’a ekleyin ve site sahipliğinizi doğrulayın.
Robot için robots.txt
dosyasının erişilebilirliğini kontrol etmek için, sunucu yanıtını kontrol edin.