Düzenli ifadeler
Düzenli ifadeler Yandex Webmaster’da URL verilerini filtrelemek için kullanılabilir:
- Aramaya dahil edilen sayfalar.
- Site sayfalarının tarama istatistikleri.
- Harici bağlantılar.
- Sorgu izleme.
İfadeler RE2 söz dizimine ve aşağıdaki kurallara göre ayrıştırılır:
- Düzenli ifade, protokol ve etki alanı adı dahil olmak üzere sayfanın tüm URL’sine uygulanır. Örneğin, aşağıdaki düzenli ifadeyi kullanabilirsiniz:
^http://
. - Bir düzenli ifade iki kez uygulanır: orijinal URL’ye ve
www
ön eki ile ve onsuz URL’ye. Etki alanı adındawww
ön ekine sahip olma durumu, ifade doğrulama sonucunu etkilemez. - Düzenli ifade, URL kodlarının (% dizileri) kodu çözülmüş karakterlerle değiştirildiği çözülmüş URL’ye uygulanır. İstisna:
/
,&
,=
,?
ve#
karakterlerinin kodları değiştirilmez. Örneğin,%2F
/
ile değiştirilmez. Not:+
karakteri bir boşluk ile değiştirilir. Örneğin, düzenli ifadetext=elephant
işlenecek, ancaktext=%D1%81%D0%BB%D0%BE%D0%BD
vetext=%\w\w
işlenmeyecek. - Kiril alfabesi içeren URL’ler punycode kullanmaz. Örneğin, normal ifade
^http://ввв\.сайт\.рф/
işlenir, ancak^http://xn--b1aaa\.xn--80aswg\.xn--p1ai/
işlenmez. - Bazı karakterler, düzenli ifadeler kontrolünden önce URL sonundan hariç tutulur:
?
,#
,&
, ve nokta (.
). Örneğin, URL’lerhttp://example.com/?
,http://example.com/#
,http://example.com/?var=1&
sırasıylahttp://example.com/
,http://example.com/
,http://example.com/?var=1
ile karşılaştırılır. Kullanıcı URL’yihttp://example.com./
olarak girerse, normal ifade\./$
işlenmez. - Kontrol edilen normal ifadelerde, nicelik belirleyiciler mümkün olduğunca çok karakterle eşleşir.
- URL karakterleri büyük/küçük harf duyarlıdır.
Normal ifadeler notu
Aşağıdaki tabloda, a
, b
, c
, d
, e
herhangi bir karakterdir, n
, m
pozitif sayılardır.
Olası seçenekler |
|
abc|de |
Seçeneklerden birini eşleştirir: |
Karakter sınıfları |
|
[abc] veya [a-c] |
Listedeki (veya aralıktaki) herhangi bir (tek) karakterle eşleşir. |
[^abc] veya [^a-c] |
Listelenen (veya aralıktaki) karakterler dışında herhangi bir (tek) karakterle eşleşir. |
\d |
Bir rakam karakteriyle eşleşir. Eşdeğeri: |
\D |
Bir rakam olmayan karakterle eşleşir. |
\s |
Bir boşluk karakteriyle eşleşir. Eşdeğeri |
\S |
Bir boşluk olmayan karakterle eşleşir. |
\pL |
Herhangi bir Unicode karakteriyle eşleşir. |
\w |
Herhangi bir Latin harfi (büyük/küçük), rakam veya alt çizgi karakteriyle eşleşir. Unicode karakterlerle çalışırken, \w yerine |
\W |
Herhangi bir karakterle Latin harfi (büyük/küçük), rakam veya alt çizgi dışında eşleşir. Unicode karakterlerle çalışırken, \w yerine |
Oluşum sayısı (nicelikler) |
|
a* |
|
a+ |
|
a? |
Karakter |
a{n,m} |
|
a{n,} |
Karakter |
a{n} |
Karakter |
a*? |
|
a+? |
|
a?? |
Karakter a 0 veya 1 kez tekrarlandığında eşleşir (karakterin varlığı önceliklidir). |
a{n,m}? |
|
a{n,}? |
|
Satırdaki konum: |
|
^ |
Bir dizenin başlangıcını eşleştirir. |
$ |
Bir dizenin sonunu eşleştirir. |
\b |
Kelime sınırını eşleştirir – alfasayısal karakter ( |
\B |
Bir kelime sınırı olmayanı eşleştirir. |
Kaçış |
|
\ |
[ ] \ ^ $ . | ? * + ( ) { } özel karakterinden önce gelen ters eğik çizgi, bu karakterin özel olmadığı ve motamot yorumlanması gerektiği anlamına gelir. Örnek: |
\Q...\E |
|