Düzenli ifadeler

Düzenli ifadeler Yandex Webmaster’da URL verilerini filtrelemek için kullanılabilir:

İfadeler RE2 söz dizimine ve aşağıdaki kurallara göre ayrıştırılır:

  • Düzenli ifade, protokol ve etki alanı adı dahil olmak üzere sayfanın tüm URL’sine uygulanır. Örneğin, aşağıdaki düzenli ifadeyi kullanabilirsiniz: ^http://.
  • Bir düzenli ifade iki kez uygulanır: orijinal URL’ye ve www ön eki ile ve onsuz URL’ye. Etki alanı adında www ön ekine sahip olma durumu, ifade doğrulama sonucunu etkilemez.
  • Düzenli ifade, URL kodlarının (% dizileri) kodu çözülmüş karakterlerle değiştirildiği çözülmüş URL’ye uygulanır. İstisna: /, &, =, ? ve # karakterlerinin kodları değiştirilmez. Örneğin, %2F / ile değiştirilmez. Not: + karakteri bir boşluk ile değiştirilir. Örneğin, düzenli ifade text=elephant işlenecek, ancak text=%D1%81%D0%BB%D0%BE%D0%BD ve text=%\w\w işlenmeyecek.
  • Kiril alfabesi içeren URL’ler punycode kullanmaz. Örneğin, normal ifade ^http://ввв\.сайт\.рф/ işlenir, ancak ^http://xn--b1aaa\.xn--80aswg\.xn--p1ai/ işlenmez.
  • Bazı karakterler, düzenli ifadeler kontrolünden önce URL sonundan hariç tutulur: ?, #, &, ve nokta (.). Örneğin, URL’ler http://example.com/?, http://example.com/#, http://example.com/?var=1& sırasıyla http://example.com/, http://example.com/, http://example.com/?var=1 ile karşılaştırılır. Kullanıcı URL’yi http://example.com./ olarak girerse, normal ifade \./$ işlenmez.
  • Kontrol edilen normal ifadelerde, nicelik belirleyiciler mümkün olduğunca çok karakterle eşleşir.
  • URL karakterleri büyük/küçük harf duyarlıdır.

Normal ifadeler notu

Aşağıdaki tabloda, a, b, c, d, e herhangi bir karakterdir, n, m pozitif sayılardır.

Olası seçenekler

abc|de

Seçeneklerden birini eşleştirir: abc veya de.

Karakter sınıfları

[abc] veya [a-c]

Listedeki (veya aralıktaki) herhangi bir (tek) karakterle eşleşir.

[^abc] veya [^a-c]

Listelenen (veya aralıktaki) karakterler dışında herhangi bir (tek) karakterle eşleşir.

\d

Bir rakam karakteriyle eşleşir. Eşdeğeri: [0-9].

\D

Bir rakam olmayan karakterle eşleşir. [^0-9] eşdeğerdir.

\s

Bir boşluk karakteriyle eşleşir. Eşdeğeri [\t\f\r].

\S

Bir boşluk olmayan karakterle eşleşir. [^\t\f\r] eşdeğerdir.

\pL

Herhangi bir Unicode karakteriyle eşleşir.

\w

Herhangi bir Latin harfi (büyük/küçük), rakam veya alt çizgi karakteriyle eşleşir.

Unicode karakterlerle çalışırken, \w yerine \pL sınıfını kullanın.

\W

Herhangi bir karakterle Latin harfi (büyük/küçük), rakam veya alt çizgi dışında eşleşir.

Unicode karakterlerle çalışırken, \w yerine \pL sınıfını kullanın.

Oluşum sayısı (nicelikler)

a*

A karakteri 0 veya daha fazla kez tekrarlandığında eşleşir (en uzun olası dizi).

a+

A karakteri 1 veya daha fazla kez tekrarlandığında eşleşir (en uzun olası dizi).

a?

Karakter a 0 veya 1 kez tekrarlandığında eşleşir (karakterin varlığı önceliklidir).

a{n,m}

A karakteri en az n kez ve en fazla m kez tekrarlandığında eşleşir (en uzun olası dizi).

a{n,}

Karakter a en az n kez tekrarlandığında eşleşir (en uzun olası dizi).

a{n}

Karakter a n kez tekrarlandığında eşleşir.

a*?

A karakterinin 0 veya daha fazla kez tekrarlandığı (en kısa olası dizi) eşleşir.

a+?

a karakterinin 1 veya daha fazla kez tekrarlandığı (en kısa olası dizi) ile eşleşir.

a??

Karakter a 0 veya 1 kez tekrarlandığında eşleşir (karakterin varlığı önceliklidir).

a{n,m}?

A karakteri en az n kez ve en fazla m kez tekrarlandığında eşleşir (en uzun olası dizi).

a{n,}?

A karakterinin en az n kez tekrarlandığı (en kısa olası dizi) eşleşir.

Satırdaki konum:

^

Bir dizenin başlangıcını eşleştirir.

$

Bir dizenin sonunu eşleştirir.

\b

Kelime sınırını eşleştirir – alfasayısal karakter (\w) ile alfasayısal olmayan (\W) karakter arasındaki konum.

\B

Bir kelime sınırı olmayanı eşleştirir. \w ve \W sınıfları aracılığıyla tanımlanır.

Kaçış

\

[ ] \ ^ $ . | ? * + ( ) { } özel karakterinden önce gelen ters eğik çizgi, bu karakterin özel olmadığı ve motamot yorumlanması gerektiği anlamına gelir.

Örnek: \$ dolar işaretine karşılık gelir.

\Q...\E

\Q ve \E arasındaki tüm özel karakterler, ortak karakterler olarak yorumlanır.

Destek ile iletişime geçin




Ayrıca şuraya gidebilirsiniz: