Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, bir eğitmen tarafından sunulan internet arama motorları ve arama algoritmaları hakkında kapsamlı bir eğitim serisinin 12. bölümüdür.
- Video, arama motorlarının temel bileşenlerinden başlayarak (crawler, bag of words, stemming, query augmentation) Page Rank algoritması, SEO, arama sonuçlarının kişiselleştirilmesi ve gelecekteki internet trendleri (Web 3.0, semantik web) gibi konuları ele almaktadır. Ayrıca Google arama motorunun çeşitli özellikleri (search tools, advanced search, site araması, resim araması) ve özel arama motorları hakkında bilgiler sunulmaktadır.
- Eğitim içeriği, arama motorlarının nasıl çalıştığını, kullanıcı deneyimini nasıl geliştirdiğini ve gelecekteki trendleri anlamak isteyenler için hazırlanmıştır. Video, giriş seviyesinde bilgi vermek amacıyla hazırlanmış olup, daha detaylı konuların farklı videolarda ele alınacağı belirtilmektedir.
- 00:01İnternet Arama Motorlarının Çalışma Prensibi
- Bu video, arama motorlarının nasıl çalıştığı ve internette aramak ne anlama geldiğini anlatmaktadır.
- Arama motorlarının temel bileşeni olan crowler (örümcek veya bot olarak da bilinir) internet üzerinde dolaşan yazılımlardır.
- Crowlerlar bir web sitesinden başlayıp, o sayfadaki linkleri takip ederek diğer sayfalara ilerler ve internet ağını örümcek ağı gibi tararlar.
- 01:32Crowlerların İşlevi ve İndeksleme Süreci
- Crowlerlar gezdikleri sayfaların içeriğini kopyalar ve bu içeriklerin indeksini çıkarırlar.
- Reverse indexing yöntemiyle kelimelerden sayfaya giden bağlantılar oluşturulur.
- Arama motorlarının karşılaştığı problemler arasında verimlilik, bilgi doğruluğu, güncellik ve sayfa içeriğinin doğru algılanması bulunmaktadır.
- 03:21Arama Motorlarının Teknolojik Yapısı
- Arama motorlarının oluşturduğu indeksler sürekli aktif olarak aranabilir hale getirilir.
- Bilgiler disk yerine RAM'de saklanır ve dağıtık sunucu çiftliklerinde (server farms) anlık cevap vermek için hazır beklenir.
- Arama motorlarının arka planı, crowlerlar tarafından toplanan bilgileri hazırlamakla ilgilidir.
- 04:05Arama Sonuçlarının Sıralanması
- Arama motorları, kullanıcıların arama anahtar kelimelerine göre sonuçları sıralar.
- Google'un PageRank gibi algoritmaları, hangi sayfanın en üstte gösterileceğini belirler.
- Arama sonuçları kişiselleştirilebilir ve sosyal ağ hesapları gibi faktörler dikkate alınabilir.
- 05:06Arama Motorları ve Pazarlar
- Arama sonuçlarında reklamların gösterilmesi bir pazar oluşturur ve Google bunu para kazanma kaynağı olarak kullanır.
- SEO (arama motoru optimizasyonu) adı verilen bir meslek, web sitelerinin arama sonuçlarında daha önde gelmesini sağlar.
- Arama sonuçlarının sıralanmasında hız, içerik ve ilgili olup olmaması gibi birçok kriter değerlendirilir.
- 06:12Web Gelişimine Bakış
- İnternetin evrimi üç aşamada incelenebilir: statik içeriklerin bulunduğu Web 1.0, interaktif web siteleri ve sosyal ağların bulunduğu Web 2.0, ve anlambilimsel ağların oluşturulabileceği Web 3.0.
- Web 3.0'da semantik web ve internet of things (IoT) kavramları önem kazanmaktadır.
- İnternete bağlı cihazlar artık kendi içeriklerini üretip arama motorlarıyla etkileşime girebilecek duruma gelmektedir.
- 07:23Kelime Grupları ve Frekans Yöntemi
- Kelimelerin geçme sıklığı "bag of words" olarak algılandığında, konuyla ilgili kelime grupları oluşturulur (örneğin spor, politika gibi).
- İki kelime grubundaki geçen kelime sıklıklarına bakarak bir yazının hangi konuya daha yakın olduğu belirlenir.
- Bu yöntemde frekans yöntemi kullanılır ve kelimenin kökleri ve ekleri ayrılır.
- 07:50Stemming ve Kelime Kökleri
- Stemming, kelimenin eklerini ve köklerini ayırarak gövdesinde taşıyan bilgiyi çıkarma işlemidir.
- Yapım ekleri genellikle kaldırılmaz çünkü kalkınca anlam değişir, ancak çekim ekleri kaldırılabilir.
- Türkçe çok fazla ek alabildiği için (eklusiv bilenguage), kelime köklerini bulmak zor olsa da, aynı anlamı taşıyan kelimeler (bilgisayar, bilgisayarcı, bilgisayarım) aynı kelime grubundan üretilmiş olarak kabul edilir.
- 08:41Kelime İndeksleme ve Ranking
- Kelime kökleri çıkarılarak bir indeksleme yapısı oluşturulur ve kelimenin kullanılma sıklığına bakılarak metnin konusu belirlenir.
- Query agmentation, kelimelerin arasındaki anlam farklılıklarını dikkate alarak arama sonuçlarını belirler (örneğin sport ve atletizm, gül ve çiçek).
- Bir kelimenin hangi grupta olduğu ve hangi bağlamda kullanıldığının anlaşılması önemlidir, aynı kelimenin farklı yerlerde farklı anlamlara gelebileceği düşünülmelidir.
- 10:14Semantic Web ve Doğal Dil Sorular
- Semantic web, kelimelerin anlamlarını daha iyi anlamayı hedefleyen bir teknoloji olup, doğal dilde sorular sorulabilmesini sağlayacak.
- Google gibi arama motorları "10 inç kaç santimdir" veya "Ankara ile İstanbul arası kaç kilometredir" gibi doğal dilde sorulara cevap verebilmektedir.
- Arka planda, otorite belirleme ve kelime anlamlarını kişilerle ilişkilendirme gibi teknikler kullanılmaktadır.
- 10:54PageRank Algoritması
- Otorite tabanlı arama (authority based search) yönteminde, internet üzerinde bir otorite oluşturulur ve sayfalar bu otoriteyi belirtir.
- PageRank algoritması, Larry Page tarafından geliştirilmiş ve Google'un temelinde yer almaktadır.
- PageRank algoritmasının temel prensibi, bir web sitesinin ne kadar fazla link alması gerektiğidir; daha fazla link alması, daha fazla oy almaya denk gelir ve sayfanın daha önemli olduğu anlamına gelir.
- 12:08Page Rank Algoritması
- Page Rank, internette en çok bahsedilen ve en çok konuşulan sayfaları belirlemek için kullanılan bir algoritmadır.
- Google'un örümcekleri internette dolaşırken hangi sayfanın hangi sayfaya linklediğini tespit ederek bu bilgileri kaydeder.
- Page Rank algoritması, sayfaların birbirlerini linklediği şekilde puanlar verir ve en fazla linklenen sayfalar en yüksek Page Rank değerlerine sahiptir.
- 13:30Page Rank Algoritmasının Sorunları ve Çözümleri
- Page Rank algoritmasıyla spam sayfalar ortaya çıkmış ve bu sayfalar yüksek Page Rank değerleri alabilmek için para ödüyorlardı.
- News grupları gibi sürekli güncellenen ve aktif olan sayfalar için Page Rank algoritması çok başarılı değildi.
- Bu sorunlar için CAPTCHA adı verilen "Complete ile Automated Public Turing Test to Tell Humans and Computers Apart" (İnsan ve bilgisayarı ayırt edebilen tamamen otomatize edilmiş açık bir Turing testi) geliştirildi.
- 14:35CAPTCHA ve Robot Kontrolü
- Turing testi, insanla bilgisayar arasındaki ayrımı yapmaya yarayan bir testtir ve CAPTCHA'da benzer sorular sorulmaktadır.
- CAPTCHA'da genellikle resim işleme yöntemleri kullanılarak insanın okuyabileceği, bilgisayarın okuyamayacağı sorular oluşturulur.
- İnternette bilgisayarlara karşı ikinci sınıf muamele gösterilir ve bazı yerlere sadece insanların girebileceği şekilde güvenlik önlemleri alınır.
- 16:28Robot Engelleme Yöntemleri
- Nofollow, takip edilmemesi istenen linkleri belirlemek için kullanılan bir yapıdır; örümcekler bu linklere gitmez ve indekslemez.
- Robot.txt dosyası, indexlenmesini istemediğiniz sayfaları belirlemek için kullanılır; örneğin Beyaz Saray'ın web sitesindeki belirli sayfaların robotlara erişilebilir olmadığını gösterir.
- Bu önlemler tamamen robotu yazan kişinin inisiyatifine bağlıdır, dikkat etmeyen robotlar her yerde indeksleyebilir.
- 17:51Akıllı Arama Algoritmaları
- Akıllı arama algoritmaları, arama sorgularının karmaşık olabileceğini ve anlamını anlayabilmesini sağlar.
- Web 3.0 teknolojileri sayesinde arama motorları, "Napolyon'un motosikletinin seri numarası nedir?" gibi sorulara mantıklı cevaplar verebilmektedir.
- Temelde RDF ve OWL (Web Ontology Language) gibi teknolojiler kullanılarak zamansal kavramlar ve konular arasındaki ilişkiler belirlenmektedir.
- 19:51Kişisel İnternet Araması Tavsiyesi
- Kendi isminizi internette aramak ve sonuçları kontrol etmeniz tavsiye edilir.
- Çift tırnaklar kullanarak tam olarak belirli bir ifadeyi aramak mümkündür.
- Sıkça kullanılan isimlerde (örneğin Murat Demir) çift tırnaklar kullanmadan arama yapıldığında, ilgili kişiyle ilgili sonuçlar arasında diğer aynı isimli kişilerin sonuçları da görülebilir.
- 21:19Google Arama Teknikleri
- Google'da "search tools" seçeneğinden arama sonuçlarını filtreleyebilirsiniz.
- "Anytime" seçeneği ile belirli bir zaman diliminde arama yapabilirsiniz, örneğin "son bir hafta" seçeneği ile.
- Arama kelimelerinin başına "+" ekleyerek mutlaka geçmesi gereken kelimeleri, "-" ekleyerek geçmemesi gereken kelimeleri belirleyebilirsiniz.
- 23:18Gelişmiş Arama Özellikleri
- Google'da "advanced search" seçeneği ile daha detaylı arama yapabilirsiniz.
- "site:" operatörü ile belirli bir sitede arama yapabilirsiniz.
- Resim ve video arama gibi farklı içerik türlerinde de arama yapabilirsiniz.
- 25:21Özel Arama Motorları
- Wolfram Alpha gibi konu özel arama motorları bulunmaktadır.
- LinkedIn, Facebook, Twitter gibi sosyal medya platformları da kendi arama motorları ile donatılmıştır.
- YouTube, en çok kullanılan ikinci arama motorudur ve video içeriklerini indeksleyebilir.
- 26:12Arama Motorları Hakkında Genel Bilgi
- Konuşmacı, arama motoru yazımı hakkında bir ders verdiğini belirtiyor.
- Bu video, arama motorları hakkında giriş seviyesinde bilgi vermek amacıyla hazırlanmıştır.
- Daha detaylı konular için farklı videolar hazırlanacaktır.