• Buradasın

    Python ile İnternet Sitelerinden Bilgi Çekme Eğitimi

    youtube.com/watch?v=4hGlXxDqn50

    Yapay zekadan makale özeti

    • Bu video, bir eğitim içeriği olup, izleyicilere Python programlama dilini kullanarak internet sitelerinden bilgi çekme konusunu adım adım göstermektedir.
    • Video, URLLib ve Regular Expressions (regex) paketlerinin nasıl kullanılacağını göstererek başlıyor. Eğitmen, Hürriyet gazetesinin ana sayfasından başlık bilgilerini çekme örneği üzerinden, web sitesinden HTML kodlarını okuma, düzenli ifadeler kullanarak bilgileri ayıklama ve Türkçe karakter sorunlarını çözme yöntemlerini detaylı şekilde anlatıyor. Ayrıca, web sayfasındaki belirli bilgileri bulmak için "inspect element" özelliğini kullanarak HTML kodlarını nasıl düzenleyebileceğinizi de gösteriyor.
    00:01İnternet Sitelerinden Bilgi Çekme
    • Video, internet üzerinden sitelere bağlanıp bilgi çekme konusunu ele alıyor.
    • Basit birkaç satır kodla internet sitelerinden bilgi çekme işlemi gösterilecek.
    00:46Gerekli Paketlerin İçe Aktarılması
    • URL lib paketi import edilerek siteden bilgi çekme işlemi gerçekleştirilecek.
    • İndirilen bilgilerden ayıklama yapmak için regular expressions (re) paketi de import ediliyor.
    01:43Site Bilgilerinin Alınması
    • Site değişkenine "http://com.tr" adresi atanıyor.
    • Hürriyet gazetesinin ana başlığı için düzenli ifade oluşturuluyor.
    • URL lib paketindeki url_open fonksiyonu kullanılarak siteye bağlanıp bilgiler read fonksiyonuyla okunuyor.
    05:04Bilgilerin Ayıklanması
    • r paketindeki find_all fonksiyonu kullanılarak derlenmiş düzenli ifade HTML kod içinde aranıyor.
    • Bulunan değerler bir dizi olarak döndürülüyor ve for döngüsü ile her biri işleniyor.
    • Türkçe karakter problemi için decode fonksiyonu kullanılarak karakterler düzeltiliyor.
    07:28Farklı Haber Başlıklarını Çekme
    • Hürriyet sayfasında bir haber başlığı seçiliyor ve sağ tuş ile "inspect element" seçeneği kullanılıyor.
    • Edit HTML seçeneği ile ilgili satırın kodları görüntüleniyor.
    • Regex değeri değiştirilerek sadece sayfanın başlığı değil, haber başlıkları da çekilebiliyor.

    Yanıtı değerlendir

  • Yazeka sinir ağı makaleleri veya videoları özetliyor