• Yapay zekadan makale özeti

    • Bu video, bir eğitmen tarafından sunulan plaka tanıma sisteminin dördüncü eğitim videosudur. Eğitmen, önceki videolarda plaka tespit ve konum tespiti yapmış olduğunu belirtmektedir.
    • Video, plaka tanıma sisteminin karakter sınıflandırma algoritmasını ele almaktadır. İçerikte ayrıştırma (segmentation), sınıflandırma (classification), eşikleme (threshold) ve morfolojik işlemler (özellikle açma işlemi) gibi temel adımlar adım adım gösterilmektedir. Eğitmen, Python programlama dilini ve OpenCV kütüphanesini kullanarak plakanın konumunu tespit etme, plakaları kesme, boyutlandırma ve gürültü azaltma işlemlerini detaylı şekilde anlatmaktadır.
    • Videoda ayrıca evrişimsel sinir ağı kullanarak sınıflandırma yapma, adaptif threshold fonksiyonunun kullanımı, ortalama algoritmasının ayarlanması ve filtre boyutunun önemi gibi teknik konular da ele alınmaktadır. Bir sonraki derste fight counter'ları bulma adımının yapılacağı belirtilmektedir.
    00:01Plaka Tanıma Sistemi
    • Plaka tanıma sisteminin dördüncü videosunda, plakanın tespit edildikten sonra üzerindeki karakterleri tanımak için yapay zeka kullanılacak.
    • Plaka tanıma sistemi iki farklı parçadan oluşuyor: biri plakanın konumunu buluyor, diğeri üzerindeki karakterleri tanıyor (OCR).
    • Karakter tanıma için iki temel adım var: segmentasyon (ayrıştırma) ve sınıflandırma.
    02:28Plaka Konumunu Tespit Etme
    • Veri setini incelemek için önce plakanın konumunu tespit etmek gerekiyor.
    • Önceki derste yazılan "plaka_konum" fonksiyonu çağrılıp resme uygulanıyor.
    • Plakanın genişlik ve yükseklik değerleri karşılaştırılarak doğru dikdörtgen oluşturuluyor.
    04:30Plaka Kesme ve Görselleştirme
    • Plakanın konum bilgileri kullanılarak orijinal resimden plaka kesiliyor.
    • Kesilen plaka görüntüsü ekranda gösteriliyor.
    • Veri setindeki plakalar incelenerek segmentasyon adımı için örnek plakalar seçiliyor.
    06:41Segmentasyon Adımı
    • Segmentasyon adımı, plakadaki karakterleri birbirinden ayırmak için gereklidir.
    • İlk adım eşikleme işlemi olarak adlandırılıyor, belli bir değer altındakileri (siyahları) dikkate alarak beyazlıkları atıyor.
    • İkinci adım, karakterleri dikdörtgen olarak tanımlamak ve genişlik değerlerini kontrol etmek için ana resmin genişliğinin sekizde birinden küçük olması gerekiyor.
    08:52Dikdörtgen Alan Hesaplama
    • Dikdörtgen (rectangle) x ve y koordinat değerlerine sahip olup, belirli bir alanı kaplar.
    • Dikdörtgenlerin alanları yaklaşık olarak aynıdır ve bu alanlar hesaplanabilir.
    • Dikdörtgenin yüksekliği 18, genişliği 14 olduğu için alan 252 olarak hesaplanır.
    10:10Segmentasyon ve Sınıflandırma
    • Segmentasyon işlemi için çok detaylı bir ayrıştırma yapmaya gerek yoktur çünkü sınıflandırma kısmında evrişimsel sinir ağı kullanılacaktır.
    • Evrişimsel sinir ağı, gereksiz veya arka plan manasına gelen değerleri sınıflandırarak karakterleri temsil etmeyen alanları kaale almaz.
    • Segmentasyon işleminden sonra evrişimsel sinir ağı, karakterleri tanımlayarak plakayı oluşturur.
    12:01Kodlama İşlemi
    • Ayrıştırma adımı için gerekli kütüphaneler dahil edilir: operating system, opensea, matplotlib, numpy ve önceki derslerde yazılan fonksiyonlar.
    • Veri seti klasöründeki tüm dosyalar listelenir ve veriler tek tek işlenir.
    • Resim okunup, boyutlandırılır ve plakanın konumu belirlenir.
    15:38Plaka Kesme ve Ön İşleme
    • Plaka kesildikten sonra piksellikler segmentasyon işlemini yaparken yanıltabilir, bu yüzden görüntü boyutu iki katına çıkarılır.
    • Karakter tanıma için netlik çok önemli değil, çünkü karakterlerin öznetikleri belli başlıdır (örneğin E'nin üç girintisi, 2'nin bir yuvarlağı ve bir çizgisi gibi).
    • Boyutlandırılmış görüntüde piksellikler gider ve segmentasyon işlemine devam edilir.
    19:17Gri Format Dönüşümü
    • Boyutlandırma işleminden sonra renklerle ilgilenmeye gerek kalmadığı için, siyah ve beyaz kısımlara odaklanmak için gri renk boyutlamasına dönüştürme işlemi gerekiyor.
    • Plaka resmi olarak adlandırılan işlem resmi, cv2 convert color fonksiyonu kullanılarak gri formata dönüştürülüyor.
    • Gri format dönüştürme işlemi sonrası görselleştirme yapılarak sonuçlar inceleniyor.
    20:42Eşikleme İşlemi
    • Segmentasyon adımlarının birinci adımı olan eşikleme işlemi, resmi belirli eşik değerlerine göre sınıflandırmayı sağlıyor.
    • Threshold fonksiyonu tüm resmi tek bir eşik değerinden geçirirken, adaptif threshold fonksiyonu resmi küçük parçalara böler ve her parçada ayrı eşikleme yapar.
    • Adaptif threshold fonksiyonunda ortalama algoritması kullanılarak, belirli bir karenin ortalama değeri hesaplanır ve bu ortalama eşik değer olarak belirlenir.
    22:32Eşikleme Parametreleri
    • Adaptif threshold fonksiyonunda, eşik değerinin üstünde kalan piksellerin ne değer alacağını belirtmek gerekir (örneğin 255 değeri).
    • Eşikleme algoritması olarak ortalama (cv2.ADAPTIVE_THRESH_MEAN_C) veya Gauss (cv2.ADAPTIVE_THRESH_GAUSSIAN_C) kullanılabilir.
    • Eşikleme türü olarak cv2.THRESH_BINARY kullanılır, bu sayede üst değerler 255, alt değerler ise 0 olarak işaretlenir.
    25:02Filtre Boyutu ve Görselleştirme
    • Adaptif threshold fonksiyonunda, resmin kaçarlık parçalara bölüneceğini belirten filtre boyutu (11) ve komşu sayısını belirten değer (2) parametreleri kullanılır.
    • Eşikleme işlemi sonrası görselleştirme yapılarak, plakanın rakamlarının (3, 4, E) net şekilde ayrıştığı görülür.
    • Eşikleme sonrası oluşan gürültüleri (gereksiz detayları) yok etmek için morfolojik işlemlerden açma işlemi kullanılması gerekiyor.
    27:56Açma İşlemi
    • Açma işlemi, önce erozyon (küçültme) sonra genişletme (büyütme) adımlarından oluşur.
    • Küçültme sonrası filtre boyutu altında kalan detaylar, büyütmeye geçildiğinde büyümeyecektir.
    • Filtre boyutu (3x3) önemli bir parametre olup, bu değerin değiştirilmesiyle farklı sonuçlar elde edilebilir.
    29:05Plaka Algılama Projesinde Morfolojik İşlemler
    • Plaka algılama projesinde "t-image" yerine "plaka resmi" yazılacak.
    • OpenCV kütüphanesinden morfolojik işlemler için "morfolojik x fonksiyonu" çağrılıyor.
    • Morfolojik işlemler arasında kapatma, delete, aşındırma, genişletme ve gradyan alma gibi işlemler bulunuyor.
    29:56Açma İşlemi Uygulama
    • Açma işlemi için "open" fonksiyonu seçiliyor ve tekrarlanacak adım sayısı varsayılan olarak "1" olarak belirleniyor.
    • 3x3 boyutunda bir filtre oluşturuluyor ve numpy'de unsecret integer (8 bit tam pozitif tam sayı) olarak depolanıyor.
    • Gürültü yok edilmiş ve eşiklenmiş resim inceleniyor, çoğu gürültünün gittiği görülüyor.
    31:42Sonuç ve Gelecek Adım
    • İşlemler sonucunda sadece rakamlar ve karakterler kalacak, bunları ayrıştırıp sınıflandırma yaparak hangi rakamın ne olduğunu algılayacaklar.
    • Bir sonraki adım olarak fight counter'ları (sayıları) bulmak gerekiyor.
    • Ders uzun sürdüğü için sayfa counter'ları bulma işlemi bir sonraki derste bırakılıyor.

    Yanıtı değerlendir

  • Yazeka sinir ağı makaleleri veya videoları özetliyor