• Buradasın

    Aşırı Öğrenme Makineleri ile Sınıflandırma Eğitimi

    youtube.com/watch?v=56XFCgR3GaE

    Yapay zekadan makale özeti

    • Bu video, İstanbul Üniversitesi'nden araştırma görevlisi Fatma Akkoçlu'nun yapay sinir ağları ve aşırı öğrenme makineleri (ELM) konusunda sunduğu akademik bir eğitim içeriğidir. Genç katılımcılar ve hocaların bulunduğu bir etkinlikte gerçekleştirilen sunum, teorik bilgiler ve pratik uygulamaları içermektedir.
    • Video, sınıflandırma kavramının tanımıyla başlayıp, yapay sinir ağlarının çalışma prensiplerini açıklayarak devam etmektedir. Ardından aşırı öğrenme makinelerinin özellikleri, avantajları ve matematiksel modeli anlatılmakta, son olarak churn (müşteri kaybı) analizi örneği üzerinden R programlama dilinde ELM modelinin uygulanması gösterilmektedir.
    • Eğitim içeriğinde, veri setinin hazırlanması, kategorik verilerin dönüştürülmesi, normalizasyon, eğitim ve test veri setlerinin ayrılması gibi adımlar detaylı olarak anlatılmaktadır. Ayrıca, sınıflandırma modelinin performansı karışıklık matrisi, doğruluk ölçüsü (accuracy) ve eşik değerlerinin ayarlanması gibi yöntemlerle değerlendirilmektedir.
    00:03Sunumun Tanıtımı
    • Programın son sunumu "Aşırı Öğrenme Makinesi ile Sınıflandırma" konulu olup, İstanbul Üniversitesi'nden araştırma görevlisi Fatma Akkoçlu tarafından sunulacak.
    • Sunucu kendini tanıtarak İstanbul Üniversitesi Matematik Bölümü mezunu, Ekonomi Bilim Dalında yüksek lisans ve doktora eğitimine devam eden biri olduğunu belirtiyor.
    • Doktora çalışmalarında churn analizi üzerine çalıştığını ve bu konuda sınıflandırma ve aşırı öğrenme makineleri dahil çeşitli yöntemlerle öneriler hazırladığını ifade ediyor.
    03:49Sunumun İçeriği
    • Sunum, lisans öğrencileri ve mühendislik ağırlıklı bir grup için hazırlanmış olup, önce sınıflandırma işlevi tanıtılacak.
    • Sınıflandırma işlemi için kullanılan yöntemlerden biri olan aşırı öğrenme makineleri konusu ele alınacak.
    • Churn analizi problemi üzerinden aşırı öğrenme makinelerinin nasıl kullanılabileceği gösterilecek ve programlama diliyle bir uygulama sunulacak.
    05:33Sınıflandırma Kavramı
    • Sınıflandırma, veri setindeki örnekleri daha önce belirlenen sınıflara eşleştirmek için yapılan işlemdir.
    • Sınıflandırma genel anlamda, veri setindeki örnekleri sınıflandırmak için bir fonksiyon (model) bulmayı amaçlar.
    • Sınıflandırma iki adımdan oluşur: öğrenme adımı ve sınıflandırma adımı.
    07:08Veri Seti ve Nitelikler
    • Veri seti, örneklerin çeşitli özellikleri (nitelikler) ve sınıf niteliği (sınıf etiketi) olarak oluşur.
    • Örneğin, hasta veri setinde ad, soyad, cinsiyet, yaş gibi demografik özellikleri ve kan test sonuçları gibi nitelikler bulunur.
    • Sınıf niteliği, örneğin hastanın kanser türü gibi sınıflandırma yapılacak kategoriyi belirtir.
    09:12Yapay Sinir Ağları
    • Yapay sinir ağları, insanların biyolojik sinir hücrelerinden yola çıkılarak elde edilmiş bir modeldir.
    • Yapay sinir ağları, öğrenme, sınıflandırma, genelleme ve optimizasyon gibi konularda uygulama yapılabilen hücresel bilgisayar sistemleridir.
    • Yapay sinir ağları, girdi katmanı, gizli (ara) katmanlar ve çıktı katmanından oluşan çok katmanlı yapılardır.
    11:13Yapay Sinir Ağlarının Yapısı
    • Yapay sinir ağlarında girdi katmanındaki değerler, veri setindeki nitelikleri temsil eder.
    • Çıktı katmanındaki değerler ise veri setindeki sınıf niteliğini belirtir.
    • Ağın içindeki hücreler (proses elemanları veya sinir hücreleri) girdileri işleme alarak çıktıları üretir.
    13:15Yapay Sinir Hücresi İşlemi
    • Yapay sinir hücrelerinde gelen girdiler, hücre içerisinde çeşitli işlemlerden geçerek aksonlar dışarıya iletilir.
    • Her girdiye ait bir ağırlık katsayısı (a₁, a₂, a₃) bulunur ve bu katsayılar hücre için cildeki etkinlik değerini gösterir.
    • Girdi değerleri ve ağırlık değerleri toplama fonksiyonu vasıtasıyla net girdi bilgisine dönüştürülür, ardından aktivasyon fonksiyonuna tabi tutulur ve sonuç dış dünyaya çıktı olarak iletilir.
    14:24Toplama ve Aktivasyon Fonksiyonları
    • Toplama fonksiyonu sadece toplama işlevi değil, çarpım, maksimum, minimum, çoğunluk gibi farklı fonksiyonlar da olabilir.
    • Literatürde en sık kullanılan toplama fonksiyonu ağırlıkta toplama fonksiyonudur ve g₁ = g₁ girdi vektörü ile katsayıların çarpımlarının toplamı şeklinde ifade edilir.
    • Aktivasyon fonksiyonu olarak sinüs, sigmoid fonksiyonu gibi çeşitli fonksiyonlar kullanılır ve literatürde en sık kullanılan aktivasyon fonksiyonu sigmoid fonksiyonudur.
    15:32Yapay Sinir Ağlarının Sınıflandırılması
    • Yapay sinir ağları en temel olarak ileri beslemeli ve geri beslemeli olmak üzere iki alt sınıfa ayrılır.
    • İleri beslemeli yapay sinir ağlarında girdi, ara katman ve çıktı olmak üzere tek yönlü olarak ilerleyen bir yapı vardır.
    • Geri beslemeli yapay sinir ağlarında bir sinir hücresinden çıkan çıktı aynı sinir hücresinin girdisi olabilir veya farklı bir katmanın girdisi olabilir.
    16:16Aşırı Öğrenme Makineleri
    • Aşırı öğrenme makineleri, 2002 yılında Çin tarafındaki bir araştırma grubu tarafından geliştirilen bir yöntemdir.
    • Bu yöntem, yüksek doğruluk değerine sahip, kullanıcı müdahalesine az gereksinim duyan ve kısa öğrenme süresine sahip olmak üzere üç özellik üzerine odaklanmıştır.
    • Aşırı öğrenme makinelerinde ağırlık değerleri ve eşik değerleri kullanıcıya bağlı kalmaz, otomatik olarak rastgele üretilir ve bu sayede daha hızlı bir öğrenme süreci sağlanır.
    18:24Aşırı Öğrenme Makinelerinin Kullanım Alanları
    • Aşırı öğrenme makineleri özellikle biyomekanik çalışmalarda ve görüntü işlemede çok fazla kullanılmaktadır.
    • Diğer kullanım alanları arasında sınıflandırma, sistem modelleme, kontrol ve robotik, hata tespiti ve zaman seviyeleri analizi bulunmaktadır.
    • Bu yöntemlerin performansını geliştirmeye yönelik çalışmalar yapılmış olmasına rağmen, literatürde hala tartışmalar devam etmektedir.
    19:40Yapay Sinir Ağlarının Matematiksel Modeli
    • Yapay sinir ağlarında x ve y olmak üzere iki sayı birbirinden farklı ve keyifli seçilmiş örnekler kullanılır, x girdiler, y ise elde etmek istenen çıktı değeridir.
    • Tek gizli katmanlı ileri beslemeli yapay sinir ağlarında gx fonksiyonu toplama fonksiyonu olarak adlandırılır ve ağırlıklarla x değerleri toplanarak eşik değerinin üstüne eklenir.
    • h(x, β, t) gösteriminde h ağırlıklarla eşik değerinin toplanması ile elde edilen değer, β çıktı ağırlıkları, t ise en sonunda elde edilen değerdir.
    21:32Yapay Sinir Ağlarının Eğitim Amacı
    • Yapay sinir ağlarında eğitim ve test veri seti olarak ayrılır, eğitim veri setinde model oluşturulurken sınıflar belli olur.
    • Amacımız gerçek çıktı değerleri (t) ile modelin ürettiği çıktı değerleri (t̂) arasındaki farkı minimum yapmaktır.
    • Yapay sinir ağlarının temelinde üç adımlı bir işlem vardır: rastgele ağırlıklar ve eşik değerleri elde edilir, toplama ve aktivasyon fonksiyonu ile h değeri bulunur, hatalı minimize edecek şekilde çıktı ağırlıkları bulunmaya çalışılır.
    24:37Çöl (Churn) Problemi ve Önemi
    • Çöl (churn), kaybedilen müşteri anlamına gelir ve işletmeler müşterilerini kaybetmemek için çeşitli çabalar sarf ederler.
    • Yeni bir müşteri kazanmak daha yüksek maliyet gerektirir, bu nedenle mevcut müşterileri korumak önemlidir.
    • Çöl problemi, özellikle telekom şirketlerinde numara taşıma ile müşterilerin kolayca kaybedilebileceği bir sektörde önemlidir.
    25:53Çöl Tahmini ve Veri Seti
    • Çöl tahmini, yakında ayrılma durumu olacak olan müşterileri tahmin etmeyi amaçlar.
    • Çalışma, telekom şirketinin çöl müşteri verilerini kullanarak ELM (Extreme Learning Machine) algoritmasıyla bir model oluşturmayı hedefler.
    • IBM'dan alınan veri seti, müşterilerin hizmetleri, demografik özellikleri ve sözleşmeleri ile ilgili toplam 21 alan ve 7000 kayıttan oluşur.
    27:14Veri Ön İşleme ve Kategorik Değişkenler
    • ELM algoritması sayısal değerler kullanıldığı için kategorik değişkenleri sayısal hale getirmek gerekir.
    • One-hot encoding yöntemi, kategorik değişkenleri farklı yeni nitelik alanlarına dönüştürür.
    • Bu dönüşüm sonrası veri setindeki alan sayısı 41'e çıkar.
    28:52Programlama ve Veri Hazırlama
    • Uygulama için R programlama dili kullanılmıştır.
    • Veri setini çalışmaya dahil etmek için "readxl" kütüphanesi yüklenir ve "read_excel" fonksiyonu kullanılır.
    • Veri seti normalizasyon işlemine tabi tutulur ve "cluster" paketi kullanılarak "data.normalization" fonksiyonu ile gerçekleştirilir.
    31:33Eğitim ve Test Veri Seti Oluşturma
    • Veri seti, eğitim ve test veri setlerine "hold out" yöntemiyle ayrılır.
    • Literatürde yaygın olarak kullanılan oranlar %70 eğitim, %30 test veya %80 eğitim, %20 test şeklinde olabilir.
    • "create partition" fonksiyonu kullanılarak veri seti, sınıf nitelik alanı (çöl) göre %70 eğitim, %30 test olarak ayrılır.
    32:53ELM Modeli Oluşturma ve Tahmin
    • ELM modeli oluşturmak için "elm.train" fonksiyonu kullanılır.
    • Fonksiyonda eğitim veri seti, sınıf niteliği, ara katmandaki nöron sayısı ve aktivasyon fonksiyonu belirtilir.
    • Model oluşturulduktan sonra "elm.predict" fonksiyonu kullanılarak test veri setindeki sınıflar tahmin edilir.
    34:34Model Tahmin İşlemi
    • Modeli açıp hangi modelde kullanılacağını belirleyerek, test verisindeki sınıf bilgisini tahmin ediyoruz.
    • Elde edilen çıktı değerleri üzerinden bir eşik değeri belirleyerek örneklerin hangi sınıfa ait olduğunu buluyoruz.
    • Çıktı değerlerini belirli bir aralığa taşımak için minimum-maksimum normalizasyon işlemi uyguluyoruz.
    35:48Eşik Değeri ve Tahminler
    • Tahmin değerlerinin 0.75 üzerindeyse bir (churn olan) sınıfa, altında kalan değerler sıfır (churn olmayan) sınıfa ait olarak belirliyoruz.
    • Performans göstergelerine göre çeşitli denemeler yaparak en iyi eşik değerini belirliyoruz.
    • Model performansını ölçmek için çeşitli hesaplamalar ve ölçüler kullanıyoruz.
    36:39Karışıklık Matrisi
    • Karışıklık matrisinde üstte gerçek sınıf değerleri, yan tarafta tahmin sınıf değerleri yer alıyor.
    • TP (True Positive): Gerçekte churn olan ve modelin de churn olarak tahmin ettiği örnekler.
    • FP (False Positive): Gerçekte churn olmayan ama modelin churn olarak tahmin ettiği örnekler.
    • FN (False Negative): Gerçekte churn olan ama modelin churn olarak tahmin etmediği örnekler.
    • TN (True Negative): Gerçekte churn olmayan ve modelin de churn olarak tahmin etmediği örnekler.
    38:51Doğruluk Ölçüsü ve Performans Değerlendirmesi
    • Doğruluk ölçüsü (Accuracy) (TP+TN) / Tüm tahmin edilen değerler şeklinde hesaplanıyor.
    • Örnek olarak karışıklık matrisinde TP değeri 204 olarak görünüyor ve doğruluk değeri %78 olarak hesaplanıyor.
    • Performansı artırmak için on sayısı, aktivasyon fonksiyonu veya eşik değeri değiştirilebilir.
    • %78 doğruluk değeri yeterli değilse, SVM, başka bir yapay sinir ağ algoritması veya farklı bir kara ağ algoritması uygulanabilir.

    Yanıtı değerlendir

  • Yazeka sinir ağı makaleleri veya videoları özetliyor