Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, bir eğitmen tarafından sunulan SPSS Modeller (IBM'in daha önce Clementin olarak bilinen ürünü) hakkında kapsamlı bir eğitim serisidir.
- Video, SPSS Modeller'in temel özelliklerini, arayüzünü ve kullanımını adım adım göstermektedir. İçerikte Excel'den veri yükleme, veri türlerini tanıma, KNN algoritması, confusion matrix, decision tree, neural network, logistic regression gibi sınıflandırma yöntemleri ve partition (veri bölme) gibi özellikler anlatılmaktadır.
- Eğitim, başlangıç seviyesindeki kullanıcıların SPSS'i kullanabilmeleri için tasarlanmış olup, ileri düzey özelliklerin de bulunduğu belirtilmektedir. Video, Windows ortamında kaydedildiği için kayıt kalitesi hakkında özür dilemektedir.
- 00:01SPSS Modeller Tanıtımı
- Bu eğitim serisi SPSS Modeller'i anlatmayı amaçlıyor, IBM'in Clementin olarak bilinen ve daha sonra satın aldığı bir ürünü.
- SPSS Modeller'in kurulabilen ve online çalışabilen versiyonları bulunuyor, şu an 18.1 versiyonuna geçilmiş durumda.
- Otuz günlük deneme sürümü indirilebiliyor ve öğrenciler, öğretim üyeleri ve akademisyenler için yıllık ücretsiz versiyonları mevcut.
- 00:55SPSS Modeller Arayüzü
- Açıldığında hazır uygulamalar kullanılabilir veya yeni bir stream (workflow akışı) oluşturulabilir.
- Palet içinden istenen herhangi bir tool kullanılabilir ve Python, Spark gibi eklentiler bulunuyor.
- Sağ tarafta CRISP-DM'in altı adımını görebilirsiniz.
- 02:00Veri Yükleme ve Model Oluşturma
- Örnek olarak boy, kilo ve cinsiyet tahmini ile sınıflandırma problemi (classification problem) ele alınacak.
- Excel dosyası yüklemek için "Source" kısmından "Excel" seçeneği kullanılır ve dosya kaynağı belirtilir.
- Veri kaynağı başarıyla okunduktan sonra model geliştirilebilir, ancak bazı tool'larda Excel açıkken dosya okunamayabilir.
- 03:43Model Oluşturma İşlemi
- Model oluşturmak için "Model" seçeneğinden KN (kabul edilir) kullanılır.
- Düğümleri bağlamak için sağ tıklayıp "Connect" seçeneği kullanılır.
- Sadece seçili düğümü çalıştırmak için "Run" seçeneği, tüm sistem için "Tamamını Çalıştır" seçeneği kullanılır.
- 04:42SPSS Veri Madenciliği Kullanımı
- SPSS'te bağlantılar "connect" komutuyla yapılır ve önceden bağlantı varsa "replace" ile güncellenir.
- "Type" özelliği ile giriş ve çıkışlar ayarlanır, hedef değişkeni seçerek model oluşturulur.
- Oluşturulan model grafiksel olarak gösterilir ve üç boyutlu olsaydı üç boyutlu bir model olarak çizilirdi.
- 05:44Çıktıların İncelenmesi
- Çıktılar "table" veya "matris" olarak görüntülenebilir; "table" satır satır sonuçları gösterirken, "matris" karışıklık matrisi benzeri çıktılar sunar.
- Matris çıktısını alırken hangi değerlerin karşılaştırılacağı ayarlanmalıdır, aksi takdirde hata mesajı alınır.
- Table çıktısında her satır için tahminler görülebilirken, karışıklık matrisi daha fazla bilgi sağlar.
- 06:58Model Ayarları
- Model ayarları içinde ilişkilerin nasıl kurulacağı, mesafe hesaplaması için Manhattan veya Euclidean mesafe gibi seçenekler bulunur.
- Ortalama hesaplaması için ortalama, medyan veya mod gibi seçenekler mevcuttur.
- Feature selection ve cross validation gibi yöntemler kullanılabilmektedir.
- 08:10Diğer Algoritmalar ve Özellikler
- SPSS'te C5.0 ve karar ağacı gibi algoritmalar bulunur, ancak C5.0 lisanslı bir algoritma olduğu için ücretsiz ürünlerde bulunmaz.
- Karar ağacı algoritması, verileri belirli değerlerle böler ve dağılımını gösterir.
- "Auto Classifier" seçeneği, sistemde yüklü olan tüm algoritmaları test ederek en iyi modeli bulmaya çalışır.
- 09:45Yapay Sinir Ağları ve Veri Bölümleme
- SPSS'te yapay sinir ağları hem sınıflandırma hem de tahmin için kullanılabilir, ancak sadece iki tane fonksiyon ve en fazla iki gizli katmanı destekler.
- Veri bölümleme için "partition" özelliği kullanılır ve veri seti eğitim ve test için belirli oranlara ayrılabilir.
- Partition işlemi veriye etiket ekleyerek eğitim ve test kümelerini ayırır.
- 12:12SPSS Modellerinde Veri Partitioning ve Logistic Regression
- Veri partitioning işlemi yapıldıktan sonra, connect komutu ile selective içine veri akıtılmaktadır.
- Partition'ın training olduğu durumlar için bir akış, test olduğu durumlar için başka bir akış oluşturulmaktadır.
- Logistic regression modeli oluşturulup, connect komutu ile train edilecek veriye bağlanmaktadır.
- 13:07Model Test Etme ve Sonuçlar
- Test için farklı bir veri kullanmak için table ve matris eklentileri kullanılmaktadır.
- Logistic regression modeli tahminler yaparak cinsiyet sınıflandırması gerçekleştirir.
- Confidence table sonuçları incelenerek modelin performansı değerlendirilmektedir.
- 13:48Veri Bilimi Hakkında Genel Bilgi
- Bu dizi, veri bilimindeki tüm araçları tanıtmayı amaçlamaktadır.
- Veri bilimi alanında başarılı olmak için algoritmaları iyi tanıma, problemi ve veriyi iyi tanıma önem taşımaktadır.
- Windows ortamında kayıt yapıldığı için ses kalitesi sorunları yaşanabilir.