Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, Rıza Da Gül, Galipankaya, Tank Tanay, Umut, Galip ve Aysun gibi öğrencilerin katıldığı bir toplantı formatındadır. Katılımcılar elektrik-elektronik, makine ve bilgisayar mühendisliği öğrencileridir.
- Videoda öğrenciler kendi buldukları veri setlerini ve bu veri setleriyle ilgili projelerini sunmaktadır. İlk bölümde öğrenciler kendi projelerini anlatırken, ikinci ve üçüncü bölümlerde veri seti seçimi ve problem tanımlama toplantıları gerçekleştirilmektedir. Toplantılar sonunda katılımcılar 2022 yılı ile ilgili ve güncel veri seti olan uçuş biletleri projesi üzerinde çalışmayı planlamaktadır.
- Katılımcılar şarap tadımcılığı, oyun satış analizi, orta Asya'daki arabalar ve el aletlerinin sınıflandırılması, kalp hastalıkları, araba fiyatları, kuş türleri sınıflandırma, şarap kalitesi tahmin etme ve uçak fiyat tahmini gibi çeşitli veri seti problemlerini ele almaktadır. Toplantılar sonunda katılımcılar kendi tercih ettikleri veri setlerini ve bunların kullanım amaçlarını tartışmaktadır.
- Şarap Tadımcılığı Projesi
- Rıza Gül, elektrik-elektronik mühendisliği dördüncü sınıf öğrencisi olarak iki potansiyel proje sunuyor.
- İlk proje, şarap tadımcılığını makine öğrenmesi ile geliştirme olup, Twitter ve Vine'da bulunan 119.000 düzeltme yazılmış şarap yorumlarından oluşuyor.
- Veri setinde şarabın nasıl yapıldığı, nerede yapıldığı, üzümüyle ilgili bilgiler, puanlama, satış bilgileri ve Twitter yorumları bulunuyor.
- 01:25Şarap Tadımcılığı Projesinin Detayları
- Mevcut çalışmalar çoğunlukla eksik datanın tamamlanması, fiyat ve puanlandırma ile ilgili olup, Rıza bu iki veriyi birleştirip daha geniş bir data seti oluşturmayı planlıyor.
- 130.000 eksik kısmı makine öğrenmesi ile doldurulacak ve text mining metodu kullanılarak kullanıcıların kendi yorumlarını yazarak daha az bölge gezerek şarap tadımı yapabilecekler.
- Veri setinde 119.000 tamamlanmış veri ve 130.000 eksik veri bulunuyor, çoğunlukla iki farklı bölgenin üzüm birleştirilmediği için eksiklikler oluşuyor.
- 03:15Oyun Satış Analizi Projesi
- İkinci proje, bir oyunun ilk çıktığı platformda yaptığı toplam satış analizi olup, günümüzde çoğu oyun firması ana oyunlarını tek bir sektöre çıkartıyor.
- Veri setinde hangi oyuncunun hangi yılda ne kadar sattığı, çıktığı platform türü, çıktığı yıl ve ismi gibi bilgiler bulunuyor.
- Bu veriler analiz edilerek oyun firmalarına hangi sektörde daha fazla satış yapabilecekleri veya hangi dil desteği getirmeleri gerektiği gibi tavsiyelerde bulunulabilir.
- 06:50Araba Verileri Projesi
- Galipankaya, makine mühendisliği dördüncü sınıf öğrencisi olarak orta Asya'daki arabalar ve el aletlerinin sınıflandırılması gibi iki veri seti sunuyor.
- Araba verileri setinde 4.560 satır ve 20 özellik bulunuyor, motor kapasitesi, silindir sayısı, çekiş sistemi, yakıt tankı kapasitesi gibi bilgiler mevcut.
- El aletlerinin sınıflandırılması projesinde torn, takım çantası, İngiliz anahtarı gibi el aletlerinin fotoğraflarıyla hangisinin ne olduğunu bulma çalışması yapılabilir.
- 10:06Kalp Hastalıkları ve Araba Fiyatları Verileri
- Tank Tanay, bilgisayar mühendisliği dördüncü sınıf öğrencisi olarak kalp hastalıkları ve araba fiyatları ile ilgili iki veri seti sunuyor.
- Kalp hastalıkları veri setinde 4.238 satır ve 16 kol bulunuyor, yaş, eğitim, sigara kullanımı, glukoz oranı gibi bilgiler mevcut ve hedef olarak 10 yıl içinde hastalık taşıma ihtimali tahmin ediliyor.
- Araba fiyatları veri setinde 4.340 satır ve 8 kol bulunuyor, kilometre, yakıt tipi gibi bilgiler mevcut ve hedef olarak arabanın fiyatı tahmin ediliyor.
- 13:35Veri Seti Önerileri
- Konuşmacı, üç farklı veri seti öneriyor: bir veri setinde hiçbir özellik bulunmuyor, üçüncü veri setinde ise 500 farklı kuşun resimleri (ortalama 150-200 farklı kuş) bulunuyor.
- Kuş resimleriyle yapılan image classification problemi, makineye farklı fotoğraflar vererek modelin hangi kuş olduğunu tahmin etmesini sağlıyor.
- Konuşmacı, hard diseases'i favori olarak seçiyor ve diğer katılımcılar da farklı veri setleri öneriyor.
- 15:14Şarap Kalitesi ve Dil Öğrenme Veri Setleri
- Redwine quality veri setinde 1599 veri bulunuyor ve şarabın asit oranı, sitrik asit oranı, şeker oranı, pH değeri ve quality değeri gibi bilgiler mevcut.
- Adult language learning profile veri setinde insanların anadili, öğrenmek istedikleri dil, dillerin benzerlik oranı, yurt dışında kaldığı süre ve dil eğitimi aldığı süre gibi bilgiler bulunuyor.
- Redwine quality veri setinde hiç missing data yokken, adult language learning profile veri setinde büyük bir missing data var.
- 17:52Vücut Ağırlığı ve Uçuş Fiyatı Veri Setleri
- Bodyfed prediction veri setinde 252 erkek vücudu üzerinden ölçümler yapılmış ve çeşitli denklemler tanımlanmış, bu denklemlere göre vücut ağırlığı riski ölçülebiliyor.
- Flight price prediction veri setinde uçuş rezervasyonu verileri analiz ediliyor ve havaalanına göre, kalkış süresine, uçuş sınıfına, uçuş firmasına ve şehre göre fiyat değişimi tespit ediliyor.
- Production veri setinde insanın yaşı, cinsiyeti, hastalıkları, tansiyon, şeker, sigara içme durumu gibi parametreler kontrol ediliyor ve felç geçirme riski tahmin ediliyor.
- 22:00Veri Setlerinin Amaçları
- Şarap veri setinin amacı satışta kolaylıkla hız sağlanması, çünkü her şarabın açılıp takılması mümkün olmuyor.
- Araba yakıt tüketimi veri setinin amacı, kullanıcıların arabalarının yakıt tüketimini tahmin etmek ve ortalama bir fikir vermek.
- Şarap veri setinin kimyasal etkileri veri setinin amacı, kullanıcıların yorumlarına göre şarabın hangi tatları verdiğini belirlemek.
- Uçuş fiyatı veri setinin amacı, insanların uçuş yaparken daha bilinçli hareket edebilmesi için hangi klasta, hangi saatte daha uygun olacağını belirlemek.
- 26:59Uçuş Fiyatlandırma Projesi
- Uçuş süresi ve şehir bilgileri gibi girdiler kullanılarak, klas, havayolu veya firma bazında bilet fiyatlarının nasıl değiştiği analiz edilebilir.
- Uçuşa ne kadar kala bilet alınması daha uygun olacağını belirlemek için bir sistem geliştirilebilir.
- Aktarmalı uçuşların fiyatlandırması için başlangıç ve bitiş noktaları kullanılarak daha ekonomik uçuşlar önerilebilir.
- 28:07Proje Seçimi ve Planlama
- Grup üyeleri arasında bulunan linkler paylaşılacak ve birbirlerinin bulduğu projelere bakılacak.
- 2022 ile ilgili ve geniş veri seti olan projeler tercih edilebilir.
- Cuma gününe kadar zaman olduğu için proje konusu değişebilir ve yeni fikirler tartışılabilir.
- 31:25Toplantının Kapanışı
- Toplantı sonlandırıldı ve herkesin eline sağlık denildi.
- Grup üyeleri arasında haberleşme devam edecek ve yeni fikirler paylaşılacak.
- Uçuş noktaları paylaşarak projeyi genişletme fikri de gündeme getirildi.