Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, bir konuşmacının veri bilimi konusunda sunduğu kapsamlı bir eğitim içeriğidir.
- Video, veri biliminin temel kavramlarını ve uygulamalarını anlatarak başlıyor, büyük veri kavramını üç V modeli üzerinden açıklıyor. Ardından veri biliminin iş dünyasındaki yeri, öğrenme yolları ve projedeki roller detaylandırılıyor. İkinci bölümde ise veri bilimi yöntemlerinin genel tanıtımı, model geliştirme süreci, performans değerlendirmesi ve modelin sahaya çıkarılması anlatılıyor.
- Video ayrıca veri bilimi projelerinin yaşam döngüsünü (ölçülebilir amaç belirleme, veri toplama ve yönetme, model kurma), modelin performansını değerlendirmek için kullanılan metrikleri (confusion matrisi, doğrulama skoru) ve modelin paydaşlara sunulması gibi konuları da kapsamaktadır.
- Veri Bilimi Nedir?
- Veri bilimi, matematik, istatistik, bilgisayar ve alan bilgisinin kesişmesinden oluşur.
- Son zamanlarda internetin ve teknolojinin gelişmesiyle üretilen veri arttı ve büyük veri ortaya çıktı.
- Büyük veri, velocity (verilerin toplanma hızı), volume (verilerin boyutu) ve variate (verilerin çeşitliliği) ile ifade edilir.
- 01:06Veri Biliminin Önemi
- 2006'dan 2020'e kadar veri miktarı üstel olarak artmış, veri günümüzün petrolü olarak nitelendirilmiştir.
- Veriyi değerlendiren şirketler (Google, Facebook, Amazon) kısa sürede devasa boyutlara ulaşmıştır.
- Üretilen verinin %1'dinden bile daha az analiz ediliyor, veri zengin ama bilgi fakiriz.
- 01:59Veri Biliminin Alanları ve Avantajları
- Veri bilimi finanstan sağlığa, eğitimden siyaset bilimine kadar her alanda kullanılmaktadır.
- Veri bilimini öğrenen kişilerin maaşlarına ortalama %50 zam yapılmıştır.
- Veri bilimi, veriyi elde etmek ve yönetmek, model seçmek, kod yazmak ve sonuçları değerlendirmek ile ilgilidir.
- 02:38Veri Bilimini Öğrenme
- Veri bilimi son zamanlarda ortaya çıktığı için yeni üniversitelerde bölümler açılıyor.
- Veri bilimini yüksek lisans yaparak, eğitim kamplarına katılarak veya kitap okuyup video izleyerek öğrenebilirsiniz.
- Temel düzeyde matematik, istatistik veya programlama bilginiz varsa veri bilimini kolay öğrenebilirsiniz.
- 03:13Veri Bilimi Uygulamaları
- Amazon'un marka önerileri, Google'ın reklam önerileri, LinkedIn'ın bağlantı kurma öneri sistemleri, Twitter'ın trend konuları ve Netflix'in film/dizi öneri sistemleri veri bilimi uygulamalarıdır.
- Bu sistemler büyük veri setleri ile oluşturulmuş ve veri tabanı, paralel programlama, akan veri teknikleri ve veri ambarları gibi bilgisayar bilimi kavramlarını kullanır.
- Veri bilimi, veri odaklı karar vermeyi ve bu kararların sonuçlarını yönetmeye odaklanır.
- 04:18Veri Bilimi Projesindeki Roller
- Veri bilimi projesinde en önemli rol proje sponsorudur; sponsor, proje sonuçları ile ilgilenen ve ticari çıkarları temsil eden kişi/kurumdur.
- Alan uzmanı, modelin son kullanıcı tarafını temsil eder ve matematiksel/istatistiksel bilgilere sahip olmak zorunda değildir.
- Veri bilimcisi, projenin başarılı olmak için gerekli bütün aşamalardan sorumlu kişidir ve veri kaynaklarını seçer.
- 06:48Veri Bilimi Projesindeki Diğer Roller
- Veri mimarı, bütün verilerden ve verilerin saklanmasından sorumludur.
- Uygulama rolündeki kişi, veri grubu dışındaki işlerden sorumludur ve projenin çalışması için altyapıyı yönetir.
- İyi bir veri bilimi projesinde veri bilimcisi ile diğer paydaşlar arasında iyi bir diyalog vardır.
- 07:29Veri Bilimi Projesinin Yaşam Döngüsü
- Bir veri bilimi projesinin ilk görevi ölçülebilir bir amaç tanımlamaktır.
- Amacın spesifik olması gerekir, örneğin "kötü kredi verme oranını en az %10 azaltmak" şeklinde.
- İyi bir amaç belirlendikten sonra, bu amaçları gerçekleştirecek verileri toplamaya odaklanmak gerekir.
- 08:55Veri Bilimi Projesinin Aşamaları
- Verileri toplama ve yönetme adımı, gerekli verileri tanımlama, keşfetme ve analize uygun hale getirmeyi kapsar.
- Bu aşamada veri ön işleme yapılır; tekrar eden veriler çıkarılır, veri dönüşümleri yapılır ve veriler görselleştirilerek tanınmaya çalışılır.
- Model kurma aşamasında istatistik ve makine öğrenmesi yöntemleri kullanılır, verilerden önemli bilgiler çıkarılmaya çalışılır ve veri temizleme ile modelleme arasında git-gel yapılır.
- 09:56Veri Bilimi Yöntemleri
- Veri bilimi yöntemleri arasında verilerin kategoriye ayrılması, sayısal değer tahmini, nesnelerin benzer kategorilere gruplanması ve verideki ilişkilerin bulunması bulunmaktadır.
- Sınıflandırma problemi için lojistik regresyon ve ağaç tabanlı metotlar kullanılabilir.
- Model kurulduktan sonra performansı değerlendirilir ve modelin yeterli olup olmadığı, sıradan tahminden daha iyi olup olmadığı ve mantıklı tahminler yaptığından emin olunmalıdır.
- 10:49Model Performansı ve Doğrulama
- Modelin performansını değerlendirmek için confusion matrisi gibi çeşitli metrikler kullanılır.
- Doğrulama skoru, modelin doğru tahmin yaptığı dereceyi gösterir.
- Model doğrulama teknikleri gelecek derslerde detaylandırılacaktır.
- 11:11Modelin Sunulması ve Dağıtımı
- İyi bir model kurulduktan sonra sonuçlar sponsora ve paydaşlara anlatılabilir şekilde sunulmalıdır.
- Sunum yaparken dinleyicilerin anlayabileceği şekilde, ticari ölçümlerle bulguların etkisi anlatılmalıdır.
- Paydaşlar onayladıktan sonra model pilot programlarda test edilir ve gerekirse ayarlanır.
- 12:03Proje Yönetimi
- Projenin ticari, son kullanıcı ve uygulama açısından bakış açıları vardır.
- Proje amacının net, doğrulanabilir ve ölçülebilir olması gerekir.
- Paydaşlar sonuçlara şaşırmamaları için sürekli bilgilendirilmelidir.