Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, bir veri madencisi tarafından sunulan eğitim formatında bir ders içeriğidir. Konuşmacı, veri madenciliğinin temel kavramlarını ve uygulamalarını detaylı şekilde anlatmaktadır.
- Video, veri madenciliğinin ne olduğunu açıklayarak başlayıp, üç temel modelini (sınıflandırma, kümeleme ve örüntü tanıma) örneklerle açıklamaktadır. Daha sonra veri ambarlarının önemi, veri madenciliğinde kişisel bilgilerin kullanılmadığı, sadece davranışların ve örüntülerin analiz edildiği anlatılmaktadır. Son bölümde ise açık kaynak kodlu ve yarı açık kaynak kodlu programlar hakkında bilgi verilmekte ve işletmecilere yönelik yazılım üretimi tavsiyeleri sunulmaktadır.
- Videoda ayrıca veri madenciliğinin işletmelerde müşteri profilleri oluşturma, ürün ilişkileri analizi ve spor oyunlarında taktik analizi gibi çeşitli alanlardaki uygulamaları gösterilmekte, veri madenciliğinde kullanılan araçlar ve kayıp verilerin nasıl işleneceği ele alınmaktadır. Konuşmacı, hazır yazılımlara güvenmek yerine kendi yazılım üretimi yapmanın avantajlarını kendi deneyimlerinden yola çıkarak vurgulamaktadır.
- 00:11Veri Madenciliği Nedir?
- Konuşmacı veri madencisi olarak çalıştığını ve İngilizce'de "data scientist" olarak adlandırıldığını belirtiyor.
- Veri madenciliği, gerçek madencilikle alakası olmayan, verilerin içinde gizli bilgileri arayan bir disiplindir.
- RFID teknolojileri ve sosyal medya ile her yerde veri üretimi artmış, kullanıcılar internet üzerinden sürekli veri üretmektedir.
- 01:06Verilerin Önemi
- Veri, kayıtlı her şeyi ifade eder; resimler, fotoğraflar, belgeler gibi her şey bir veridir.
- Dijital ortam öncesi verilerin erişimi zordu, ancak bilgisayarlı muhasebe ve ERP sistemleriyle şirketler verilerini veritabanlarında tutmaya başlamıştır.
- Veri madenciliğinde varsayım "hiçbir şey nedensiz değildir" olarak kabul edilir ve gizli bilgileri keşfetmeye çalışılır.
- 02:59Veri Madenciliğinin Uygulamaları
- Veri madenciliği, bilinmeyen ve kullanılabilecek bilgileri keşfetmeyi amaçlar.
- Süpermarket verilerinde gizli örüntüler tespit edilebilir, örneğin mouse alanların kırmızı üzüm alması gibi.
- Veri madenciliği tıpta, işletmelerde, spor alanlarında (futbol, basketbol) çeşitli alanlarda kullanılmaktadır.
- 03:57Veri Madenciliğinde Kullanılan Yöntemler
- Veri madenciliğinde sınıflandırma, kümeleme, örüntü tanıma ve birliktelik kuralları analizi gibi yöntemler kullanılır.
- Sınıflandırma tahmin yapar, örneğin gelecek aylarda ne kadar müşteri geleceğini veya kaybedileceğini tahmin eder.
- Kümeleme (profil çıkarma) ile müşteriler farklı gruplara ayrılır ve farklı reklam kampanyaları için kullanılır.
- 07:09Örüntü Tanıma ve Veri Ambarı
- Örüntü tanıma veya birliktelik kuralları, verilerde gizli ilişkileri keşfetmeyi amaçlar.
- Örneğin, bir numaralı bebek bezi alanların yakın zamanda emzik veya yürüteç alacağı gibi örüntüler tespit edilebilir.
- Veri madenciliği için veriler sayısal verilere dönüştürülmeli ve bu veriler bir veri ambarında saklanmalıdır.
- 09:57Veri Madenciliği İçin Veri Ambarı Oluşturma
- Veri madenciliği için mevcut ve dışarıdan elde edilecek verilerin birleştirilerek yeni bir mantıkta veri ambarı kurulması gerekir.
- Veri madenciliğinde insanların özel bilgileri (isim, TC kimlik numarası) kullanılmaz, sadece yaptıkları işlemler önemlidir.
- Veri madenciliği, benzer davranışları gösteren kişilerin örüntülerini ve potansiyel davranışlarını tespit etmeyi amaçlar.
- 11:45Veri Ambarı Oluşturma Süreci
- Veri ambarı oluşturmak için tek kişinin yeterli olmadığı, veri analisti ve iş alanından kişilerin dahil olması gerektiği vurgulanmaktadır.
- Veri ambarı oluşturulurken veri madenciliği aşamasını bilen kişilerin yardım etmesi önemlidir.
- Verilerin temizlenmesi, derlenmesi ve toplanması için özel araçlar gereklidir çünkü veriler genellikle kirlidir ve yanlıştır.
- 13:08Veri Temizleme ve Analiz
- Veri analizinde boş bırakılan alanlar (kayıp veri) önemlidir ve bu boşluklar analiz edilerek anlam çıkarılabilir.
- Kayıp verilerin yerine tahmini değerler konulabilir ve bu değerler üzerinden önemli sonuçlar elde edilebilir.
- Veri madenciliği ile alışveriş davranışlarından kişilerin cinsiyeti, yaş grubu gibi bilgiler çıkarılabilir.
- 15:11Büyük Veri ve Sınıflandırma
- Büyük veri (big data), çeşitli kaynaklardan toplanmış, çeşitli formatlarda (ses, görüntü, müzik, yazı) verilerdir.
- Büyük veri analizi ile bir kişinin sosyal medya hesapları, takipçileri ve çevresi incelenerek davranışları tahmin edilebilir.
- Veri analizi sonuçları %10-15 gibi düşük anlamlılık düzeylerinde bile önemli olabilir ve büyük şirketler için büyük değer taşır.
- 17:22Veri Madenciliği Araçları
- Veri madenciliği için yazılım araçları kullanmak gerekir ve bu araçlar açık kaynak kodlu veya ticari olabilir.
- Ticari programlar arasında SPSS ve Clementine gibi dünya markası yazılımlar bulunmaktadır.
- Açık kaynak kodlu programlar da veri analizi için kullanılabilir.
- 18:21Açık Kaynak Kodlu Programlar ve Yarı Açık Kaynak Kodlu Programlar
- Kullanıcılar ve firmalar için ücretsiz açık kaynak kodlu programlar kullanılabilir, ancak belirli bir hıza ulaşıldığında zorluklar yaşanabilir.
- Yüksek performans için donanım artışı gerektirir ve bu durumda açık kaynak kodlu programlar donanım optimizasyonu için kod değişiklikleri gerektirebilir.
- Yarı açık kaynak kodlu programlar (örneğin LENA), hem ücretsiz kullanılabilir hem de özel ihtiyaçlara göre uyarlanabilir özelliklere sahiptir.
- 19:36İşletmecilere Yönelik Tavsiyeler
- İşletmecilere, yapay zeka ve makine öğrenmesi algoritmaları gibi karmaşık yazılım geliştirmeyi kendi yazılımcılarına sarmak yerine hazır yazılımlardan yararlanmaları tavsiye edilir.
- Yazılım geliştirme bir ekip işidir ve tek bir yazılımcıya bu görevi vermek başarısızlığa yol açabilir.
- İşletmecilere, hazır yazılımların üzerine kendi modüllerini yazdırmak veya eklemek daha avantajlı olacaktır.