Buradasın

GPT-3 Yapay Zeka Modeli Hakkında Bilgilendirici Röportaj

youtube.com/watch?v=hLg19qox8O0

Yapay zekadan makale özeti

Kısa
Ayrıntılı

TRT İstanbul Radyo Stüdyolarından yayınlanan "Dijital Hayat" programında sunucu Bilal Eren, yapay zeka araştırmacısı Yusuf Sarıgöz ile telefon üzerinden GPT-3 yapay zeka modeli hakkında kapsamlı bir röportaj gerçekleştiriyor.
Röportajda GPT-3'ün ne olduğu, nasıl çalıştığı, GPT-1 ve GPT-2 ile arasındaki farklar, teknik özellikleri (175 milyar parametre, Open AI tarafından geliştirilmesi) ve kullanım alanları detaylı şekilde ele alınıyor. Ayrıca modelin avantajları, riskleri, sınırlamaları ve şu anda kısıtlı sayıda kişiye kapalı test amaçlı kullanıldığı bilgisi paylaşılıyor.
Röportajda GPT-3'ün pahalı olması nedenleri, enerji tüketimi ve karbon salınımı gibi çevresel etkileri, Transformers model mimarisinin sınırlamaları ve metin uzunluğunun artmasıyla modelin kalitesinin düşmesi gibi konular da tartışılmaktadır. Konuşmacılar, GPT-3'ün Turing testine en yakın modelleme olarak değerlendirilmesi ve şu anda yeni bir dönem başladığını iddia etmenin henüz uygun olmadığı görüşüyle röportajı sonlandırmaktadır.

00:11Dijital Hayat Programı Tanıtımı: Bilal Eren, teknoloji ve internetin hayatımızı etkilerini konu edinen "Dijital Hayat" programını sunuyor.
Program her cuma saat 15:30'da TRT İstanbul Radyo Stüdyolarından yayınlanıyor.
Bu hafta, Temmuz ayında beta versiyonu duyurulan ve derin öğrenmeyi kullanan üçüncü nesil dil tahmin modeli GPT-3 konuşulacak.
00:53Türksat'ın Dernek Üyeliği Sorgulama Hizmeti: Türksat'tan Fatih Çiçek, dernek üyeliği sorgulama hizmetini tanıtıyor.
Bu hizmet e-devlet kapısında uzunca süredir sunulmakta ve vatandaşlar yoğun bir şekilde kullanmakta.
Güncellemelerle dernek üyeliği bilgileri detaylandırıldı ve üyelik sonlandırma işlemi de eklendi.
02:29GPT-3'ün Tanıtımı: GPT-3, İngilizce açılımı "Generate Pre-trained Transformer" olan yeni bir dil öğrenme metodu olarak lanse edildi.
Yapay zeka araştırmacısı Yusuf Sarıgöz, GPT-3'ün büyük metin verileri üzerinde eğitilmiş ve insan gibi metinler üretebilen bir yapay zeka modeli olduğunu açıklıyor.
Model, metnin bir kısmını verip geri kalanını tamamlaması isteniyor ve hatalar ölçülüp düzeltiliyor.
04:08GPT-3'ün Çalışma Prensibi: GPT-3, derin öğrenmeyi kullanan bir dil tahmin modeli olarak tanımlanıyor.
Model, insanlar olarak konuştuğumuz dillerde sözcüklerin birbiriyle olan ilişkisini ve hangi sözcükten sonra diğer sözcüğün gelme olasılığını öğreniyor.
Model mantıksal çıkarım yapmıyor, sadece sözcüklerin birbirleriyle ne kadar sıklıkla kullanıldığını öğrenen bir model.
05:27GPT-3'ün Nesil Farkları: GPT-3, Open AI firması tarafından yayınlanan üçüncü nesil model olup, 2018'de GPT-1, 2019'da GPT-2 yayınlandı.
GPT-3'ün en önemli farkı kullanılan verilerin miktarı ve öğrenme kapasitesini belirleyen parametreler.
GPT-2'de 1,5 milyar parametre varken, GPT-3'de bu sayı 175 milyara çıktı, yaklaşık 150 kat fark oluştu.
07:28Yapay Sinir Ağları ve Veri Seti: Yapay sinir ağları, sinir hücrelerinin yapısından ilham alınarak kurgulanan, veriler arasındaki ilişkiyi matematiksel olarak kodlayan bir model.
GPT-3'ün veri seti, internetteki web sitelerinin taranıp depolandığı bir veri setinden ve büyük miktarlarda kitaplardan oluşuyor.
Bu veri miktarı herhangi ortalama bir ev bilgisayarının hard diskine sığmayacak kadar yüksek.
09:34Open AI Hakkında Bilgiler: Open AI, 2015'in sonunda Elon Musk'ın da bulunduğu birkaç yatırımcı ve yazılımcı geliştirici tarafından kurulmuş bir kar amacı gütmeyen araştırma laboratuvarı.
Geçtiğimiz yıl itibariyle Open AI LP ismini verdikleri kar amacı güden bir birim kuruldu ve GPT-3 bu birimdeki ilk ticari projesi.
Open AI, toplamda 120 kadar çalışanı olan, büyük oranda araştırmayı öne alan bir laboratuvar olup, çeşitli ülkelerden araştırmacılar, geliştiriciler ve mühendisler yer alıyor.
12:34GPT-3'ün Kısıtlı Kullanımı: GPT-3, OpenAI tarafından kısıtlı sayıda kişiye kapalı bir sistem içerisinde test amaçlı şekilde kullanılmaktadır.
Başvuru yaparak ve kabul edilerek bu modelin kullanımı için erişim yetkisi verilmektedir.
GPT-3'ü kullanarak ürünler ve hizmetler geliştirmeye çalışan birkaç girişim bulunmaktadır.
13:12GPT-3'ün Kullanım Alanları: Bir girişim, GPT-3'e verilen komutlara uygun, tutarlı ve resmi bir dille mail gönderen bir ürün geliştirmek istemektedir.
Diğer bir girişim, hukuk sözleşmelerini okuyup özetleyen ve teknik terimleri günlük dile çeviren bir ürün geliştirmektedir.
Bu ürünlerin hangilerinin başarılı olup hangilerinin kullanıma gireceğini şu anda kestirmek mümkün değildir.
14:43GPT-3'ün Pahalılığı: GPT-3 öncelikle çalıştırılması oldukça pahalı ve maliyetli bir modeldir.
Bu model, şu ana kadar geliştirilmiş en büyük yapay zeka modeli olup 175 milyar parametre içerir ve bir öncekinden 150 kat daha büyüktür.
Modelin eğitimi sırasında tahminlere göre on milyonlarca dolar harcama yapılmış durumdadır.
15:51Maliyetlerin Kaynağı: Modelin eğitimi sırasında harcanan miktar, modelin bütün yaşam döngüsü içerisindeki masraflarının sadece %10'unu oluşturmakta, %90'ı kullanım sırasında oluşmaktadır.
OpenAI, bu maliyetleri kullanıcılara yansıtmak durumunda kalacaktır.
Başvuru yaparken kullanıcıların bu modele yaklaşık ne kadar harcama yapabileceklerini belirtmeleri istenmektedir.
17:49Moore Yasası ve Yapay Zeka: Moore Yasası'na göre her üç buçuk ayda bir yapay zeka modellerinin kapasitesi yaklaşık iki katına çıkıyor.
Bu modellerin eğitimi ve kullanılması sırasında ciddi bir karbon salınımı olmaktadır.
OpenAI gibi kurumların giderek daha büyük yapay zeka modelleri yapması, enerji tüketimi açısından sürdürülebilir olmayan bir yere götürmektedir.
19:30GPT-3'ün Mantıksal Çıkarım Yeteneği: GPT-3 şu an için sadece öğrendikleri olasılıklar dahilinde verilen cümlenin geri kalanının ne şekilde tamamlanabileceğini tahmin edebilmektedir.
Model bilimsel olarak tutarlı ifadeler getirebilmekte ve deyimleri rahatlıkla kullanabilmektedir.
Bazı durumlarda bariz mantıksal çıkarım hataları yapabilmektedir, örneğin kapı genişliğinden daha geniş bir yemek masasını taşımak için kapının üst kısmını kesip masayı taşımak gibi mantıksız çözümler sunmaktadır.
22:41GPT-3'ün Veri Kapasitesi: GPT-3'ün eğitim sırasında kullanılan veri miktarı internetin tamamını ve çok büyük miktarda kitapları kapsadığı için her tür veri bulunmaktadır.
Model yüksek bir kapasiteye sahip olup, kurgu şeklinde metinler yazma, şiirler yazma ve haber içeriği üretme gibi geniş alanlardan metinler üretmeyi öğrenebilmektedir.
Bir dijital pazarlama uzmanı, GPT-3'ten ürettikleri metinlerle bir web sitesi kurarak reklam alarak gelir yakalamıştır.
23:53Kod Yazma Yeteneği: GPT-3'ün kod yazma yeteneği, metinleştirebildiğimiz, yazabildiğimiz veya seslendirebildiğimiz her türlü hayatımızı kolaylaştıran servisi yazarak uygulamaya dönüştürebileceği örnekler bulunmaktadır.
Sosyal medyada farklı programlama dillerinde yazılmış kod örnekleri paylaşılmaktadır.
Modelin tahmin ürettiği metinlerin kullanılabilirlik oranı şu an itibariyle yaklaşık %30 civarındadır, yani her üç üretiminden sadece bir tanesi kullanılabilir olmaktadır.
25:23GPT-3'ün Doğruluğu ve Sınırlamaları: GPT-3, önceki modellere göre belli alanlarda daha yüksek doğruluk sağlamış olsa da, yapay zekadaki en büyük gelişme veya devrim olarak lanse edilebilecek bir durumda değil.
GPT-3'ün sağladığı ilerleme, daha yüksek miktarda veri ve daha fazla parametre kullanmasından kaynaklanıyor, ancak bilimsel araştırmaya henüz katkısı yok.
Geçen ay yayınlanan bir makalede, GPT-3'ün kullandığı transformer model mimarisinin metin uzunluğu artırmadıkça doğruluğu arttıramayacağı matematiksel olarak gösteriliyor.
27:32GPT-3'ün Kullanım Alanları ve Sınırlamaları: Bilgi işleme dayalı mesleklerin geleceği tehlikede mi veya yapay zeka alanındaki en büyük sıçrama mı sorularının cevabı henüz hayır.
GPT-3'te yapılan çalışmalarda, metin uzunluğu arttıkça modelin üretim kalitesi dramatik şekilde düşmeye başlıyor.
Ortalama bir yazılımda on binlerce satırlık kod yazılırken, birkaç satırdan sonra tutarlılığını kaybedecek bir modelin gerçek hayatta kullanımı olmayacaktır.
29:01GPT-3'ün Önemi ve Sonuç: GPT-3, belki de Alan Turing'in Turing testine en yakın modelleme olarak değerlendirilebilir.
Şu ana kadar yapılan çalışmalar içerisinde Turing testini en yakın şekilde yaklaşan çalışma olarak kabul edilebilir.
Yeni bir dönem başlıyor şeklindeki düşünceler şu anda herkesle pek uyuşmuyor.

GPT-3 Yapay Zeka Modeli Hakkında Bilgilendirici Röportaj

Yapay zekadan makale özeti

Yanıtı değerlendir