• Buradasın

    Microsoft Cognitive Services Eğitim Sunumu

    youtube.com/watch?v=7G_w6k8bkPg

    Yapay zekadan makale özeti

    • Bu video, Microsoft Türkiye'de çalışan bir uzman tarafından sunulan, Microsoft Cognitive Services hakkında kapsamlı bir eğitim içeriğidir. Sunumda Burak Aydın ve Sami adlı kişiler de yer almaktadır.
    • Video, Microsoft Cognitive Services'in ne olduğunu, nasıl kullanılabileceğini ve çeşitli API'lerini (Computer Vision, Emotion Recognition, Speech, Bing Search) detaylı olarak anlatmaktadır. Sunum boyunca görüntü işleme, konuşma tanıma, dil analizi ve arama gibi farklı alanlardaki servislerin demoları gösterilmekte, ayrıca DirectMan API'si ve uygulamaları hakkında bilgiler verilmektedir.
    • Sunumda ayrıca bu servislerin Azure Machine Learning ile nasıl entegre edilebileceği, farklı projelere nasıl entegre edilebileceği ve örnek projeler (Howald.dotnet, Twind, Maymunlar, Mimier Alarm, Magic Mirror) gösterilmektedir. Video, izleyicilere workshop fırsatı sunmakta ve GitHub üzerinden kod örneklerinin indirilebileceği belirtilmektedir.
    00:01Microsoft Cognitive Services Tanıtımı
    • Konuşmacı, sürekli değişen teknolojilerin içinde çalıştığını ve bir firma PC ve server'dan IoT ve big data'ya eğilebileceğini belirtiyor.
    • Microsoft'un yapay zeka çözümlerini insanların kullanabileceği servis haline getirdiğini ve bu videoda Cognitive Services'i tanıtacağını söylüyor.
    • Konuşmacı, servislerin tanıtımını, demolarını ve günlük hayatta kullanımlarını göstereceğini, ayrıca workshop ayarlayarak katılımcıların kodlayarak test edebileceklerini belirtiyor.
    01:07Cognitive Services'in Özellikleri
    • Cognitive Services sadece birkaç serviste kısıtlı değil, görüntü işleme (vision) servisi ile fotoğraflardaki nesneleri tanımlayabiliyor.
    • Speech API'ları ile konuşulan cümleleri text'e dönüştürebiliyor ve kayıtlı seslerden konuşulanları tespit edebiliyor.
    • Dil, bilgi ve arama tarafında da çok fazla servis bulunuyor ve API'lar belli bir sayıya kadar ücretsiz, sonrasında kurumsal çözüm için ücret uygulanıyor.
    05:36Cognitive Services'in Kullanım Alanları
    • Cognitive Services, görme engelli vatandaşlar gibi özel ihtiyaçları olan kişilerin etrafını görebilmeyi ve yorumlayabilmeyi sağlayan bir servis.
    • Servis, etrafındaki nesneleri, aksiyonları, kişileri ve kişilerin cinsiyetlerini, mutluluk durumlarını tanımlayabiliyor.
    • OCR teknolojisi ile fotoğraflardaki text'leri çıkartabiliyor ve okuyabiliyor.
    07:14Machine Learning ve Azure Machine Learning
    • Cognitive Services'in temelinde machine learning bilimi var ve Azure Machine Learning üzerine çalışıyor.
    • Azure Machine Learning, özel metodlar ve teknikler geliştirmek isteyenler için test ve prototipleme imkanı sağlıyor.
    • Microsoft, 25 yıldır bu servisleri kendi içinde kullanıyor ve geliştiriyor, bu da diğer firmaların gelemeyeceği bir noktada olmalarını sağlıyor.
    09:56Cognitive Services'in Avantajları
    • Cognitive Services'in sistemi train etmek için örneklerin çok önemli olduğu vurgulanıyor.
    • Coca-Cola ile yapılan projede, kişinin yaşı ve cinsiyetini tespit edebiliyor ve Coca-Cola şişesinin 100. yıl özel kampanyasını tespit edebiliyor.
    • Cognitive Services'in tamamı REST API ile haberleşiyor, bu da platform bağımsızlığı sağlıyor ve web, Android, iOS, Windows gibi farklı cihazlarda kullanılabilir.
    12:36Microsoft Cognitive Services Tanıtımı
    • Konuşmacı, Microsoft Cognitive Services'in sunduğu servisleri kullanarak kendi servislerinizi geliştirebilir veya mevcut servis üzerinden kendi servislerinizi satabilirsiniz.
    • Örneğin, yoldaki asfaltlardaki hazar durumunu belirleyen bir proje yapıp, bunu Tokyo'daki başka bir firma entegre ederek belediyelere çözüm sunabilirsiniz.
    • Microsoft Cognitive Services'in API'leri computer vision, emotion recognition, speech, dil özellikleri ve bilgi birikimi gibi farklı alanlarda çalışmaktadır.
    14:05Duygu Tespiti Servisi Testi
    • Konuşmacı, mutluluk duygusunu tespit eden servisi test etmek için farklı fotoğraflar kullanmıştır.
    • Van Persie'nin fotoğrafını test edince, servis mutluluğun sıfıra yakın olduğunu ve hiçbir korku olmadığını tespit etmiştir.
    • Aykut Kocaman'ın gol sevinciyle çekilen fotoğrafını test edince, servis nötr duyguya yakın yüzde doksanaltı oranını vermiştir.
    16:13Caption Bot AI Servisi
    • Caption Bot AI servisi, fotoğraf yüklediğinizde obje tanıma, kişi tespiti ve Bing Search'den ünlü olup olmadığını kontrol ederek bilgi sunmaktadır.
    • Sistem, Aykut Kocaman'ın fotoğrafını yüklediğinizde "bir koltuk üzerinde oturuyor ve nötr bir şekilde" ve yüzde doksansekiz oranında "Aykut Kocaman" olduğunu tespit etmiştir.
    • Grup fotoğraflarında da Aykut Kocaman'ı tanıyarak yüzde doksandokuz oranında doğru sonuç vermiştir.
    17:43Servislerin Entegrasyonu ve Örnekler
    • Servisleri entegre etmek için sadece bir key gereklidir ve bu key ile tüm platformlarda ve dillerle çalışabilirsiniz.
    • Howald.dotnet'in Hold web sitesi, fotoğraf yüklediğinizde yaşınızı ve cinsiyetinizi tespit eden bir uygulamadır.
    • Twind servisi, iki fotoğraf koyduğunuzda kişilerin birbirine ne kadar benzediğini tespit eder.
    19:42Diğer Başarılı Projeler
    • Maymunlar projesi, fotoğraftaki kişinin bıyığının boyutunu tespit eder ve bıyık yoksa sanal bıyık oluşturarak kaydedip paylaşabilirsiniz.
    • Mimier Alarm, Microsoft Garaj'ın geliştirdiği bir alarm uygulamasıdır.
    • Bu alarm, kullanıcıya gülümseyen fotoğrafını çekmesini isteyerek yüzde yetmiş güldüğünü, yüzde doksan'dan yüksek gülümsemesi gerektiğini ve sol gözünün kapalı çekildiğini belirtir.
    21:11Microsoft Cognitive Services Kullanımı
    • Microsoft Cognitive Services, kullanıcıya bir fotoğraf çekmesini ve İngilizce tekerleme söylemesini isteyen, bu işlemi yaparken kullanıcıyı uyanır veya telefonu kıracak şekilde etkileyen bir proje sunuyor.
    • Bu servisler, projeleri farklılaştırmak için kullanılabilir ve hızlı prototipler oluşturmak için ideal bir araçtır.
    • IoT projesi örneğinde, kilitli bir dolapta kamera ve buton bulunuyor; kamera çekilen fotoğrafı kayıtlı fotoğraflarla karşılaştırıyor ve kayıtlı bir kişi ise kapıdaki röleyi çalıştırıp kapıyı açıyor.
    22:51Hackathon Deneyimi
    • Microsoft Türkiye'de düzenlenen bir hackathon'da, Ortadoğu ve Afrika'dan yaklaşık kırk kişi bir araya gelerek grup kararlı projeler geliştirmişlerdir.
    • Bir grup, havalimanında ve bankalarda kullanılan anketlerin şeffaflık sorununu ele alarak, müşterilerin mutluluk indeksini ölçen bir sistem geliştirmiştir.
    • Bu sistem, müşterilerin duygu değişimini ölçerek, erkek/kadın, yaş aralığı gibi bilgileri analiz ederek farklı reklamlar ve analizler yapabilmektedir.
    25:45Sistem Detayları ve Test
    • Geliştirilen sistem, GitHub üzerinden indirilebilir ve kullanıcılar kendi projelerini deneyebilirler.
    • Sistem, o anki fotoğrafı çekip servise göndererek sonuçları ekranda göstermektedir.
    • Microsoft Cognitive Services adresine giderek, computer vision, emotion gibi servislerin ayarlarını görebilir ve test edebilirsiniz.
    26:45Emotion Servisi Kullanımı
    • Emotion servisinde, gelen fotoğrafların duygularını tespit edebilir ve farklı duyguları görebilirsiniz.
    • Servis, JSON formatında sonuç döndürür ve bu JSON'ı pars ederek istediğiniz şekilde gösterebilirsiniz.
    • Bir test projesinde, videoya entegre edilerek her üç saniyede bir fotoğraf alınarak kişinin o anki duygu durumu tespit edilmiştir.
    30:16Yüz Tanıma Servisi ve Performans İyileştirmeleri
    • Yüz tanıma servisinin performansı internet bağlantısına ve request time'a bağlıdır.
    • Performansı artırmak için OpenSea kullanarak yüzü kesip ayrı göndermek veya renkli fotoğrafı siyah beyaz yapmak önerilmektedir.
    • Siyah beyaz fotoğraf kullanıldığında boyut düşüşü nedeniyle response alma süresi önemli ölçüde kısalmaktadır.
    31:27Servis Kullanım Sınırları ve Ücretlendirme
    • Aylık 30.000 sorgu tamamen ücretsizdir.
    • Video upload'larda da benzer sınırlar mevcuttur.
    • 30.000'i aşan kullanımlar için her bin kullanımda belli bir ücret alınmaktadır.
    31:55Magic Mirror Projesi
    • Magic Mirror, saydam bir ekrana bakarak size bilgiler veren bir projedir.
    • İş gününde aynaya baktığınızda "ofiste olmak zorunda değil misin?" gibi sorular sorabilir.
    • Windows IoT Core'lu bir versiyonu bulunmaktadır ve REST API olduğu için istediğiniz herhangi bir yere port edilebilir.
    33:32Raspberry Pi Üzerinde Uygulama
    • Proje tamamen Raspberry Pi üzerinde çalışmaktadır.
    • Raspberry Pi'ya internet çıkışı ve ekrana bağlantısı olan bir kamera veya USB bağlanabilir.
    • Kamera görüntüyü üç saniyede bir alıp servise göndererek çalışır ve istediğiniz herhangi bir yere konulabilir.
    34:27Farklı Kullanım Alanları
    • Okul girişinde benzer bir servis konulabilir.
    • Fotoğraf çektiğinizde topluluğun mutluluk oranını ölçen bir proje yapılabilir.
    • Bu tür projeler tamamen programatik olarak hayal gücünüzle sınırlı olarak geliştirilebilir.
    36:14Diğer API'lar ve Özellikleri
    • Computer vision tarafında fotoğraf içindeki objeleri ve detaylarını gösterebilen API'lar bulunmaktadır.
    • Fotoğraf içindeki kişinin yaşını, cinsiyetini ve içeriğin tehlikeli olup olmadığını gösterebilir.
    • Face API aracılığında kişinin yaşını, cinsiyetini, gözlük takıp takmadığını ve göz detaylarını gösterebilir.
    39:12Yüz Detaylarının Algılanması
    • JSON içerisinde kafanın boyutu, burnun başlangıç ve orta noktası gibi detaylar bulunmaktadır.
    • Kaşların başlangıç ve bitiş noktaları, bıyık ve sakal boyutu gibi detaylar algılanabilir.
    • Bu detaylar kullanılarak kişinin mimiklerini ve duygularını kontrol etmek mümkündür.
    40:28Ses Tanıma Teknolojisi
    • Konuşmacı, önceki videoda gösterilen teknolojinin şu anda uygulanabildiğini ve speaker verification yapabildiğini belirtiyor.
    • Amerikan başkanlarının sesleri kaydedilmiş ve veri tabanından seslerden kimin olduğunu tespit edebiliyor.
    • Kullanıcılar kendi seslerini de tanımlayabilir ve bu teknoloji sesle tanışma veya parola doğrulama gibi senaryolarda kullanılabilir.
    42:06Coca-Cola Örneği
    • Coca-Cola'nın Azure Machine Learning ile özel bir çalışması olduğunu ve bu servisin altyapısının Azure Machine Learning'de çalıştığını belirtiyor.
    • Coca-Cola örneğinde kişilerin yaşını, cinsiyetini ve mesleğini tespit edebildiği gibi kola şişesini de tanıyabildiği gösteriliyor.
    • Bu teknoloji, neural network'e göre markaların logosunu tanımlayarak yapay sinir ağları ile çalışıyor ve data science bilgisi olan biri tarafından hızlı çözümler çıkartabiliyor.
    43:52Microsoft Cognitive Services
    • Microsoft'un bu teknolojiyi 25-30 yıldır kullandığını ve veri setini kullandığını belirtiyor.
    • Bu servis sayesinde kullanıcılar tek bir kez gönderdikten sonra anında cevap alabiliyor, bu da akademik çalışmalarda büyük bir avantaj sağlıyor.
    • Konuşmacı, bir on dakika ara verip dönüşte örnek kodları değiştirmeyi ve çalıştırmayı göstereceğini söylüyor.
    45:20Proje Örneği
    • Microsoft'un derlenmiş bir proje olan Project Oxford Client Byber'i gösteriyor ve bu proje face API ve emotion API kullanıyor.
    • Microsoft Cognitive'e giriş yapıp ücretsiz servisleri indirebiliyor ve yeni servisler için key üretmek gerekiyor.
    • Face API kişinin yüzündeki yaşı ve diğer detayları, emotion API ise duyguları decode etmeye çalışıyor.
    47:53Kaynaklar ve Platformlar
    • Kaynaklar kısmında GitHub üzerinde bir yer olduğunu ve developerlar için SDK ve sample'lar bölümü olduğunu belirtiyor.
    • Zamarin projesi, JavaScript, PHP ve Unity gibi farklı platformlarda çalışan versiyonları da mevcut.
    • Microsoft Cognitive servisleri hızlı bir şekilde fark yaratabilecek ve güzel projeleri hızlı bir şekilde geliştirebilecek bir araç olarak sunuluyor.

    Yanıtı değerlendir

  • Yazeka sinir ağı makaleleri veya videoları özetliyor