Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, bir konuşmacının Stable Diffusion yapay zeka modelini kullanarak görsel oluşturma ve düzenleme tekniklerini adım adım gösterdiği kapsamlı bir eğitim içeriğidir.
- Video, üç ana bölümden oluşmaktadır: İlk bölümde Google Colab üzerinden Stable Diffusion modelinin eğitilme süreci (Google Drive bağlantısı, Hugging Face token oluşturma, model versiyonu seçimi, resim yükleme ve eğitim ayarları) anlatılmaktadır. İkinci bölümde "e-human knight" modeli oluşturma ve "ışık stüdyo ışığı", "hyper-detail" gibi parametrelerle görsel üretme teknikleri gösterilmektedir. Son bölümde ise görsel düzenleme teknikleri, pelerinli karakterlerin düzenleme ve farklı sampling metodları ile görsel varyasyonları üretme yöntemleri ele alınmaktadır.
- Eğitim, Stable Diffusion'ın Google Drive'dan indirilip kendi Stable Diffusion üzerinden test edilmesi, grid oluşturma ve CD numarası, seed gibi parametrelerin ayarlanması gibi pratik uygulamaları da içermektedir. Konuşmacı, bir sonraki videoda muhabbet kısmını halledeceğini belirtmektedir.
- 00:04Stable Diffusion Yapay Zeka Modeli Eğitimi Başlangıcı
- Stable Diffusion için yapay zeka modeli eğitimi için Google Colab sayfası kullanılıyor.
- Google Drive hesabı bağlantısı için gerekli adımlar atılıyor.
- İlk adım olarak model versiyonu seçiliyor ve Hugging Face tokenı isteniyor.
- 02:00Hugging Face Token Oluşturma
- Hugging Face hesabına giriş yapıp sağ üst taraftaki avatarına tıklanarak ayarlar bölümüne gidiliyor.
- Access tokens kısmından "new token" seçeneği ile token oluşturuluyor.
- Token oluşturulduktan sonra kopyalanıp Google Colab sayfasına yapıştırılıyor.
- 03:26Dreamboot Ayarları
- Dreamboot kısmında oturum ismi ve motor ismi belirleniyor.
- Motor ismi ünlü harf kullanmadan "turn aant test" olarak veriliyor.
- Model versiyonu 2.1 512 piksel olarak seçiliyor.
- 04:46Resim Yükleme
- Daha önce yüklenen resimlerin kaldırılması seçeneği bulunuyor.
- Resimlerin altlarının aynı olması gerekiyor ve hepsinin ismi oturum adını içermeli.
- Resimlerin boyutu 512x512 piksel olarak ayarlanıyor.
- 07:08Konsept Resimler ve Eğitim Başlangıcı
- Konsept resimler hücresinde aynı resimler yükleniyor.
- Eğitim aşamasında her görsel için minimum 100 adım verilmesi öneriliyor.
- Eğitim sırasında Google Drive hesabına kayıt olma seçeneği bulunuyor ancak bu işlem yaklaşık 2.5 GB kapasite tüketiyor.
- 11:22Eğitim Tamamlanması ve Test
- Eğitim tamamlandıktan sonra model dosyası Google Drive'a gönderiliyor.
- Model indirilerek kendi lokal Stable Diffusion üzerinde çalıştırılabilir.
- Test bloğunda model ismi girilerek Stable Diffusion'a erişim sağlanıyor.
- 13:52Stable Diffusion ile Model Eğitimi
- Stable Diffusion kullanılarak "style of warcraft" promptu ile oyun tarzı görseller oluşturulması isteniyor.
- Setpning stepsi 50'ye ve badge count'ı 10'a çekilerek modelin istenen paterni anlayıp anlamadığı test ediliyor.
- Üretilecek görsel sayısını arttırarak modelin istenen pateni anlayıp anlamadığını daha iyi anlamak isteniyor.
- 15:54Modelin Sonuçlarının İncelenmesi
- Stable Diffusion çalışmasını bitirdikten sonra Google Drive'da "sd" klasörüne gidilerek sonuçlar kontrol ediliyor.
- Oluşturulan görseller istenen tarzda ve paterni oluşturmuş, yapay zeka modeli istenen şeyi anlamış ve kendini eğitmiş.
- Görsellerde suratlar düzgün olmasa da, özellikle yan ve çapraz pozisyonlarında clash role olması istenen ön ve arka yüzleri oyunda kullanabilmek için güzel bir şekilde üretilmiş.
- 19:29Modelin İndirilmesi ve Test Edilmesi
- Google Drive'dan "face dreambot" klasörüne gidilerek oturumlar klasöründen model indiriliyor.
- İndirilen model 2,40 GB boyutunda ve kendi local Stable Diffusion üzerinden test edilecek.
- Modelin adı "e-human knight" olarak belirlenmiş ve benzer bir prompt girilerek test edilecek.
- 22:07Stable Diffusion Scriptleri ve Özellikleri
- Olivia Saricas YouTube kanalı Stable Diffusion hakkında bilgi edinmek için öneriliyor.
- Prompt matrix özelliği ile promptlar sırayla çalıştırılabilir veya textbox sürüklenerek liste şeklinde girilebilir.
- Grid özelliği ile görsellerin iç içe bulunduğu tablo oluşturulabilir ve farklı özellikler eklenebilir.
- 25:01Görsel Oluşturma Metodları
- Stable Diffusion'da birçok farklı görsel oluşturma algoritması ve metod mevcut.
- CFG scale değeri arttırılarak tek bir promp üzerinde varyasyonlar oluşturulabilir.
- Farklı sempling metodları (Euler A, LMS, DPM++) kullanılarak aynı prompt için farklı görseller oluşturulabilir.
- 27:22Modelin Performansı
- Model iyi bir şekilde eğitilmiş ve dörtte üç oranında istenen paterni anlıyor.
- İki sempling metodu da gayet iyi bir şekilde çalışıyor.
- Görsellerde suratlar tam çizilmemiş olsa da, aynı karakterin farklı açılardan versiyonu verilmiş.
- 29:13Stable Diffusion Çıktıları
- Resimde karakterin ön ve arka yüzünde pelerin var, ancak surata dikkat edilmezse çıktı kullanılabilir ve güzel.
- Karakterin pelerini Photoshop'ta basit bir şekilde halledilebilir.
- Çıktıların isimlerinde "front" mevcut ve bir numara bulunuyor, bu numara CD numarası olabilir.
- 30:50Stable Diffusion Kullanımı
- Stable Diffusion üzerinden görsel kopyalanabilir veya yeni bir ayar oluşturulabilir.
- Stable Diffusion klasörünün output kısmından text image kısmına görsel seçilebilir.
- Görsel ile ilgili parametreler kopyalanıp text image kısmına yapıştırılarak mavi butona basıldığında tüm ayarlar oluşturulmuş olur.
- 32:33Video Kapanışı
- Video ufak bir ara verilecek ve muhabbet kısmı yarın halledilecek.
- İzleyicilere iyi geceler deniliyor ve yarın devam edileceği belirtiliyor.