• Buradasın

    Flux Lora ve Stable Diffusion Model Eğitimi Rehberi

    youtube.com/watch?v=nySGu12Y05k

    Yapay zekadan makale özeti

    • Bu video, bir konuşmacının Flux Lora ve Stable Diffusion modelleriyle ilgili kapsamlı bir eğitim içeriği sunmaktadır.
    • Video, Flux Lora modelinin eğitilmesi için Kocha GUI arayüzünün kurulumundan başlayarak, Stable Diffusion model eğitimi için gerekli yazılımların (Python 3.11, fmp, c++) kurulumunu, en iyi yapılandırma dosyalarının yüklenmesini, GPU ayarlarının yapılmasını ve eğitim verilerinin hazırlanmasını adım adım göstermektedir. İçerik, hem yerel makinede hem de bulut tabanlı hizmetlerde (Mad Compute) kullanılabilecek bir rehber niteliğindedir.
    • Videoda ayrıca caption düzenleme, eğitim veri seti hazırlama, epok sayısının ayarlanması, RAM kullanımının optimize edilmesi, checkpointlerin kaydedilmesi ve farklı GPU'larda (Cloud GPU, RX GPU) eğitim süreci hakkında detaylı bilgiler verilmektedir. SDXL ve SD 1.5 modellerinin eğitimi, regularizasyon kullanımı ve Lora modellerinin nasıl çıkarılacağı gibi ileri seviye konular da ele alınmaktadır.
    Flux Lora Training Tutorial Introduction
    • The video guides the process of training and Lora on the latest state-of-the-art text to image generative AI model Flux.
    • The speaker has conducted 7-8 training sessions and developed a range of unique training configurations for GPU with different WRAM usage.
    • The tutorial uses a GUI user-friendly interface built on ed training scripts, allowing users to install, set up, and start training with only mouse clicks.
    01:38Tutorial Structure and Additional Resources
    • The tutorial is organized into chapters and includes manual read-in English captions.
    • It demonstrates how to use generated Lora models with Swarm UI and grid generation to identify the best training checkpoint.
    • The video ends with a demonstration of training Stable Diffusion, Point, and STXL models using the latest Kocha GUI interface.
    03:04Kocha GUI Installation
    • Kocha GUI is a developed by the Bulano Maltese that allows easy use of Kocha SS scripts.
    • The installation process involves downloading and extracting a zip file, which contains updated files.
    • Windows installation requires Python 3.11, fmpd 11.1, and C++ to work with all open-source AI applications like Stable Diffusion, WebUI, Forge WebUI, Swarm UI, ConfUI, Pearl Face Fusion, and others.
    06:22Installation Steps and Acceleration
    • The installation asks for options and selects the appropriate branch (flux branch) for installation.
    • After installation, the accelerator settings are configured to use all GPU resources and BF16.
    • After installation, a file is run to update cache, fix Flux, upgrade libraries, and update scripts to the latest version.
    08:32Torch Version and Kocha GUI Usage
    • The tutorial uses Torch 2.4.0, which works slowly on Windows compared to Linux systems, but Torch 2.4.1 fixes this issue.
    • Torch 2.5 version with significant speed improvements is currently in development, but it may be broken or poorly tested.
    • To start Kocha GUI, you can enter the Kocha SS folder or use the starter file "windows start koa ss" to automatically start and open the browser interface.
    10:19Lora Training and Research
    • The tutorial focuses on Lora training, which is optimization for a specific part of the model, requiring different hardware requirements and quality.
    • The speaker has conducted a research history with 60 farklı training configurations, and the post contains all the test results and comparisons.
    • The speaker is currently running training on RTX and HAA GPU on Mad Compute, and testing new hyper parameters for Clip Large Text and Coder training.
    12:12Configuration Seçimi
    • En iyi çalışma akışı ve yapılandırma için "best configs" klasöründeki JSON dosyalarını kullanmanız gerekiyor.
    • Her GPU için farklı yapılandırma dosyaları bulunuyor ve yavaş ve hızlı versiyonlar mevcut.
    • Rank 1 ve Rank 6 arasında çok fazla fark yok, ancak Rank 6'dan sonra kalite düşüyor çünkü eğitim çözünürlüğü ve LoRa rankı azalıyor.
    14:29Zaman Adımları ve Renkler
    • "Better colors" seçeneği zaman adımlarını kaydırma ve örnekleme kullanıyor ve bu renk kalitesini artırıyor.
    • Zaman adımlarını kaydırma, daha iyi renkler ve ortamlar oluşturuyor.
    • İki farklı yapılandırma seçeneği var: temel yapılandırma ve "better colors" seçeneği.
    15:46Model Seçimi
    • Cloud tutorial için maset hesaplama ve rampd soft unit kullanılacak.
    • Model linkleri belirtilen postta bulunuyor ve bir tıklayıcı ile indirilebiliyor.
    • Flux dev versiyonu 23.00 GB boyutunda ve FP desteği sunuyor.
    16:33Eğitim Görüntüleri ve Veri Hazırlığı
    • Eğitim görüntülerinin doğru hazırlanması çok önemli.
    • Otomatik kırpma ve yeniden boyutlandırma için scriptler kullanılıyor.
    • Eğitim görüntülerinin 1020x1020 piksel olarak ayarlanması gerekiyor.
    18:13Tekrar ve Düzenlileştirme
    • Tekrar değeri 1 olarak ayarlanmalı çünkü tek bir kavram eğitiliyor.
    • Düzenlileştirme kullanıldığında karışık yüzler gibi sonuçlar elde ediliyor.
    • Tekrar değeri, dengeli bir veri seti oluşturmak için kullanılıyor.
    19:47Eğitim Ayarları
    • Stable Diffusion 1.5 veya Stable Diffusion XL SD XL kullanılabilir.
    • Instance prompt olarak "oh wx" kullanılabilir, ancak sınıf promptu daha iyi sonuçlar veriyor.
    • Eğitim için "prepare training data" seçeneği kullanılarak veri seti oluşturuluyor.
    22:41Kapatma ve Kapatma Uygulaması
    • Kapatma uygulaması Joy Caption kullanılarak otomatik olarak yapılabilir.
    • Joy Caption, çoklu GPU ve çoklu batch boyutu desteği sunuyor.
    • Kapatma uygulaması, kavramın daha iyi anlaşılmasını sağlayabilir, ancak genel kaliteyi çok etkilemiyor.
    25:55Python Kodu ile Caption Düzenleme
    • Python kodu ile caption düzenleme uygulaması gösteriliyor, bu uygulama herhangi bir klasör yolunu otomatik olarak tarayabilir.
    • Uygulama, captionları manuel olarak düzenleyebilir, filtreleyebilir ve "işlenmiş" veya "işlenmemiş" olarak sınıflandırabilir.
    • Batch edit seçenekleri ile klasördeki tüm captionları değiştirebilir, belirli kelimeleri arayabilir ve tüm captionları güncelleyebilirsiniz.
    27:37Eğitim Verisi Hazırlama
    • Eğitim verisi hazırlamak için "Hazırla Eğitim Verisi" seçeneğine tıklayıp, "Bilgiyi Kopyala" seçeneğini kullanarak klasör yolunu doğru şekilde ayarlamanız gerekiyor.
    • Birden fazla kavram, kişi veya öğe içeren bir klasör kullanabilirsiniz ve her kavram için farklı tekrar sayıları belirleyebilirsiniz.
    • Model yolunu, model çıktısını ve diğer gerekli ayarları belirleyebilirsiniz.
    29:22Eğitim Parametreleri
    • Eğitim için kaç epok (döngü) kullanılacağını belirlemeniz gerekiyor, bir epok tüm görüntülerin bir kez eğitildiği anlamına geliyor.
    • Düzenli görüntü kullanıyorsanız farklı bir strateji kullanmanız gerekiyor, düzenli görüntü kullanmıyorsanız farklı bir strateji kullanmanız gerekiyor.
    • Eğitim verisi kalitesi çok önemlidir, farklı pozlar, mesafeler, ifadeler, bulutlar ve arka planlar içeren bir veri seti daha iyi sonuçlar verir.
    32:02Eğitim Ayarları ve Kontrol
    • Caption dosya uzantısı olarak ".jpg" veya ".png" seçebilirsiniz, "Caption" uzantısı en yaygın olanıdır.
    • Network rank ayarını "Safe Tensor File" olarak belirlemeniz gerekiyor ve Clip Large modelini kullanabilirsiniz.
    • Eğitim sırasında RAM kullanımını kontrol etmek önemlidir, sınırlı RAM kullanıyorsanız başlangıç ayarlarını düzenleyebilir veya NVIDIA Top gibi araçlar kullanabilirsiniz.
    35:28Eğitim Süreci ve Performans
    • Eğitim başladığında CMD penceresinde ilerleme mesajları görüntülenir, bazı hatalar olabilir ancak bunlar genellikle önemli değildir.
    • Eğitim süresi, toplam adım sayısı, batch size, gradient accumulation steps ve epok sayısı ile hesaplanır.
    • Eğitim sırasında GPU paylaşımlı bellek kullanımı kontrol edilmelidir, aksi takdirde eğitim hızı 20-30 kat düşebilir.
    39:50Virtual RAM Ayarları
    • GPU memory morrover ve düşük RAM durumlarında problem yaşanabilir, bu durumda virtual RAM ayarlanabilir.
    • Virtual RAM, sınırlı RAM'de ilk yükleme sırasında sorun yaşamamak için artırılabilir.
    • Virtual RAM ayarlarını yapmak için PC'ye tıklayıp özellikler, gelişmiş sistem ayarları, performans ve ileri seçeneklerine gidilmelidir.
    41:14Flux Modeli ve Çıktı Ayarları
    • Flux modeli çok büyük olduğundan (12 William parametre) checkpoint dosyaları 2.4 GB büyüklüğünde olabilir.
    • Model float formatında maksimum hassasiyetle kaydedilir, dosya boyutunu azaltmak için FP6 modeli kullanılabilir.
    • Flux modeli ile oluşturulan modeller, Swarm UI, Forge Web UI veya Forge UI ile kullanılabilir.
    43:01Swarm UI ile Model Kullanımı
    • Swarm UI, Flux modeli için çok iyi bir arayüz sunar ve Forge UI'nin arka planını kullanır.
    • Model dosyalarını Swarm UI'nin modeller klasörüne taşımak gerekir.
    • Swarm UI'yi güncellemek önemlidir ve performans için RTX Expo serisi GPU'ya "extra argument -fast" eklenebilir.
    45:14Flux Modeli ile Görüntü Oluşturma
    • Flux modeli için ölçek 1 ve negatif prompt kullanılabilir, ancak Flux bu özelliği desteklememektedir.
    • Çözünürlük ve sampler ayarları GPU'ya göre ayarlanmalıdır.
    • Flux 1 Vision FP6 modeli kullanılabilir, ayrıca FP6 model de çalışabilir.
    46:26Model Dosyalarını Swarm'a Yükleme
    • Model dosyaları Swarm'a yüklenirken, Stable Diffusion klasörüne kopyalanmalıdır.
    • Swarm'da "refresh models" seçeneği ile yeni modeller eklenebilir.
    • Flux 1 Development modeli 6-bit presession ile kullanılabilir.
    47:30Görüntü Oluşturma Süreci
    • Görüntü oluşturma sırasında manuel cast seçeneği kullanılabilir.
    • Flux modeli çok optimize olduğu için düşük RAM'de (8 GB) çalışabilir.
    • Çoklu görüntü oluşturmak için ikinci GPU kullanılabilir.
    49:44Lora Kullanımı ve Görüntü İyileştirme
    • Lora'lar Swarm'da "Lora refresh" seçeneği ile eklenebilir.
    • Lora'lar görüntü kalitesini iyileştirmek için kullanılabilir.
    • Flux modelinin iç metin kodlayıcısı sayesinde iglass'lar ve yüz ayrımı yapılabilir.
    52:17Model Test Etme
    • En iyi checkpoint'i bulmak için grid generator kullanılabilir.
    • Grid generator ile farklı epok'lar ve prompt'lar test edilebilir.
    • Test edilen model, sent ve yüz kalitesini koruyarak mükemmel sonuçlar verebilir.
    55:34Mad Compute ile Swarm Kullanımı
    • Mad Compute'da swarm başlatmak için terminalde belirli bir komut çalıştırılır ve Cloudflare üzerinden erişim sağlanır.
    • Swarm UI'da araçlar ve grid generator kullanılarak farklı checkpointler karşılaştırılabilir, genellikle 150 epok iyi sonuçlar verir.
    • Mad Compute, GPU ile ultra hızlı görüntü üretimi sağlar ve birçok eğitim için tek GPU birimi kullanmak yerine cloud desteği sunar.
    57:40Wildcard ve Yeni Proms
    • Wildcard özelliği ile yeni proms kullanılarak 9999 görüntü oluşturulmuştur.
    • Wildcard için tüm bilgiler ve talimatlar dosyada bulunmaktadır.
    • Mad Compute ve Ramp kurulum talimatları da dosyada mevcuttur.
    58:29SDXL ve SD1.5 Eğitimi
    • Hugging Face'da SDXL ve SD1.5 eğitimi için özel bir notebook ve tutorial bulunmaktadır.
    • Dreambo Top view'da SDXL eğitimi için yapılandırma indirilir ve Dreambo SD seçilir.
    • Eğitim için regularizasyonlar ve tekrar sayısı ayarlanır, örneğin 1000 tekrar ve 1 epok kullanılabilir.
    59:55Eğitim Parametreleri ve Kaydetme
    • Eğitim için image klasör adı, pre-trained model yolu ve regularizasyonlar belirlenir.
    • Eğitim için 1000 epok ve 1000 epok aralıklarla checkpoint kaydedilir.
    • SDXL eğitimi için 8 GB, SD1.5 eğitimi için daha fazla alan gerekebilir.
    1:04:12Lora Çıkarma ve Kullanımı
    • Dreambo'da utilities menüsünden Lora seçeneği ile Lora çıkarılabilir.
    • Lora çıkarma için SDXL veya SD1.5 seçilebilir, SDXL seçilmezse SD1.5 çıkarılır.
    • Çıkarılan Lora, base model ile birleştirilerek kullanılabilir.
    1:05:40İletişim ve Kaynaklar
    • Discord kanalında 8000'den fazla üye ve 1000'den fazla online üye bulunmaktadır.
    • Patreon kanalında özel postlar ve index bulunmaktadır.
    • GitHub'da Stable Diffusion Generative AI repository bulunmaktadır ve desteklenmektedir.

    Yanıtı değerlendir

  • Yazeka sinir ağı makaleleri veya videoları özetliyor