آزمایشگاه Black Forest از Flux AI، بزرگترین مدل متن به تصویر متن باز تا به امروز با 12 میلیارد پارامتر، رونمایی کرد. Flux میتواند تصاویری را ارائه دهد که با نمونههای Midgerian رقابت میکنند و شاید حتی از هر مدل دیگری که تا به امروز در دسترس است، منبع باز یا بسته پیشی بگیرد.
طبق گزارش Decrypt، Flux AI در سه نسخه عرضه می شود: Flux Dev، که منبع باز است و در دسترس توسعه دهندگان است. Flux Schnell تا ده برابر سریعتر است و تحت مجوز Apache 2 منتشر شده است.
مقایسه هوش مصنوعی Flux با Midgerni
یکی از تفاوت های اصلی Flux و Midger این است که Flux منبع باز است و می تواند روی یک سیستم نسبتا خوب اجرا شود. Flux Dev و Flux Schnell اکنون برای دانلود در Hugging Face در دسترس هستند.
سازندگان Flux می گویند که در تست های بنچمارک، این مدل 12 میلیارد پارامتری از نظر کیفیت بصری، دقت درخواست های کاربر، تایپوگرافی و خروجی از مدل هایی مانند Dall-E 3 (HD)، Midgerni v6.0 و SD3 Ultra بهتر عمل می کند. تنوع البته کار می کند، همانطور که در تصویر بالا می بینید، اگرچه Flux در برخی جنبه ها مانند نورپردازی بهتر از Midgerni عمل می کند، Woman یک پای اضافی دارد.
با این حال، اگر می خواهید از مدل منبع باز Flux در سیستم خود استفاده کنید، به یک GPU قدرتمند نیاز دارید. حجم این مدل حدود 23 گیگابایت است; این بدان معناست که شما به 24 گیگابایت VRAM نیاز دارید. البته، می توانید از پلتفرم های آنلاین مانند NightCafe و Based Labs نیز برای ایجاد تصاویر از Flux استفاده کنید.
به طور کلی، نسخه Pro Flux می تواند رقیب خوبی برای Midjourney و سایر مدل های پولی باشد. با این حال، با توجه به سنگین بودن مدلهای جدیدتر مانند Auraflow یا Flux، افرادی که پردازندههای گرافیکی میان رده دارند، میتوانند نسخههای SD3 یا حتی سبکتر SDXL را انتخاب کنند.
منبع خبر: https://digiato.com/artificial-intelligence/flux-the-largest-open-source-text-to-image-model
تحریریه ABS NEWS | ای بی اس نیوز