هوش مصنوعی برای جریان متن به تصویر معرفی شده است. رقیب جدی Midjerney

آزاد کبیریمرداد ۲۰, ۱۴۰۳

45 خواندن این مطلب 1 دقیقه زمان میبرد

هوش مصنوعی برای جریان متن به تصویر معرفی شده است. رقیب جدی Midjerney

آزمایشگاه Black Forest از Flux AI، بزرگترین مدل متن به تصویر متن باز تا به امروز با 12 میلیارد پارامتر، رونمایی کرد. Flux می‌تواند تصاویری را ارائه دهد که با نمونه‌های Midgerian رقابت می‌کنند و شاید حتی از هر مدل دیگری که تا به امروز در دسترس است، منبع باز یا بسته پیشی بگیرد.

طبق گزارش Decrypt، Flux AI در سه نسخه عرضه می شود: Flux Dev، که منبع باز است و در دسترس توسعه دهندگان است. Flux Schnell تا ده برابر سریعتر است و تحت مجوز Apache 2 منتشر شده است.

فهرست این محتوا پنهان

1 مقایسه هوش مصنوعی Flux با Midgerni
2 نوشته های مرتبط:

مقایسه هوش مصنوعی Flux با Midgerni

یکی از تفاوت های اصلی Flux و Midger این است که Flux منبع باز است و می تواند روی یک سیستم نسبتا خوب اجرا شود. Flux Dev و Flux Schnell اکنون برای دانلود در Hugging Face در دسترس هستند.

سازندگان Flux می گویند که در تست های بنچمارک، این مدل 12 میلیارد پارامتری از نظر کیفیت بصری، دقت درخواست های کاربر، تایپوگرافی و خروجی از مدل هایی مانند Dall-E 3 (HD)، Midgerni v6.0 و SD3 Ultra بهتر عمل می کند. تنوع البته کار می کند، همانطور که در تصویر بالا می بینید، اگرچه Flux در برخی جنبه ها مانند نورپردازی بهتر از Midgerni عمل می کند، Woman یک پای اضافی دارد.

با این حال، اگر می خواهید از مدل منبع باز Flux در سیستم خود استفاده کنید، به یک GPU قدرتمند نیاز دارید. حجم این مدل حدود 23 گیگابایت است; این بدان معناست که شما به 24 گیگابایت VRAM نیاز دارید. البته، می توانید از پلتفرم های آنلاین مانند NightCafe و Based Labs نیز برای ایجاد تصاویر از Flux استفاده کنید.

به طور کلی، نسخه Pro Flux می تواند رقیب خوبی برای Midjourney و سایر مدل های پولی باشد. با این حال، با توجه به سنگین بودن مدل‌های جدیدتر مانند Auraflow یا Flux، افرادی که پردازنده‌های گرافیکی میان رده دارند، می‌توانند نسخه‌های SD3 یا حتی سبک‌تر SDXL را انتخاب کنند.

منبع خبر: https://digiato.com/artificial-intelligence/flux-the-largest-open-source-text-to-image-model