تکنولوژی و فناوری

هوش مصنوعی برای جریان متن به تصویر معرفی شده است. رقیب جدی Midjerney

آزمایشگاه Black Forest از Flux AI، بزرگترین مدل متن به تصویر متن باز تا به امروز با 12 میلیارد پارامتر، رونمایی کرد. Flux می‌تواند تصاویری را ارائه دهد که با نمونه‌های Midgerian رقابت می‌کنند و شاید حتی از هر مدل دیگری که تا به امروز در دسترس است، منبع باز یا بسته پیشی بگیرد.

طبق گزارش Decrypt، Flux AI در سه نسخه عرضه می شود: Flux Dev، که منبع باز است و در دسترس توسعه دهندگان است. Flux Schnell تا ده برابر سریعتر است و تحت مجوز Apache 2 منتشر شده است.

مقایسه هوش مصنوعی Flux با Midgerni

یکی از تفاوت های اصلی Flux و Midger این است که Flux منبع باز است و می تواند روی یک سیستم نسبتا خوب اجرا شود. Flux Dev و Flux Schnell اکنون برای دانلود در Hugging Face در دسترس هستند.

خروجی جریان را با Midgerni مقایسه کنید

سازندگان Flux می گویند که در تست های بنچمارک، این مدل 12 میلیارد پارامتری از نظر کیفیت بصری، دقت درخواست های کاربر، تایپوگرافی و خروجی از مدل هایی مانند Dall-E 3 (HD)، Midgerni v6.0 و SD3 Ultra بهتر عمل می کند. تنوع البته کار می کند، همانطور که در تصویر بالا می بینید، اگرچه Flux در برخی جنبه ها مانند نورپردازی بهتر از Midgerni عمل می کند، Woman یک پای اضافی دارد.

با این حال، اگر می خواهید از مدل منبع باز Flux در سیستم خود استفاده کنید، به یک GPU قدرتمند نیاز دارید. حجم این مدل حدود 23 گیگابایت است; این بدان معناست که شما به 24 گیگابایت VRAM نیاز دارید. البته، می توانید از پلتفرم های آنلاین مانند NightCafe و Based Labs نیز برای ایجاد تصاویر از Flux استفاده کنید.

به طور کلی، نسخه Pro Flux می تواند رقیب خوبی برای Midjourney و سایر مدل های پولی باشد. با این حال، با توجه به سنگین بودن مدل‌های جدیدتر مانند Auraflow یا Flux، افرادی که پردازنده‌های گرافیکی میان رده دارند، می‌توانند نسخه‌های SD3 یا حتی سبک‌تر SDXL را انتخاب کنند.

منبع خبر: https://digiato.com/artificial-intelligence/flux-the-largest-open-source-text-to-image-model

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا