همزمان با ارائه هوش مصنوعی خود در پلتفرم های رسانه های اجتماعی اختصاصی مانند اینستاگرام، واتس اپ و فیس بوک، متا مدل زبان Llama 3 را به ارائه دهندگان ابری مانند آمازون معرفی کرده است. این شرکت ادعا می کند که مدل زبان فوق می تواند عملکرد بهتری را در مقایسه با رقبا از خود نشان دهد و اغلب سیستم های هوش مصنوعی موجود از جمله جمینا گوگل را شکست می دهد.
Llama Language Model 3 چه ویژگی هایی دارد؟
مدل زبان Llama 3 در حال حاضر در دو نسخه یکی با 8 میلیارد و دیگری با 70 میلیارد پارامتر موجود است. هر چه این مقدار بیشتر باشد، مدل پیچیده تر و تمرین ها قابل درک تر است. اگرچه مدل فعلی فقط قادر به ارائه پاسخ های متنی است. اما متا می گوید که نسخه جدید نسبت به نسل قبل پیشرفت های چشمگیری داشته است. به عنوان مثال، میزان تنوع در پاسخ ها در حال حاضر بیشتر از گذشته است و به ندرت در مورد سؤالات خطا یا عدم پاسخ رخ می دهد. روش درک دستورات و نوشتن کدها نیز بهبود یافته است.
در یک پست رسمی، متا ادعا کرد که هر دو نسخه از مدل زبان Llama 3 در برخی از معیارها عملکرد بهتری از Google Gemma، Gemina، Mistral (نسخه 7 میلیارد پارامتری) و Cloud 3 دارند. به عنوان مثال، نسخه 8 میلیارد پارامتری Llama 3 از بنچمارک MMLU که اطلاعات کلی را بررسی می کند، توانست رتبه بهتری نسبت به Gemma و Mistral با پارامتر 7 میلیاردی کسب کند. نسخه 70 میلیارد پارامتری بالاتر از نسخه Google Gemina Pro 1.5 با کمی تفاوت است. شایان ذکر است که متا در مقایسه های خود مستقیماً به هوش مصنوعی پرچمدار OpenAI یعنی GPT-4 اشاره نکرده است.
لازم به ذکر است که اگرچه محک زدن مدل های زبانی می تواند راهی برای مقایسه عملکرد آنها باشد، اما گاهی اوقات منجر به نتایج گمراه کننده می شود. برای مثال، اگر دادههای مورد استفاده در معیار در دادههای آموزشی مدل زبان باشد، نمیتوان به نتایج بیش از حد اعتماد کرد. زیرا هوش مصنوعی در گذشته با سوالات مشابهی روبرو بوده و پاسخ آنها را می داند.
با این حال، متا همچنان ادعا می کند که حتی ارزیابی های انسانی نیز Llama 3 را بالاتر از GPT-3.5 قرار داده است. در طول این ارزیابیها، دادههای جدیدی برای آزمایش عملکرد مدل زبان برای شبیهسازی شرایط مشابه عملکرد دنیای واقعی تولید میشود. این ارزیابیها شامل 1800 مورد بود که 12 موضوع اصلی را پوشش میداد، از جمله درخواست راهنمایی، طبقهبندی، پاسخ به سؤالات، کدگذاری، نوشتن متن خلاق، استخراج دادهها، استدلال، بازنویسی و خلاصهنویسی.
انتظار میرود متا یک مدل زبان Llama 3 را در مقادیر بیشتر ارائه کند که قادر به درک دستورات طولانیتر و پردازش دادههای بیشتر خواهد بود. ویژگی ها و عملکردهای جدیدی مانند ایجاد تصویر یا تبدیل فایل صوتی به متن از جمله ویژگی هایی است که در نسخه 400 میلیارد پارامتری هوش مصنوعی فیس بوک در دسترس خواهد بود. البته هیچ پیش نمایش یا مقایسه ای از مدل های بزرگتر با رقبای اصلی خود مانند GPT-4 وجود ندارد و باید منتظر اطلاعات جدیدی باشیم که متا منتشر خواهد کرد.
منبع خبر: https://digiato.com/artificial-intelligence/meta-language-model-llama-3-benchmark
تحریریه ABS NEWS | ای بی اس نیوز