مدل زبان Llama 3 بهتر از اکثر رقبا عمل می کند

امیر امام جمعهفروردین ۳۱, ۱۴۰۳

62 خواندن این مطلب 2 دقیقه زمان میبرد

مدل زبان Llama 3 بهتر از اکثر رقبا عمل می کند

همزمان با ارائه هوش مصنوعی خود در پلتفرم های رسانه های اجتماعی اختصاصی مانند اینستاگرام، واتس اپ و فیس بوک، متا مدل زبان Llama 3 را به ارائه دهندگان ابری مانند آمازون معرفی کرده است. این شرکت ادعا می کند که مدل زبان فوق می تواند عملکرد بهتری را در مقایسه با رقبا از خود نشان دهد و اغلب سیستم های هوش مصنوعی موجود از جمله جمینا گوگل را شکست می دهد.

فهرست این محتوا پنهان

1 Llama Language Model 3 چه ویژگی هایی دارد؟
2 نوشته های مرتبط:

Llama Language Model 3 چه ویژگی هایی دارد؟

مدل زبان Llama 3 در حال حاضر در دو نسخه یکی با 8 میلیارد و دیگری با 70 میلیارد پارامتر موجود است. هر چه این مقدار بیشتر باشد، مدل پیچیده تر و تمرین ها قابل درک تر است. اگرچه مدل فعلی فقط قادر به ارائه پاسخ های متنی است. اما متا می گوید که نسخه جدید نسبت به نسل قبل پیشرفت های چشمگیری داشته است. به عنوان مثال، میزان تنوع در پاسخ ها در حال حاضر بیشتر از گذشته است و به ندرت در مورد سؤالات خطا یا عدم پاسخ رخ می دهد. روش درک دستورات و نوشتن کدها نیز بهبود یافته است.

در یک پست رسمی، متا ادعا کرد که هر دو نسخه از مدل زبان Llama 3 در برخی از معیارها عملکرد بهتری از Google Gemma، Gemina، Mistral (نسخه 7 میلیارد پارامتری) و Cloud 3 دارند. به عنوان مثال، نسخه 8 میلیارد پارامتری Llama 3 از بنچمارک MMLU که اطلاعات کلی را بررسی می کند، توانست رتبه بهتری نسبت به Gemma و Mistral با پارامتر 7 میلیاردی کسب کند. نسخه 70 میلیارد پارامتری بالاتر از نسخه Google Gemina Pro 1.5 با کمی تفاوت است. شایان ذکر است که متا در مقایسه های خود مستقیماً به هوش مصنوعی پرچمدار OpenAI یعنی GPT-4 اشاره نکرده است.

لازم به ذکر است که اگرچه محک زدن مدل های زبانی می تواند راهی برای مقایسه عملکرد آنها باشد، اما گاهی اوقات منجر به نتایج گمراه کننده می شود. برای مثال، اگر داده‌های مورد استفاده در معیار در داده‌های آموزشی مدل زبان باشد، نمی‌توان به نتایج بیش از حد اعتماد کرد. زیرا هوش مصنوعی در گذشته با سوالات مشابهی روبرو بوده و پاسخ آنها را می داند.

با این حال، متا همچنان ادعا می کند که حتی ارزیابی های انسانی نیز Llama 3 را بالاتر از GPT-3.5 قرار داده است. در طول این ارزیابی‌ها، داده‌های جدیدی برای آزمایش عملکرد مدل زبان برای شبیه‌سازی شرایط مشابه عملکرد دنیای واقعی تولید می‌شود. این ارزیابی‌ها شامل 1800 مورد بود که 12 موضوع اصلی را پوشش می‌داد، از جمله درخواست راهنمایی، طبقه‌بندی، پاسخ به سؤالات، کدگذاری، نوشتن متن خلاق، استخراج داده‌ها، استدلال، بازنویسی و خلاصه‌نویسی.

انتظار می‌رود متا یک مدل زبان Llama 3 را در مقادیر بیشتر ارائه کند که قادر به درک دستورات طولانی‌تر و پردازش داده‌های بیشتر خواهد بود. ویژگی ها و عملکردهای جدیدی مانند ایجاد تصویر یا تبدیل فایل صوتی به متن از جمله ویژگی هایی است که در نسخه 400 میلیارد پارامتری هوش مصنوعی فیس بوک در دسترس خواهد بود. البته هیچ پیش نمایش یا مقایسه ای از مدل های بزرگتر با رقبای اصلی خود مانند GPT-4 وجود ندارد و باید منتظر اطلاعات جدیدی باشیم که متا منتشر خواهد کرد.

منبع خبر: https://digiato.com/artificial-intelligence/meta-language-model-llama-3-benchmark