هوش مصنوعی Deep Seek استارت آپ چینی با توجه به پیشرفت هایی که در این زمینه داشته در حال رشد است هوش مصنوعی دنیا متوجه آن شده است. به گفته بسیاری از کارشناسان، این شرکت چینی یکی از قدرتمندترین مدل های هوش مصنوعی است رایگان با نام دیپسیک منتشر شد که در ادامه این مقاله به معرفی آن می پردازیم.
هوش مصنوعی DeepSeek چیست؟
آخرین نسخه از مدل هوش مصنوعی این شرکت Deep Sec V3 در اواخر سال 2024 منتشر شد و توسعه دهندگان می توانند آن را دانلود و در برنامه های خود استفاده کنند. همانطور که گفته شد، Dipsic Models کاملا متن باز است. توسعه دهندگان می توانند آنها را برای استفاده در برنامه ها و پروژه های خود دانلود و تغییر دهند.
این مدل هوش مصنوعی از معماری نوآورانه ای استفاده می کند که در ادامه به آن خواهیم پرداخت. این معماری آن را از بسیاری از مدلهای هوش مصنوعی قدرتمند موجود از شرکتهایی مانند Meta و OpenAI قدرتمندتر میکند، جایی که برای استفاده از ویژگیهای پیشرفته آن باید هزینه پرداخت کنید.
قابلیت های هوش مصنوعی DeepSeek V3 و برتری آن نسبت به رقبا
DeepSik می گوید مدل پرچمدار آن می تواند طیف گسترده ای از وظایف و ماموریت ها را انجام دهد متن، مانند کد نویسی، ترجمه و مقاله بنویسید و ایمیل برای این کار همانطور که در آموزش انجام شد از پردازنده های گرافیکی Nvidia H800 اختصاص داده شده به چین استفاده شد.
DeepSeek از طریق آزمایش های خود اعلام کرده است که DeepSeek V3 هم از مدل های دانلودی، رایگان و هم از مدل های غیر رایگان که فقط از طریق API در دسترس هستند، بهتر عمل می کند. به گفته این شرکت و مطابق تصویر زیر، مدل هوش مصنوعی آن از سایر مدلها مانند Llama 3.1 متا، GPT-4o از OpenAI و Qwen 2.5 72B از شرکت چینی Alibaba بهتر عمل کرده است.
DeepSeek ادعا می کند که DeepSeek V3 حاوی یک مجموعه داده است 14 تریلیون و 800 میلیارد رمز آموزش دیده برای درک بهتر این مشکل، باید گفت که هر میلیون نماد معادل حدود 750 هزار کلمه است. DeepSeek V3 نیز از نظر اندازه و قدرت بسیار بزرگ است 671 میلیارد پارامتر پشتیبانی (پارامترها متغیرهای داخلی هستند که مدلها از آنها برای پیشبینی یا تصمیمگیری استفاده میکنند). در این شرایط، هوش مصنوعی این شرکت تقریباً 1.6 برابر است لاما 3.1 405 ب متا بزرگترین است که از 405 میلیارد پارامتر پشتیبانی می کند.
نکته جالب دیگر این است که چینی ها فقط مدل پرچمدار خود را می فروشند دو ماه و با هزینه 5.58 میلیون دلار آموزش داده شد; بنابراین، این شرکت در مقایسه با شرکتهای بزرگی مانند Meta و OpenAI، زمان و منابع کمتری را صرف مدل هوش مصنوعی خود کرده است.
معماری نوآورانه DeepSeek V3
DeepSick برای توسعه مدل خود از معماری بهینه شده (به نام ترکیبی از متخصصان یا وزارت آموزش و پرورش) که نیاز آن را به قدرت محاسباتی گسترده و سخت افزار قدرتمند کاهش می دهد. این معماری را به عنوان یک تیم (متخصص) از سیستم های تخصصی هوش مصنوعی در نظر بگیرید، که در آن هر به اصطلاح “متخصص” شبکه عصبی خود را دارد و برای انجام وظایف مرتبط با آن فعال می شود.
در واقع این معماری پیچیدگی وظایف را پیش از اجرای آن ها پیش بینی می کند و بر اساس منابعی که در اختیار دارد (متخصصان)، مسیر لازم برای دستیابی به آن ها را مشخص می کند. همچنین، تنها مرتبطترین سیستمهای هوش مصنوعی برای هر کار فعال میشوند که محاسبات اضافی را کاهش میدهد و عملکرد مدل را تسریع میکند.
تست هوش مصنوعی Deepsec
برای آزمایش نحوه عملکرد DeepSeek AI، نمونه هایی را در زیر ذکر کرده ایم. در مورد اول، از مدل خواسته میشود که شرح مفصلی از یک شخصیت خیالی (ملکه در برابر امپراتوری شیطانی) بنویسد. سپس DeepSeek V3 نام، آدرس، سن و ظاهر این شخصیت خیالی را مشخص کرد و نوشت:
به منظور آزمایش مهارت های کدنویسی این مدل، مطابق مثال زیر یک کد جاوا اسکریپت معیوب به آن داده شد. همانطور که در تصویر زیر مشاهده می کنید، دیپسیک بلافاصله متوجه مشکل شده و ضمن توضیح آن، کد اصلاح شده را برای کاربر ارسال می کند:
در مثال زیر، ظرفیت تولید DeepSeek V3 در حال آزمایش است. در آن، کاربر از هوش مصنوعی میخواهد تا دستور کار مختصری را برای یک جلسه در مورد عرضه محصول جدید آماده کند. سپس هوش مصنوعی فهرستی از موضوعات پیشنهادی را در اختیار کاربر قرار داد که میتوان آنها را در جلسه با یک برنامه زمانبندی مشخص مورد بحث قرار داد:
به طور کلی، در مورد عملکرد این مدل DeepSeek، طیف گسترده ای از وظایف مانند نوشتن و رفع مشکلات پیچیده کد او این کار را به راحتی انجام می دهد. این مدل همچنین می تواند لحن و سبک نوشتن خود را بر اساس موضوعات مختلف تنظیم کند، اما DeepSeek مانند بسیاری از مدل های هوش مصنوعی دیگر به … موضوعات بسیار خاص ممکن است اطلاعات نادرست ارائه دهد. به نظر می رسد DeepSeek V3 نیز تمایلی به ارائه پاسخ در مورد موضوعات حساس تاریخی ندارد.
دسترسی به هوش مصنوعی DeepSeek V3
اکنون رایگان می توانید از نسخه وب پرچمدار چینی هوش مصنوعی DeepSeek V3 استفاده کنید. طبیعتا برای استفاده از آن نیاز به یک حساب کاربری دارید که از طریق اکانت گوگل نیز قابل ایجاد است. رابط کاربری این سرویس شباهت زیادی به ChatGPT دارد و می توانید پس از ورود به حساب کاربری خود با آن چت کنید. شایان ذکر است که این مدل از فارسی کاربران ایرانی را نیز پشتیبانی می کند و جریمه نمی کند.
علاوه بر نسخه وب، DeepSeek در حال حاضر فقط برای آن در دسترس است اندروید در دسترس است و می توانید آن را از طریق گوگل پلی دانلود کنید.
منبع خبر: https://digiato.com/artificial-intelligence/what-is-deepseek-ai
تحریریه ABS NEWS | ای بی اس نیوز