چند ساعت قبل از کنفرانس توسعه دهندگان I/O، گوگل از ویژگی جدید جالبی برای جمینا خبر داد. این شرکت ویدیوی کوتاهی را منتشر کرد که ویژگی جدید هوش مصنوعی را به نمایش گذاشت. با استفاده از این ویژگی، جمینا می تواند فوراً آنچه را در قاب عکس است تشخیص دهد. OpenAI نیز دیروز از مدل GPT-4o AI خود رونمایی کرد که قابلیت مشابهی دارد.
گوگل در شبکه اجتماعی X او ویدیویی منتشر کرد که در آن شخصی دوربین گوشی پیکسل خود را باز می کند و کلمه I/O را نیز روی صحنه می بینیم. “فکر می کنی اینجا چه خبر است؟” جیمنا می پرسد. هوش مصنوعی پاسخ می دهد: “به نظر می رسد که برخی افراد برای یک رویداد بزرگ، شاید یک کنفرانس یا ارائه، آماده می شوند.”
گوگل با ChatGPT-4o رقابت می کند
در ویدیوی آشکار ChatGPT-4o، OpenAI همچنین توانایی درک تصاویر و صداها را در زمان واقعی لمس کرد. در ویدیوی این شرکت دیدیم که ChatGPT-4o میتواند ویدیو و صدا را با کمترین تاخیر تشخیص دهد و به شما بگوید که به نظر میرسد آماده ارائه یک سخنرانی هستید. اکنون به نظر می رسد Google Video پاسخی به همان قابلیت هوش مصنوعی OpenAI باشد.
دقیقا مشخص نیست که ویژگی جدید گوگل چیست، اگرچه شباهت هایی به لنز گوگل یا جستجوی مبتنی بر دوربین این شرکت دارد. با این حال، به نظر می رسد این هوش مصنوعی در زمان واقعی کار می کند و به دستورات صوتی درست مانند هوش مصنوعی چند وجهی در عینک هوشمند متا پاسخ می دهد. همچنین جالب است که این ویژگی در تلفن پیکسل در این ویدیو ظاهر می شود، زیرا گوگل اغلب ویژگی های جدید هوش مصنوعی را ابتدا در سری پیکسل خود منتشر می کند.
اگرچه انتشار چنین ویدئویی چند ساعت قبل از I/O غیرعادی است، اما ممکن است گوگل این ویدئو را در پاسخ به افشای قابلیت های مدل GPT-4o ساخته باشد.
کنفرانس Google I/O قرار است امروز (5 اردیبهشت) ساعت 20:30 به وقت ایران برگزار شود.
منبع خبر: https://digiato.com/artificial-intelligence/google-follows-up-to-openais-gpt-4o-with-new-gemini-ai-demo-video
تحریریه ABS NEWS | ای بی اس نیوز