Google представила «лучшую в мире» ИИ-модель Gemini 3
Google представила Gemini 3 — свою самую мощную ИИ-модель. Она объединяет все возможности линейки и «считается лучшей в мире».
«Каждое поколение Gemini основано на предыдущем. Прорывы Gemini 1 в области встроенной мультимодальности и длинного контекстного окна расширили диапазон обрабатываемой инфомрации и ее объем. Gemini 2 заложил основу для агентских возможностей и расширил границы рассуждений и мышления. […] Gemini 2.5 Pro возглавлял рейтинг LMArena более шести месяцев», — говорится в анонсе.
Gemini 3 — «передовое решение» для логического мышления, созданное для понимания глубины и нюансов. Она улавливает тонкие детали в творческих идеях и разбирает комплексные задачи.
«ИИ гораздо лучше понимает контекст и смысл промпта, поэтому вы получаете то, что вам нужно, с меньшим количеством подсказок», — написала команда в блоге.
Модель уже доступна в поисковике Google, приложении Gemini, AI Studio, Vertex AI и бесплатной среде для вайб-кодинга Google Antigravity.
«Это лучшая в мире модель для мультимодального понимания и наша самая мощная нейросеть для агентного и вайб-кодинга. Она обеспечивает богатую визуализацию и более глубокую интерактивность — все на базе современных методов рассуждения», — отметили CEO Google DeepMind Демис Хассабис и технический директор Корай Кавукчуоглу.
Дополнительно представлен усовершенствованный режим рассуждений Gemini 3 Deep Think. Сначала к нему получат доступ тестировщики по безопасности, после чего инструмент станет доступен подписчикам Google AI Ultra.
Цифры
Gemini 3 Pro способен «воплотить в жизнь любую идею» благодаря «современному мышлению» и мультимодальным возможностям. Модель значительно превзошла версию 2.5 Pro по всем ключевым показателям.
В рейтинге LMArena она заняла первое место с результатом 1501 Elo, демонстрируя рассуждения на уровне доктора наук. Высокие показатели также зафиксированы в тестах Humanity’s Last Exam (37,5%) и GPQA Diamond (91,9%).
В тесте по математике MathArena Apex модель получила 23,4%. В заданиях на мультимодальное мышление результаты выше: на MMMU-Pro — 81%, а в Video-MMMU — 87,6%. В SimpleQA Verified показатель составил 72,1%.
«Это означает, что Gemini 3 Pro обладает высокой способностью решать сложные проблемы по широкому спектру тем, таких как наука и математика, с высокой степенью надежности», — говорится в блоге.
Команда проекта подчеркнула, что ответы Gemini 3 Pro умны, лаконичны и прямы. Он «говорит вам то, что нужно услышать, а не то, что вы хотите».
Gemini 3 Deep Think
Gemini 3 Deep Think — новый режим рассуждений на базе Gemini 3, который в ходе тестов набрал 41% в Humanity’s Last Exam, 93,8% в GPQA Diamond и 45,1% в ARC-AGI-2.
Компания позиционирует Gemini 3 как универсального помощника, способного справляться с любыми задачами благодаря мультимодальному мышлению и высокой производительности. Модель поддерживает контекстное окно объемом до 1 млн токенов.
Модель может распознать рукописный рецепт на разных языках из семейной кулинарной книги, найти научные статьи, видеолекции и учебные пособия по интересующей теме или сгенерировать код для интерактивных карточек, визуализаций и других форматов.
Вайб-кодинг
Разработчики отметили улучшенные возможности Gemini 3 в области агентного и вайб-кодинга — модель обрабатывает сложные промпты и инструкции и делает продукты более автономными. Она набрала 1487 Elo в WebDev Aren, 54,2% в Terminal-Bench 2.0 и 76,2% в SWE-bench Verified.
Корпорация также представила платформу для создания ИИ-агентов Google Antigravity. По словам разработчиков, она превращает цифрового ассистента в активного партнера, способного самостоятельно планировать и выполнять комплексные задачи, одновременно проверяя собственный код.
Сервис интегрирован с моделью редактирования изображений Nano Banana.
Gemini 3 возглавила рейтинг Vending-Bench 2. Бенчмарк тестирует способность планировать на длительные сроки.
Gemini 3 лучше помогает в повседневных задачах вроде бронирования местных услуг или организации почтового ящика. Подписчики Google AI Ultra могут попробовать агентские возможности в приложении Gemini.
Безопасность
Google заявляет о высокой степени безопасности Gemini 3. По результатам комплексной проверки модель показала снижение склонности к «льстивым» ответам, повышенную устойчивость к атаке типа инъекция промпта и улучшенную защиту от злоупотреблений посредством кибератак.
В ближайшее время планируется выпуск дополнительных моделей из серии Gemini 3.
Напомним, в ноябре Google представила ряд новых решений в сфере агентского ИИ. Среди них: режим глубоких исследований в NotebookLM, «мозг для роботов» SIMA 2 и инструменты для шопинга.
Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!
