Дополнительно
Добавить в закладкиFerium
Администратор
Google Gemini 3 Pro — прорыв в ИИ-революции?
Коротко
Google представила новое поколение своей флагманской модели — Gemini 3 Pro. Ключевые тезисы: существенный рывок в «мыслящих» режимах, акцент на агентности (умение действовать инструментами и координировать задачи), свежие рекорды на бенчмарках и запуск «agent-first» IDE Antigravity. Всё это — шаг к ИИ-помощникам, которые не просто отвечают, а планируют, исполняют и отчитываются о проделанной работе. (AP News)Что такое Gemini 3 Pro и чем он отличается
Gemini 3 — следующее поколение линейки моделей DeepMind/Google, ориентированное на более глубокое рассуждение и «партнёрство в мышлении» в поиске и продуктах. Google подчёркивает, что новый режим «thinking» в поиске должен давать более сжатые и содержательные ответы, а не просто расширенные «AI Overviews». (AP News)Параллельно Google делает ставку на агентность: модель умеет последовательными шагами планировать, использовать инструменты (редактор кода, браузер, терминал), проверять себя и оставлять прозрачные артефакты действий. Это видно по запуску Antigravity — IDE, где Gemini 3 Pro (и даже сторонние модели) работают как команда агентов: редактируют файлы, выполняют команды, ведут протоколы (Artifacts: планы, чек-листы, скриншоты, записи браузера). (The Verge)
PS:
В предварительной версии Google Gemini 3 Pro, доступной в Google AI Studio, можно пользоваться бесплатно — при условии, что вы соглашаетесь на использование ваших диалогов компанией Google для обучения ИИ. В дальнейшем модель ожидается в приложениях Gemini, Vertex AI и в Google API. Цена указана следующим образом: для контекста до 200 000 токенов — 2 $ за миллион входящих токенов и 12 $ за миллион исходящих; для контекста свыше 200 000 токенов — 4 $ за миллион входящих токенов и 18 $ за миллион исходящих.

Производительность: что показывают бенчмарки
Вокруг Gemini 3 Pro уже публикуются сравнения на «фронтирных» тестах. Наиболее заметные:- Humanity’s Last Exam (HLE) — новый широкий академический экзамен (2 500 вопросов по математике, естественным наукам и гуманитарным дисциплинам) с целью дать единый референс для прогресса ИИ. Лидеры таблицы регулярно обновляются; HLE используется как ориентир для «общего интеллекта» моделей. (lastexam.ai)
- ARC-AGI-2 — визуально-логические головоломки Абеля/Каггл-серии, нацеленные на абстрактное мышление; датасеты калибруются так, чтобы задачи решались людьми за ≤2 попытки, а приватные сеты минимизируют утечки. Именно на ARC-AGI-2 многие новые модели меряют «настоящую» способность к рассуждению без подсказок. (ARC Prize)
По независимым обзорам и ранним публикациям, Gemini 3 Pro улучшает «честность» (меньше галлюцинаций) и уверенно выступает на задачах кодинга/мультимодальности, где как раз важна агентность и многошаговость. Но важно оговорить: сравнения зависят от настроек (chain-of-thought, количество попыток, доступ к инструментам) и не всегда строго воспроизводимы. (Ars Technica)

Слив сравнений
Тут видно превосходство Gemini 3 Pro на ряде тестов (HLE, GPQA, AIME 2025, т.д.) по сравнению с предыдущими поколениями и конкурентами — это хорошо согласуется с повесткой запуска. Однако любые частные сводки стоит воспринимать как индикативные до появления полноценных карточек воспроизводимости.
Агентность в деле: Antigravity и «прозрачные» ИИ-действия
Главная практическая новость — Antigravity: бесплатная (в превью) IDE под Windows/macOS/Linux, где можно оркестрировать несколько агентов (включая Gemini 3 Pro) прямо над кодовой базой: редактор + терминал + браузер. Система генерирует «Artifacts» — доказательные следы того, что делал агент и почему (планы, скриншоты, записи сессий). Это отвечает главной претензии к «агентам-волшебникам»: непрозрачность. (The Verge)Почему это важно? Потому что рывок ИИ сегодня — не в «ещё большем чатике», а в инструментальном исполнении: развернуть проект, прогнать тесты, собрать релиз, написать отчёт — и приложить аудит-лог. Antigravity именно туда и нацелен. (Ars Technica)
Интеграция с поиском и продуктами Google
Google продвигает Gemini 3 как «мыслящего партнёра» в поиске и экосистеме (Gemini-планы Pro/Ultra, Deep Research/NotebookLM, Veo 3 для видео, и т.п.). Тренд последних месяцев — перенос продвинутых возможностей прямо в массовые продукты (AI Overviews, мультимодальные ответы, генерация и анимация медиа). (AP News)Безопасность и ответственность
С ростом агентности усиливается и повестка безопасности: фильтрация нежелательных действий, защита от утечек, аудируемость шагов, ограничения на автономию. Google подчёркивает «robust safety measures» в анонсе Gemini 3 и развивает свои рамки безопасности для фронтирных моделей. Однако детали методик (например, при тестах с инструментами) важны для честных сравнений и пока раскрываются фрагментарно. (AP News)Ограничения и открытые вопросы
- Реплики бенчмарков. Часть сравнений пока исходит из демонстраций и независимых табличек; важно смотреть на режимы (с инструментами/без), количество попыток, прогрев. (artificialanalysis.ai)
- Стоимость/квоты. Коммерческие параметры для масштабного продакшна у Google варьируются между планами Pro/Ultra/Vertex; для Gemini 3 Pro детали ещё докручиваются. (blog.google)
- Долгосрочная надёжность агентов. Antigravity показывает хороший вектор — логирование действий, артефакты, «миссион-контрол», — но предприятиям всё равно нужны политики прав доступа, sandbox и SRE-процессы вокруг ИИ. (The Verge)
Вердикт
Скорее это похоже на прорыв — именно в практической плоскости. Gemini 3 Pro делает более зрелым то, чего ждали от «ИИ-революции»: не только ответить, но и сделать (и показать, как сделал). Переход от чат-моделей к агентам с отчётностью — шаг, который способен поменять разработки ПО, аналитику и работу знаний в компаниях. Окончательную оценку даст продакшен: стабильность, стоимость и воспроизводимость результатов. Но направление у Google сейчас одно из самых убедительных на рынке. (AP News)
Ссылки и материалы по теме
- AP: «Google представила Gemini 3 и нацелена сделать поиск “thought partner”» (обзор контекста и стратегий в поиске). (AP News)
- Ars Technica: «Google unveils Gemini 3 и IDE Antigravity» (обзор запуска и акцента на агентности/кодинге). (Ars Technica)
- The Verge: «Antigravity — agent-first IDE, артефакты действий агентов» (детали продукта). (The Verge)
- HLE — описание и лидерборд нового «финального» академического экзамена. (lastexam.ai)
- ARC-AGI-2 — специфика визуально-логического теста и репозиторий. (ARC Prize)
