👑 Google обновили Gemini 2.5 Pro
Google выкатили превью обновлённой Gemini 2.5 Pro. Заявляют, что это их самая умная модель на данный момент, а через пару недель она станет общедоступной.
Что прокачали?
Судя по анонсу, улучшения коснулись ключевых для нас областей:
1. Программирование и логика 🧠
Это, пожалуй, главное. Модель не просто стала "умнее" в вакууме, а показывает конкретные результаты:
- Веб-разработка: На бенчмарке WebDevArena модель скакнула аж на 35 пунктов Elo, уверенно обойдя Opus 4. Это серьезная заявка на лидерство в задачах, связанных с фронтендом и не только.
- Общий зачет: В общем лидерборде LMArena модель укрепила свои позиции, набрав ещё +24 пункта Elo.
- Сложные задачи: Отмечается превосходство на сложных бенчмарках вроде Aider Polyglot, что говорит о глубоком понимании разных языков программирования.
2. Стиль и структура ответов 💬
Google утверждает, что обновлённая модель должна генерировать более креативные и лучше отформатированные ответы. Если это так, то копипастить код и объяснения станет еще приятнее.
[ИНСТРУКЦИЯ ДЛЯ TELETYPE: Здесь рекомендуется вставить [скриншот с лидерборда LMArena, показывающий Gemini 2.5 Pro на первом месте]. Загрузите изображение через интерфейс Teletype.]
Пощупать можно уже сейчас и бесплатно в Google AI Studio.
По ценам в API: до 200 тыс. токенов контекста — $1.25 за вход / $10 за выход (за 1M токенов). Свыше 200 тыс. — $2.50 / $15 соответственно. В Vertex AI также добавили полезную фичу «бюджеты на размышления» для контроля над расходами и задержкой.
Для меня Gemini — основная LLM ещё с появления первой версии 2.5. Другими модельками пользуюсь сильно реже.