🔬AlphaEvolve от Google DeepMind
Google DeepMind представила AlphaEvolve – "эволюционный кодинг-агент", работающий на моделях Gemini и предназначенный для открытия и оптимизации сложных алгоритмов в математике и современных компьютерных науках. И, судя по результатам, он уже делает успехи там, где пасуют даже лучшие человеческие умы.
Что такое AlphaEvolve и как он работает?
AlphaEvolve – это не просто генератор кода. Это агент, который применяет эволюционный подход для решения сложных задач:
- Генерация идей: Используется ансамбль LLM. Gemini Flash (самая быстрая и эффективная модель Google) отвечает за "широту" идей, генерируя множество потенциальных решений. Gemini Pro (самая мощная модель) обеспечивает "глубину", предлагая более проработанные варианты. Модели предлагают компьютерные программы, реализующие алгоритмические решения.
- Автоматическая оценка: Предложенные программы верифицируются, запускаются и оцениваются с помощью автоматизированных метрик. Это обеспечивает объективную, количественную оценку точности и качества каждого решения.
- Эволюционный отбор: Лучшие, наиболее перспективные решения сохраняются в базе данных программ. Эта база данных реализует эволюционный алгоритм, который определяет, какие программы (или их части) будут использованы для формирования промптов на следующих итерациях. Таким образом, система итеративно улучшает и "эволюционирует" алгоритмы.
Цель AlphaEvolve – выйти за рамки открытия отдельных функций и перейти к разработке целых кодовых баз и гораздо более сложных алгоритмов.
Впечатляющие результаты: От дата-центров Google до открытых математических проблем
Самое интересное, что AlphaEvolve – это не просто исследовательский проект. Он уже больше года активно применяется внутри Google и демонстрирует ощутимые результаты:
- Оптимизация дата-центров Google:
- AlphaEvolve обнаружил простую, но эффективную эвристику для более эффективной оркестрации дата-центров с помощью системы Borg.
- Это решение, работающее в продакшене больше года, постоянно высвобождает в среднем 0.7% мировых вычислительных ресурсов Google. Это огромная экономия в масштабах Google.
- Важно, что сгенерированный код читаем, интерпретируем и легко отлаживаем, что упрощает его развертывание и поддержку.
- Помощь в проектировании железа (чипов):
- Предложил оптимизацию (перезапись кода на Verilog) для ключевой арифметической схемы умножения матриц, удалив ненужные биты.
- Это предложение прошло строгую верификацию и было интегрировано в будущие версии Tensor Processing Unit (TPU), кастомных AI-ускорителей Google.
- Ускорение обучения и инференса AI-моделей:
- Нашёл более умные способы разделения операций умножения больших матриц, ускорив это ядро в архитектуре Gemini на 23%. Это привело к 1% сокращению времени обучения Gemini. Учитывая гигантские затраты на обучение LLM, даже 1% – это колоссальная экономия.
- Значительно сокращает время на оптимизацию ядер: с недель ручной работы экспертов до дней автоматических экспериментов.
- Оптимизировал низкоуровневые GPU-инструкции для ядра FlashAttention в Transformer-моделях, добившись ускорения до 32.5%. Это область, куда люди-инженеры обычно не лезут из-за её сложности и уже существующей сильной оптимизации компиляторами.
- Прорывы в фундаментальной математике и теории алгоритмов:
- Умножение матриц: AlphaEvolve разработал компоненты новой процедуры оптимизации на основе градиентов, которая открыла множество новых алгоритмов для умножения матриц. В частности, для умножения комплексных матриц 4x4 нашёл алгоритм, использующий 48 скалярных умножений, что лучше знаменитого алгоритма Штрассена 1969 года (который считался лучшим для этого случая). Это превосходит даже предыдущую работу DeepMind – AlphaTensor, который специализировался на умножении матриц, но для 4x4 находил улучшения только для бинарной арифметики.
- Решение открытых математических проблем: Систему применили к более чем 50 открытым проблемам в математическом анализе, геометрии, комбинаторике и теории чисел.
- Примерно в 75% случаев AlphaEvolve переоткрыл уже известные лучшие решения.
- Примерно в 20% случаев он улучшил ранее известные лучшие решения, продвинув решение соответствующих открытых проблем. Например, он добился прогресса в "задаче о целующихся шарах" (kissing number problem), найдя конфигурацию из 593 внешних сфер для 11 измерений и установив новый нижний предел.
Результаты AlphaEvolve показывают, что AI может не просто писать код по спецификации, но и самостоятельно открывать новые, более эффективные фундаментальные алгоритмы, решая задачи, над которыми человечество билось десятилетиями и даже столетиями.
Эволюция AI для эволюции алгоритмов
Google DeepMind подчёркивают, что AlphaEvolve демонстрирует переход от открытия алгоритмов для узкоспециализированных областей к разработке более сложных алгоритмов для широкого спектра реальных задач. Они ожидают, что возможности AlphaEvolve будут расти вместе с развитием LLM, особенно по мере улучшения их способностей к кодированию.
Планируется запуск Early Access Program для избранных академических пользователей, а также изучаются возможности сделать AlphaEvolve более широко доступным.
Зачем это нужно и что это меняет?
Если Codex и подобные ему AI-агенты нацелены на то, чтобы помочь разработчикам в их повседневной работе (написание фич, фикс багов, рефакторинг), то AlphaEvolve метит на более высокий уровень – фундаментальные исследования и оптимизацию на грани возможного.
Последствия могут быть огромными:
- Ускорение научных открытий: Во многих областях науки (материаловедение, открытие лекарств, устойчивое развитие) прогресс зависит от эффективности алгоритмов. AlphaEvolve может стать мощным инструментом для исследователей.
- Прорыв в эффективности вычислений: Оптимизация дата-центров, железа, AI-моделей – всё это ведёт к снижению затрат, экономии энергии и повышению производительности.
- Новый этап в понимании AI: Если AI может не просто применять знания, но и генерировать новые фундаментальные знания (алгоритмы, математические доказательства), это меняет наше представление о его возможностях.
Это, конечно, поражает воображение. Одно дело, когда AI помогает тебе писать бойлерплейт или искать баги. И совсем другое – когда он улучшает алгоритм Штрассена или находит новые подходы к задачам, над которыми бились лучшие математики.
Тут уже не просто "замена программиста". Тут AI выступает в роли полноценного исследователя, способного на творческие прорывы.
Заключение: AI-учёный на службе человечества?
AlphaEvolve – это яркий пример того, как AI может использоваться не для замены рутинных задач, а для расширения границ человеческих знаний и возможностей. Это не "убийца программистов" в прямом смысле, а скорее невероятно мощный инструмент для учёных, инженеров и исследователей.
Способность системы находить новые алгоритмы и оптимизировать существующие на таком глубоком уровне открывает захватывающие перспективы для многих отраслей. И хотя потрогать AlphaEvolve широкой публике пока не дадут, сам факт его существования и успехов – это очень важный сигнал о том, куда движется AI.