Kimi-Dev-72B: новая open-source LLM для программирования

Недавно появился новый персонаж среди LLM — Kimi-Dev-72B от Moonshot AI. Это open-source модель, заточенная под задачи software engineering. На момент выхода она показала лучший результат (60.4%) на бенчмарке SWE-bench Verified среди всех открытых моделей, став новой SOTA (State-of-the-Art).

Но бенчмарки — это одно. Гораздо интереснее, как этот результат был достигнут.

Главная фишка: обучение через реальную проверку

Разработчики Kimi-Dev пошли по пути, который имитирует реальную работу программиста. Вместо того чтобы просто учить модель на парах «комментарий-код», они применили Reinforcement Learning (обучение с подкреплением) в максимально приближенных к боевым условиях.

Ключевая идея: модель запускается в изолированном Docker-окружении, где она пытается применить патч к реальному коду из open-source репозитория. Положительное подкрепление (reward) она получает только в одном случае — если после её правок весь набор тестов успешно проходит.

Этот подход отсекает 99% бесполезных, хоть и красивых, решений. Модель вынуждена генерировать не просто код, а работающий код, который чинит конкретную проблему и не ломает ничего другого.

Как это работает под капотом?

Весь процесс решения задачи разбит на два логичных этапа, которые назвали по ролям: BugFixer (исправляет баги) и TestWriter (пишет тесты).

File Localization: Сначала модель анализирует описание проблемы (issue) и структуру репозитория, чтобы определить, какие файлы вообще нужно трогать. Это значительно сужает область поиска и делает дальнейшую работу более точной.
Code Editing: После того как файлы-кандидаты найдены, модель вносит в них точечные изменения — исправляет баг или добавляет модульные тесты.

В качестве фундамента используется модель Qwen 2.5-72B, которую дообучили на ~150 млрд токенов отборного кода с GitHub. Лицензия у проекта — MIT, что позволяет свободно использовать и модифицировать модель.

Как начать использовать?

Для тех, кто хочет пощупать модель своими руками, разработчики предоставили все инструкции.

Клонируем репозиторий и создаем окружение:

# clone repo
git clone https://github.com/MoonshotAI/Kimi-Dev.git
# create env
conda create -n kimidev python=3.12
# local install
pip install -e .

Для запуска самой модели рекомендуется использовать vLLM, чтобы оптимизировать её работу на GPU.

Ссылки

GitHub: https://github.com/MoonshotAI/Kimi-Dev
Hugging Face: https://huggingface.co/moonshotai/Kimi-Dev-72B
Демо: https://huggingface.co/spaces/moonshotai/Kimi-Dev-72B