Kimi-Dev-72B: новая open-source LLM для программирования
Недавно появился новый персонаж среди LLM — Kimi-Dev-72B от Moonshot AI. Это open-source модель, заточенная под задачи software engineering. На момент выхода она показала лучший результат (60.4%) на бенчмарке SWE-bench Verified среди всех открытых моделей, став новой SOTA (State-of-the-Art).
Но бенчмарки — это одно. Гораздо интереснее, как этот результат был достигнут.
Главная фишка: обучение через реальную проверку
Разработчики Kimi-Dev пошли по пути, который имитирует реальную работу программиста. Вместо того чтобы просто учить модель на парах «комментарий-код», они применили Reinforcement Learning (обучение с подкреплением) в максимально приближенных к боевым условиях.
Ключевая идея: модель запускается в изолированном Docker-окружении, где она пытается применить патч к реальному коду из open-source репозитория. Положительное подкрепление (reward) она получает только в одном случае — если после её правок весь набор тестов успешно проходит.
Этот подход отсекает 99% бесполезных, хоть и красивых, решений. Модель вынуждена генерировать не просто код, а работающий код, который чинит конкретную проблему и не ломает ничего другого.
Как это работает под капотом?
Весь процесс решения задачи разбит на два логичных этапа, которые назвали по ролям: BugFixer (исправляет баги) и TestWriter (пишет тесты).
- File Localization: Сначала модель анализирует описание проблемы (issue) и структуру репозитория, чтобы определить, какие файлы вообще нужно трогать. Это значительно сужает область поиска и делает дальнейшую работу более точной.
- Code Editing: После того как файлы-кандидаты найдены, модель вносит в них точечные изменения — исправляет баг или добавляет модульные тесты.
В качестве фундамента используется модель Qwen 2.5-72B, которую дообучили на ~150 млрд токенов отборного кода с GitHub. Лицензия у проекта — MIT, что позволяет свободно использовать и модифицировать модель.
Как начать использовать?
Для тех, кто хочет пощупать модель своими руками, разработчики предоставили все инструкции.
Клонируем репозиторий и создаем окружение:
# clone repo git clone https://github.com/MoonshotAI/Kimi-Dev.git # create env conda create -n kimidev python=3.12 # local install pip install -e .
Для запуска самой модели рекомендуется использовать vLLM, чтобы оптимизировать её работу на GPU.
Ссылки
- GitHub: https://github.com/MoonshotAI/Kimi-Dev
- Hugging Face: https://huggingface.co/moonshotai/Kimi-Dev-72B
- Демо: https://huggingface.co/spaces/moonshotai/Kimi-Dev-72B