PythonTalk
@pythontalk
Привет, меня зовут Олег Булыгин 👋
🐍 Здесь я делюсь полезной информацией для тех, кто пишет код на Python: от разработки до Data Science.
360 posts
Опенсорс

Нейронка, которая сама копается в данных? 📊

DeepBI — это open-source платформа для анализа данных, построенная на LLM. Идея простая: вместо того чтобы писать SQL-запросы или код на Python, вы просто задаете вопросы на естественном языке.

STORM: Как LLM от Стэнфорда автоматизирует ресёрч и пишет статьи за вас

Вот вам нужно погрузиться в новую сложную тему. Впереди часы гуглежа, десятки открытых вкладок, попытки отделить зёрна от плевел и собрать всё в единую картину. Процесс мучительный и не всегда продуктивный.

ERNIE 4.5 от Baidu

Китайский гигант Baidu выкатил в опенсорс целое семейство моделей ERNIE 4.5. И не просто веса на Hugging Face закинули, а представили полноценную экосистему с инструментами для дообучения и деплоя.

Gemini CLI: бесплатный AI-ассистент от Google, который живёт в вашем терминале

На днях Google зарелизили Gemini CLI — открытого AI-агента, который интегрируется прямо в командную строку. Это инструмент для командной строки, который даёт вам прямой доступ к возможностям модели Gemini. Вы можете общаться с ним в режиме чата прямо в терминале, давать ему доступ к файлам вашего проекта, просить проанализировать код, автоматизировать рутину и многое другое.

Kimi-Dev-72B: новая open-source LLM для программирования

Недавно появился новый персонаж среди LLM — Kimi-Dev-72B от Moonshot AI. Это open-source модель, заточенная под задачи software engineering. На момент выхода она показала лучший результат (60.4%) на бенчмарке SWE-bench Verified среди всех открытых моделей, став новой SOTA (State-of-the-Art).

miniDiffusion: разбираем Stable Diffusion 3.5 на атомы в 2800 строк кода

Большинство современных AI-фреймворков — это чёрные ящики, созданные для того, чтобы вы ими пользовались, а не понимали их. Библиотеки вроде diffusers от Hugging Face, при всей их мощи, скрывают реальную логику за таким количеством слоёв абстракций, что разобраться в них без бутылки бывает нереально.

RoboBrain 2.0: открытые «мозги» для роботов, которые умеют думать вслух

В мире AI сейчас модно говорить про Embodied AI — искусственный интеллект, воплощённый в физической форме. Но большинство прорывных разработок в этой сфере остаются за закрытыми дверями корпораций. Тем интереснее выглядит релиз RoboBrain 2.0 от китайской исследовательской лаборатории BAAI — это мощная, а главное, открытая модель для управления роботами.

MiniMax-M1: когда эффективность важнее размера

В бесконечной гонке LLM-моделей все привыкли мериться двумя вещами: количеством параметров и строчками в бенчмарках. Но пока одни наращивают мускулы, заливая всё деньгами и мощностями, другие, похоже, решили включить голову. Китайская компания MiniMax выпустила MiniMax-M1 — модель, которая делает ставку не на тупую силу, а на архитектурную элегантность.

Dolphin: open-source парсер, который идеально разбирает PDF

Парсинг документов — задача, которая звучит просто, но на деле оказывается десятым кругом ада. Попробуйте вытащить таблицу из PDF, не потеряв форматирование, или разобрать отсканированную научную статью со схемами и формулами. Обычно на выходе получается месиво, которое проще перепечатать вручную.

Memvid: когда ваша база данных — это MP4-файл. Гениально или безумие?

Наткнулся на проект Memvid — это Python-библиотека, которая предлагает интересный подход к RAG. Вместо того чтобы разворачивать тяжелые векторные базы данных, которые жрут RAM и требуют серверов, эта штука кодирует миллионы текстовых чанков в один компактный видеофайл.