ИИ-агенты за две недели создали компилятор C, способный собирать ядро Linux

Исследователи из компании Anthropic провели необычный эксперимент, который наглядно продемонстрировал, как может выглядеть будущее автономной разработки программного обеспечения. Модели Opus 4.6, работающей в составе системы Claude, было поручено создать полноценный компилятор языка C без поэтапного ручного руководства со стороны человека.
Для выполнения задачи использовалась концепция так называемых «команд агентов». Вместо одного ИИ над проектом параллельно работали 16 экземпляров Claude, каждый из которых выполнял собственные подзадачи в общем репозитории. Человек задал общую цель и инфраструктуру контроля, после чего в основном «вышел из процесса», наблюдая за результатами со стороны.
За две недели и почти две тысячи автономных сессий ИИ-агенты написали около 100 тысяч строк кода на Rust, создав компилятор, который оказался способен собирать ядро Linux версии 6.9 для архитектур x86, ARM и RISC-V. Общая стоимость эксперимента составила около 20 тысяч долларов, что, по оценке автора проекта, существенно меньше затрат, которые потребовались бы для аналогичной работы командой инженеров.
Ключевую роль в успехе сыграла не столько «умность» модели, сколько правильно выстроенная среда. Для агентов был создан специальный цикл работы без пауз, система блокировок задач через Git и строгий набор автоматических тестов. Именно тесты стали главным «руководителем» ИИ: модель не просто писала код, а постоянно проверяла себя, исправляла ошибки и двигалась дальше без внешних подсказок.
При этом эксперимент вскрыл и серьёзные ограничения автономной разработки. Когда проект дошёл до сборки ядра Linux, параллельность стала мешать: все агенты упирались в одни и те же ошибки и перезаписывали исправления друг друга. Решением стало сравнение результатов с GCC — эталонным компилятором, который использовался как «оракул» для локализации проблем и распределения работы между агентами.
Авторы подчёркивают, что получившийся компилятор пока нельзя считать полноценной заменой промышленным решениям. Он не имеет собственного ассемблера и линковщика, генерирует менее эффективный код, а в ряде случаев всё ещё опирается на GCC. Тем не менее сам факт того, что автономная система смогла довести столь сложный проект до рабочего состояния, считается качественным сдвигом.
По мнению исследователей, этот эксперимент показывает, что разработка ПО постепенно переходит от модели «человек - помощник ИИ» к формату, где человек задаёт рамки и цели, а ИИ-агенты самостоятельно реализуют масштабные проекты. Одновременно с этим растут и риски: полностью автономный код сложнее проверять, а ошибки могут быть менее заметны на ранних этапах.
Тем не менее в Anthropic считают, что подобные системы станут основой для следующего поколения инструментов разработки, где ИИ сможет не только дописывать функции, но и годами поддерживать и развивать большие кодовые базы — при условии строгого контроля и новых подходов к безопасности.


