Microsoft, Google DeepMind и xAI откроют новые ИИ-модели американскому регулятору до релиза

Что проверяют: кибератаки, оружие массового поражения, обход защит
Соглашение касается pre-deployment evaluation - тестирования модели до публичного запуска. По данным Reuters, государственные специалисты получают доступ к ещё не выпущенным моделям и ищут уязвимости заранее. В фокусе - кибератаки, помощь в разработке химического и биологического оружия, риски, связанные с целостностью обучающих данных и обходом встроенных защитных механизмов.
Это смещает точку контроля ближе к исходной. Сначала с моделью работают аудиторы и профильные ведомства; широкий рынок и корпоративные клиенты подключаются позже. Frontier-модели - самые мощные системы, подходящие к границам возможностей текущих ИИ - теперь проходят через дополнительный этап в релизном цикле.
Google DeepMind, Microsoft и xAI в трёх разных форматах
OpenAI и Anthropic участвовали в программе раньше. Теперь к ней присоединились Google DeepMind, Microsoft и xAI, причём формат участия у каждой компании свой.
Google DeepMind открывает доступ к собственным моделям. Microsoft помогает наборами данных и рабочими сценариями тестирования. xAI тоже вошла в соглашение, но публичных деталей с её стороны почти нет.
Разница в форматах показывает, что единого стандарта пока нет; есть рамочные обязательства, под которые компании подстраивают то, что готовы открыть.
CAISI - преемник AI Safety Institute, перекроенный в январе 2026
CAISI расшифровывается как Center for AI Standards and Innovation. Это центр при Министерстве торговли США, созданный на базе прежнего AI Safety Institute. В январе 2026 года Минторг официально переформатировал старую структуру в CAISI, сделав больший акцент на стандартах, оценке и национальной безопасности.
На сайте NIST CAISI обозначен как основной правительственный контакт для тестирования коммерческих ИИ-систем и совместных исследований по их безопасному использованию. К моменту анонса центр уже провёл более 40 оценок продвинутых моделей. В части случаев тестировались менее ограниченные версии систем - чтобы понять, насколько просто обойти защиту. Reuters упоминает, что подобные проверки уже находили проблемы: возможность подменять сигналы безопасности, обходить ограничения. После таких отчётов компании вносили исправления до широкого развёртывания.
Reuters описывает формат скорее как стресс-тесты, чем формальную сертификацию.
Пентагон в параллель
CAISI не единственный канал, через который государство расширяет работу с большими ИИ-системами. 1 мая Reuters сообщило, что Пентагон заключил отдельные соглашения с рядом крупных поставщиков ИИ для работы на закрытых сетях. На этом фоне предварительные проверки выглядят как ещё один слой контроля: сначала стресс-тест в CAISI, затем возможный доступ к более чувствительным государственным сценариям.
Связка двух историй важнее каждой по отдельности. Государство выстраивает постоянный механизм доступа к frontier-моделям до публичного релиза, чтобы не зависеть от добровольных постфактум-отчётов разработчиков. Для крупных лабораторий это означает ещё один уровень внешнего контроля, встроенный прямо в цикл выпуска.
Глубина влияния на релизный цикл - вот настоящая проверка
Сюжет выходит далеко за рамки модерации ответов чат-ботов. Чем ближе модели подходят к задачам программирования, киберопераций, автоматизации исследований и работе с чувствительными данными, тем выше интерес властей к их возможностям до релиза. Reuters прямо связывает новые соглашения с опасениями вокруг того, что продвинутые системы могут помогать злоумышленникам в кибератаках.
Проверочной точкой станет не сам факт соглашений; вопрос в другом - насколько глубоко государство сможет влиять на релизный цикл frontier-моделей. Если доступ до запуска станет регулярной практикой, рынок получит новый стандарт: сначала аудит безопасности, потом публичный релиз.


