Anthropic делает шаг к «осознанному» ИИ и открывает офис в Токио

29 октября 2025, Токио / Сан-Франциско — Компания Anthropic, разработчик ИИ-системы Claude, представила два знаковых анонса: доказательства реальной интроспекции в своих моделях и открытие первого офиса в Азии — в Токио.
Claude начинает «понимать» свои мысли: прорыв в интерпретируемости ИИ
Anthropic опубликовала исследование, которое может стать поворотным моментом в развитии прозрачного ИИ.
Что такое интроспекция в ИИ?
Это способность модели осознавать свои внутренние процессы — распознавать, какие мысли «свои», а какие внедрены извне, и контролировать соответствие плана и результата.
Ключевые эксперименты
- Инъекция мыслей. Внедрение искусственной идеи в «мозг» модели. Claude Opus 4 / 4.1 в ряде случаев распознаёт вмешательство и называет внедрённую концепцию.
- Prefill-обнаружение. Модель проверяет: «Это мой план или навязанный?». Естественный механизм самоконтроля — Claude извиняется, если текст искусственный.
- Когнитивный контроль. Инструкция «думать об аквариумах». Рост активации нейронов по теме — подтверждено.
Цитата из исследования:
«Это не сознание и не субъективный опыт. Но это реальная, измеримая интроспекция — первый шаг к ИИ, который может объяснить, почему он делает то, что делает».
Лучшие результаты у флагманских моделей Claude Opus 4 и 4.1. Младшие версии (Sonnet, Haiku) пока не тестировались.
Зачем это нужно?
- Безопасность: обнаружение манипуляций и джейлбрейков.
- Прозрачность: объяснение решений модели.
- Контроль: предотвращение «галлюцинаций» на уровне архитектуры.
Официальный отчёт
Полная научная статья
Anthropic в Японии: Токио становится AI-хабом Азии
Второй анонс — официальное открытие офиса в Токио, первого в регионе APAC.
Главные события дня
- Встреча с правительством. CEO Дарио Амодеи провёл переговоры с премьер-министром Sanae Takaichi и министром цифровой трансформации Taro Matsumoto.
- Меморандум о безопасности. Подписано соглашение с Japan AI Safety Institute — совместная разработка стандартов оценки рисков ИИ.
- Builder Summit. 150+ стартапов; Япония — лидер APAC по использованию Claude Code.
- Рост бизнеса. Выручка в APAC ×10 за год; среди клиентов — Rakuten, Nomura, Panasonic.
- Культура + ИИ. Партнёрство с Mori Art Museum — выставка Roppongi Crossing 2025: AI × Искусство.
«Япония — это не просто рынок. Это партнёр в создании безопасного и полезного ИИ для всего мира».
— Дарио Амодеи
Что это значит для индустрии?
- Наука. Интроспекция — новый рубеж после масштабирования и мультимодальности.
- Бизнес. Япония становится третьим полюсом AI-разработки (после США и Китая).
- Безопасность. Совместные стандарты с JASI — модель для G7.
- Продукт. Интроспекция может появиться в Claude Enterprise и API.
Вывод
29 октября 2025 вошло в историю Anthropic как день двойного прорыва:
- в лаборатории — ИИ, который начинает понимать себя;
- на карте мира — Токио, как новый центр глобального AI-развития.
Следите за обновлениями: интроспекция может стать новым стандартом безопасности, а Япония — ключевым игроком в гонке за ответственным ИИ.



