Anthropic делает шаг к «осознанному» ИИ и открывает офис в Токио

Компания Anthropic, разработчик ИИ-системы Claude, представила два знаковых анонса: доказательства реальной интроспекции в своих моделях и открытие первого офиса в Азии - в Токио.

Anthropic делает шаг к «осознанному» ИИ и открывает офис в Токио

29 октября 2025, Токио / Сан-Франциско — Компания Anthropic, разработчик ИИ-системы Claude, представила два знаковых анонса: доказательства реальной интроспекции в своих моделях и открытие первого офиса в Азии — в Токио.

Claude начинает «понимать» свои мысли: прорыв в интерпретируемости ИИ

Anthropic опубликовала исследование, которое может стать поворотным моментом в развитии прозрачного ИИ.

Что такое интроспекция в ИИ?

Это способность модели осознавать свои внутренние процессы — распознавать, какие мысли «свои», а какие внедрены извне, и контролировать соответствие плана и результата.

Ключевые эксперименты

  • Инъекция мыслей. Внедрение искусственной идеи в «мозг» модели. Claude Opus 4 / 4.1 в ряде случаев распознаёт вмешательство и называет внедрённую концепцию.
  • Prefill-обнаружение. Модель проверяет: «Это мой план или навязанный?». Естественный механизм самоконтроля — Claude извиняется, если текст искусственный.
  • Когнитивный контроль. Инструкция «думать об аквариумах». Рост активации нейронов по теме — подтверждено.

Цитата из исследования:
«Это не сознание и не субъективный опыт. Но это реальная, измеримая интроспекция — первый шаг к ИИ, который может объяснить, почему он делает то, что делает».

Лучшие результаты у флагманских моделей Claude Opus 4 и 4.1. Младшие версии (Sonnet, Haiku) пока не тестировались.

Зачем это нужно?

  • Безопасность: обнаружение манипуляций и джейлбрейков.
  • Прозрачность: объяснение решений модели.
  • Контроль: предотвращение «галлюцинаций» на уровне архитектуры.

Официальный отчёт
Полная научная статья


Anthropic в Японии: Токио становится AI-хабом Азии

Второй анонс — официальное открытие офиса в Токио, первого в регионе APAC.

Главные события дня

  • Встреча с правительством. CEO Дарио Амодеи провёл переговоры с премьер-министром Sanae Takaichi и министром цифровой трансформации Taro Matsumoto.
  • Меморандум о безопасности. Подписано соглашение с Japan AI Safety Institute — совместная разработка стандартов оценки рисков ИИ.
  • Builder Summit. 150+ стартапов; Япония — лидер APAC по использованию Claude Code.
  • Рост бизнеса. Выручка в APAC ×10 за год; среди клиентов — Rakuten, Nomura, Panasonic.
  • Культура + ИИ. Партнёрство с Mori Art Museum — выставка Roppongi Crossing 2025: AI × Искусство.

«Япония — это не просто рынок. Это партнёр в создании безопасного и полезного ИИ для всего мира». 

Дарио Амодеи

Подробности открытия

Что это значит для индустрии?

  • Наука. Интроспекция — новый рубеж после масштабирования и мультимодальности.
  • Бизнес. Япония становится третьим полюсом AI-разработки (после США и Китая).
  • Безопасность. Совместные стандарты с JASI — модель для G7.
  • Продукт. Интроспекция может появиться в Claude Enterprise и API.

Вывод

29 октября 2025 вошло в историю Anthropic как день двойного прорыва:

  • в лаборатории — ИИ, который начинает понимать себя;
  • на карте мира — Токио, как новый центр глобального AI-развития.

Следите за обновлениями: интроспекция может стать новым стандартом безопасности, а Япония — ключевым игроком в гонке за ответственным ИИ.

21:30
143
​Anthropic
Anthropic одна из передовых компаний в области искусственного интеллекта, ставящей перед собой амбициозные цели по созданию безопасных и этичных AI-систем таких как Claude.
Нет комментариев. Ваш будет первым!