Anthropic изучила сто тысяч диалогов с Claude и оценила, как ИИ ускоряет работу в экономике

Anthropic представила исследование, в котором попыталась оценить реальное влияние ИИ на производительность труда — не в лабораторных условиях, а на основе ста тысяч настоящих пользовательских диалогов с Claude.ai. Аналитики использовали приватную методику обработки данных и попросили сам Claude оценить, сколько бы заняли анализируемые задачи без помощи ИИ, а затем сравнили это с фактическим временем взаимодействия. По этим оценкам, без ИИ средний пользователь выполнял бы типичную задачу около 90 минут, но Claude способен сократить это время примерно на 80%.
Как проводилось исследование
Исследователи работали со 100 тысячами анонимизированных диалогов, охватывающих профессиональную деятельность в самых разных сферах — от образования и финансов до маркетинга, юриспруденции и разработки ПО. В каждом случае Claude оценивал:
- Сколько времени потребовалось бы квалифицированному специалисту на выполнение задачи без ИИ.
- Сколько занял реальный диалог пользователя с моделью и последующие действия.
Часть методики была подробно продемонстрирована в документе, включая примеры промптов и диаграммы само-согласованности измерений (корреляция между разными вариантами оценки модели достигает 0,89). В исследовании приведён график, показывающий высокую сходимость оценок времени между различными формулировками запросов.
Точность проверялась и на внешних данных — тысячах реальных задач из open-source JIRA-тикетов. Claude Sonnet 4.5 показал сопоставимую с разработчиками способность предсказывать длительность задач: ρ-0.44 против ρ-0.50 у человека. На графиках они демонстрирует близкую корреляцию между фактическим временем и оценками модели.
Где ИИ ускоряет работу сильнее всего
Согласно исследованию, задачи, для которых пользователи обращались к Claude, в среднем стоили бы работодателю $55 (около 5,1 тыс. рублей) труда специалиста. При этом длительность задач радикально различается по профессиям:
- управление и менеджмент — около 2 часов без ИИ;
- юридические задачи — 1,8 часа;
- образование — 1,7 часа;
- IT и программирование — 1,4 часа;
- общепит и сфера услуг — 30–40 минут.
Более «дорогие» профессии используют Claude для более продолжительных и сложных задач. Разброс экономии времени тоже огромен: от 20% (например, проверка диагностических изображений) до 95% (компиляция данных из отчётов). Плотность распределения ускорений показывает пик между 80–90%.
Потенциальный эффект для экономики
Используя методологию Халтена, Anthropic смоделировала, как такие ускорения могут повлиять на экономику США в целом. При условии, что текущие модели будут широко внедрены в течение десяти лет, рост производительности труда может увеличиваться на 1,8% ежегодно. Наибольший вклад внесут разработчики ПО (19% прироста), менеджеры, маркетологи и специалисты по работе с клиентами.
Для понимания масштаба: в последние годы рост производительности в США составлял 1,8% (с 2019 года) и около 2% в долгосрочном историческом тренде. Таким образом, даже без учёта дальнейшего прогресса ИИ он мог бы удвоиться. Демонстрируется график исторического падения производительности, что делает выводы исследования особенно примечательными.
Ограничения исследования
Anthropic подчёркивает, что результаты не являются прогнозом, а скорее аналитической моделью на основе текущих возможностей технологий. Среди ключевых ограничений:
- модель не видит, что делает пользователь вне диалога, и не учитывает попытки проверки качества;
- не все задачи представлены в выборке — физический труд, медицина, процессы с ограниченной цифровизацией встречаются редко;
- ИИ может ускорять одни этапы и не влиять на другие, превращая их в «узкие места» — пример таких несбалансированных задач приведён в PDF документе.
Что это значит для рынка труда
Исследование демонстрирует: уже сегодня ИИ активно используется в сложных профессиональных задачах — от финансового анализа до подготовки образовательных программ. И если модели продолжат развиваться теми же темпами, то изменения в структуре труда могут оказаться глубокими: ускорение одних задач и зависимость от «неподдающихся автоматизации» этапов способно перестроить роли сотрудников в компаниях.
Впрочем, окончательный эффект зависит не только от технологий, но и от скорости адаптации организаций, регуляторов и самих работников.


