Отчёт Anthropic: вероятность победы в решениях ИИ выросла до 64%, оптимизация кода в 52 раза

2026-06-05 02:20:35

Anthropic 4 июня опубликовала отчёт, в котором раскрыла результаты тестирования своей модели Mythos Preview при поддержке решений в AI-исследованиях: в 64% случаев она принимала решения лучше, чем человеческие исследователи, тогда как в аналогичных тестах в 2024 году её победная доля составляла лишь 22%. В стандартных тестах по оптимизации тренировочного кода для небольших моделей ИИ Mythos Preview достигла 52-кратного ускорения.

Методика и данные тестов для исследовательских решений

Опубликованная Anthropic схема тестов: команда показывала Claude записи диалогов о том, какие человеческие исследователи собираются сделать ошибочный выбор направления исследования, и спрашивала у ИИ: «Что дальше следует сделать». Mythos Preview в 64% случаев давала ответы, превосходящие ответы человеческих исследователей; в 2024 году победная доля в аналогичных тестах составляла 22%.

В отчёте Anthropic говорится, что этот результат «намекает на то, что ИИ уже начал обладать способностью направлять исследования высокого уровня», но при этом отмечается, что пока невозможно определить, есть ли у Claude глобальная способность к самостоятельному выбору «правильных исследовательских вопросов».

Данные об эффективности кода в отчёте Anthropic

Показатели эффективности кода у Anthropic:

Объём квартальной сдачи кода внутренними инженерами: в 8 раз выше среднего уровня за 2021–2025 годы

Успешность задач с открытым исходным кодом: за 6 месяцев выросла на 50 процентных пунктов, достигнув 76%

Скорость оптимизации тренировочного кода: Mythos Preview обеспечила 52-кратное ускорение

Сравнительный ориентир: Claude Opus 4 (май 2024) — в среднем около 3 раз; опытные инженеры обычно тратят 4–8 часов, чтобы реализовать примерно 4-кратное улучшение

В отчёте Anthropic отмечается, что некоторые внутренние инженеры считают качество кода Claude уже близким к человеческому уровню.

Research Division у Anthropic: подтверждена работа, потенциальное влияние на RSI

Anthropic объявила, что будет сотрудничать с внешними заинтересованными сторонами для создания «Anthropic Research Institute (Anthropic Institute)», ориентированного на изучение глубокого влияния мощных AI-систем.

В отчёте Anthropic говорится, что ускорение развития ИИ может дать положительный эффект для медицины, технологий и экономики, но также способно обострить проблему согласования (Alignment) и привести к риску «потери контроля (Loss of control)»; Anthropic называет это влияние «заслуживающим повышенного внимания».

Частые вопросы

Какова конкретная схема теста победной доли Mythos Preview в решениях?

Anthropic показывает Claude записи диалогов, в которых исследователь вот-вот пойдёт по неверному направлению исследования, и спрашивает: «Что дальше следует сделать», тестируя исследовательское мышление ИИ. Mythos Preview в 64% случаев даёт ответы лучше, чем у человеческих исследователей; по сравнению с 22% победной долей в аналогичных тестах в 2024 году за два года произошёл взрывной рост.

Что такое «рекурсивное самоулучшение (RSI)», упомянутое в отчёте Anthropic?

Рекурсивное самоулучшение (Recursive Self-Improvement) — это способность AI-системы самостоятельно разработать следующее поколение AI, которое окажется сильнее самой системы. В отчёте Anthropic от 4 июня 2026 года сказано, что этот процесс продвигается «сверх ожидаемой скорости», и одновременно признано, что пока нельзя точно определить, обладает ли Claude глобальной способностью самостоятельно выбирать «правильные исследовательские вопросы».

Каково позиционирование и цели Anthropic Research Institute?

Anthropic объявила, что создаст Anthropic Research Institute совместно с внешними заинтересованными сторонами и будет специально изучать глубокое влияние мощных AI-систем. Anthropic заявляет, что цель создания — обеспечить, чтобы люди могли сделать взвешенный выбор для будущего AI-технологий; конкретные направления исследований и сроки пока не раскрыты полностью.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

7ч назад

Anthropic подала конфиденциальные документы для IPO, а $965B оценка стоимости подталкивает $65B сбор средств

9ч назад

Anthropic призывает к глобальной паузе в разработке Frontier AI, 5 июня

12ч назад

Anthropic развернула модель ИИ Mythos в Национальном агентстве безопасности США (NSA) для киберопераций, задействованы 6 инженеров

Связанные статьи

Генеральный директор CrowdStrike: опасения по поводу ИИ-безопасности растут, но это может стать попутным фактором несмотря на приуроченность к 1-му кварталу

Oliver Grant9ч назад

Искусственный интеллект Anthropic Claude пишет 80% производственного кода по состоянию на май 2026 года

Oliver Grant14ч назад

Anthropic: 67% заблокированных аккаунтов использовали ИИ для подготовки к кибератакам

Oliver Grant06-04 06:11

Cloudflare: 34,1% мирового трафика приходится на ботов, рост AI-краулеров в 8 раз

Market Whisper06-04 03:44

Исследование Mind Lab LoRA: увеличение параметров на 0,12% повышает ИИ-память в 1,31 раза

Market Whisper06-04 02:35

комментарий

0/400

Нет комментариев