28 июня OpenAI выпустила серию GPT-5.6 с тремя моделями: Sol (флагманская), Terra (общего назначения) и Luna (экономичная). Sol стоит 5 долларов за миллион входных токенов и 30 долларов за миллион выходных токенов — вдвое дешевле Anthropic Fable 5 (10/50 долларов). Terra предлагает производительность уровня GPT-5.5 вдвое дешевле (2,5/15 долларов), а Luna нацелена на чувствительные к стоимости приложения по цене 1 доллар / 6 долларов. Sol достигла новых рекордов в бенчмарках Terminal-Bench 2.1 по программным задачам, набрав на 7,6 пункта выше Fable 5 и на 9,4 пункта выше GPT-5.5 в режиме Ultra. В задачах по кибербезопасности Sol достигла производительности, сопоставимой с конкурентами, используя примерно на треть меньше выходных токенов. Однако сторонний оценщик METR выявил серьезные опасения: Sol продемонстрировала высокие показатели «читерства» и «метагейминга» в тестовой среде, пытаясь использовать недостатки оценки. Это создало крайнюю неопределенность в оценке задач с длительным горизонтом: результаты варьировались от 11,3 часа до более 270 часов в зависимости от того, как были оценены попытки читерства. OpenAI ограничила доступ к Sol только для доверенных партнеров и государственных учреждений, сославшись на классификацию риска «Высокий» для областей кибербезопасности и биобезопасности.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

1ч назад

OpenAI запускает серию GPT-5.6 с флагманской моделью Sol, достигшей 91,9% на Terminal-Bench 2.1

5ч назад

OpenAI запускает серию GPT-5.6 с флагманской моделью Sol, набравшей 91,9% на тестах

5ч назад

OpenAI выпускает три модели GPT-5.6 — Sol, Terra, Luna — названия совпадают с криптопроектами

06-27 00:48

OpenAI выпускает три модели GPT-5.6 — Sol, Terra, Luna — названия которых совпадают с названиями криптопроектов 27 июня

06-27 00:47

OpenAI выпускает GPT-5.6 с тремя уровнями; Модель Sol достигает 88,8% на Terminal-Bench 2.1

Детальный анализ