OpenAI выпускает AI-модель GPT-5.5 с нативным использованием компьютера

CryptoFrontier

OpenAI официально выпустила GPT-5.5 23 апреля 2026 года — новую ИИ-модель, предназначенную для понимания намерений пользователя в реальных приложениях благодаря возможностям нативного использования компьютера. Модель включает универсальные нативные возможности, которые позволяют ей перемещаться по приложениям на рабочем столе, нажимать кнопки и вводить текст для многошаговых рабочих процессов, как говорится в объявлении OpenAI.

GPT-5.5 объединяет нативное использование компьютера с расширенным рассуждением, автономно навигируя по программным инструментам, необходимым для высокоуровневых профессиональных задач. Окно контекста модели ~1,1 млн токенов позволяет ей обрабатывать массивные финансовые датасеты, которые ранее требовали ручной нарезки на фрагменты. Финансовая команда OpenAI использовала GPT-5.5 для проверки 24,771 налоговых форм K-1 (71,637 страниц) и завершила задачу на две недели быстрее, чем в предыдущем году.

Показатели производительности

GPT-5.5 набрала 88,5% на внутренних задачах моделирования для инвестиционного банкинга и 60% на бенчмарке FinancialAgent v1.1, обойдя GPT-5.4 на четыре пункта. Модель достигла 84,9% на GDPval, что проверяет способности агентов выполнять конкретную аналитическую работу в 44 профессиях. На OSWorld-Verified, измеряющем автономные real computer operations модели, она достигла 78,7%. GPT-5.5 набрала 98% на Tau2-bench Telecom, где тестируются крайне сложные сценарии обслуживания клиентов.

Сотрудник команды Go-to-Market подтвердил, что автоматизация еженедельных бизнес-отчетов сэкономит примерно 5–10 часов ручной работы в неделю.

Генерация кода и оптимизация системы

OpenAI сообщает, что GPT-5.5 использовалась для помощи в написании кода для собственной инфраструктуры, обслуживающей модель. Модель достигла «System-Level Optimization», анализируя шаблоны производственного трафика, чтобы писать пользовательские эвристики балансировки нагрузки, увеличив собственную скорость генерации токенов на 20%.

В разработческом тесте модели предложили «переархитектурировать markdown editor», и она вернула почти полностью готовый стек из 12 диффов с минимальными правками со стороны человека. OpenAI отмечает, что новая модель находит правильный ответ за меньшее число раундов и использует на 40% меньше токенов для тех же задач Codex по сравнению с GPT-5.4.

Дэн Шиппер, основатель и генеральный директор Every, описал GPT-5.5 как первую модель для кодинга, у которой есть «серьезная концептуальная ясность». Шиппер протестировал GPT-5.5 после того, как он и его лучший инженер провели несколько дней, отлаживая проблему, возникшую после запуска в приложении. По словам Шиппера, GPT-5.5 достигла того, что GPT-5.4 не смогла: она проанализировала сломанный код и сгенерировала переписывание, которое инженер в итоге выбрал. Модель может «помнить» и сопоставлять с перекрестными ссылками целые библиотеки информации, не теряя своего места, уменьшая «галлюцинации», которые преследовали более ранние версии.

Автономные возможности и самокоррекция

OpenAI утверждает, что GPT-5.5 оптимизирована для «самокоррекции» и автономности. Она лучше интерпретирует неоднозначные инструкции и использует интерфейс компьютера (clicking, typing, browsing) для выполнения целей без вмешательства человека. Модель становится особенно полезной, когда агенту нужно управлять программным обеспечением, вести процессы с нагрузкой на терминал или рассуждать по всему кодовому базису (500K+ tokens) с высокой точностью извлечения.

Функция мышления GPT-5.5

В ChatGPT OpenAI представила «GPT-5.5 Thinking», которую компания называет тем, что открывает более быстрые ответы на более сложные проблемы. Функция дает более умные, более краткие ответы, чтобы помочь пользователям эффективнее выполнять сложные задачи. Она особенно сильна в профессиональной работе вроде синтеза и анализа информации, кодинга и задач с большим объемом документов — например, исследований, особенно при использовании плагинов.

Ранние тестировщики GPT-5.5 Pro сообщают о значительном улучшении как качества, так и сложности работы, с которой ChatGPT может справляться. Меньшая задержка делает GPT-5.5 Pro более практичным для требовательных задач, чем GPT-5.4 Pro. Ответы GPT-5.5 Pro хорошо структурированы, релевантны, полезны и точны, с особенно сильной производительностью в праве, data science, бизнесе и образовании.

Ценообразование и доступность

Хотя базовая версия доступна, наиболее способная версия (GPT-5.5 Pro) стоит $100 в месяц для индивидуальных подписчиков. Для бизнеса стоимость за токен выходных данных примерно вдвое выше, чем у GPT-5.4, даже при 40% более высокой эффективности токенов. Общие расходы для развертываний агентного масштаба могут быть существенными. Растет обеспокоенность тем, что самые продвинутые возможности рассуждения станут «предметом роскоши», доступным только хорошо финансируемым компаниям, потенциально расширяя разрыв в продуктивности между крупными предприятиями и небольшими стартапами.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
AprDaydreamvip
· 3ч назад
Надеюсь, что официальные органы предоставят возможность проверки действий/воспроизведения, иначе при возникновении проблем будет трудно привлечь к ответственности, особенно в случае автоматического управления активами.
Посмотреть ОригиналОтветить0
PaperHandsProvip
· 3ч назад
Реальное понимание намерений — это настоящая сложность, надеюсь, больше не будет неловких ситуаций, когда вы хотите забронировать билет, а он изменяет ваше резюме.
Посмотреть ОригиналОтветить0
Half-SectionedSucculentvip
· 3ч назад
Есть небольшое ожидание, и немного опасения: возможность щелкнуть мышью равносильно выполнению многих задач, которые требуют «человеческих кликов», поэтому системы управления рисками и антифрод должны быть усовершенствованы.
Посмотреть ОригиналОтветить0
ACalmnessWithAHintOfPomelovip
· 3ч назад
Эта волна также повлияет на Web3, если автоматизированные операции в цепочке, процессы подписи и взаимодействие с кошельками смогут выполняться без швов, форма продукта изменится.
Посмотреть ОригиналОтветить0
StarsInTheGlassDomevip
· 3ч назад
API и цены пока не спешите, сначала посмотрите, сможет ли он выдержать всплывающие окна, многозадачность и сетевые колебания в сложной настольной среде.
Посмотреть ОригиналОтветить0
GateUser-b665e41cvip
· 3ч назад
Чувствуется, что эволюция идет от «умения говорить и писать» к «умению делать и сдавать», а следующий шаг — обеспечить ей лучшее запоминание и управление задачами.
Посмотреть ОригиналОтветить0
LintCollectorvip
· 3ч назад
Если действительно возможно связать приложения: поиск информации в браузере → обработка в Excel → подготовка презентации в PPT → отправка по электронной почте, тогда это будет полный цикл работы в офисе.
Посмотреть ОригиналОтветить0
DegenWithNotebookvip
· 3ч назад
Наконец-то появилась нативная десктопная версия? Теперь действительно придется играть роль «цифрового стажера».
Посмотреть ОригиналОтветить0