A OpenAI lança o modelo de IA GPT-5.5 com utilização nativa do computador

CryptoFrontier

A OpenAI lançou oficialmente o GPT-5.5 a 23 de abril de 2026, um novo modelo de IA concebido para compreender a intenção do utilizador em aplicações do mundo real através de capacidades nativas de utilização de computador. O modelo apresenta capacidades nativas de uso geral que lhe permitem navegar por aplicações de ambiente de trabalho, clicar em botões e escrever texto para fluxos de trabalho de múltiplas etapas, de acordo com o anúncio da OpenAI.

O GPT-5.5 combina a utilização nativa de computador com raciocínio avançado, navegando autonomamente pelas ferramentas de software necessárias para tarefas profissionais de alto nível. A janela de contexto de ~1,1 milhões de tokens do modelo permite-lhe processar enormes conjuntos de dados financeiros que antes exigiam segmentação manual. A equipa financeira da OpenAI usou o GPT-5.5 para rever 24.771 formulários fiscais K-1 (71.637 páginas) e concluiu a tarefa duas semanas mais cedo do que no ano anterior.

Métricas de Desempenho

O GPT-5.5 obteve 88,5% em tarefas internas de modelação de investimento bancário e 60% no benchmark FinancialAgent v1.1, superando o GPT-5.4 em quatro pontos. O modelo atingiu 84,9% no GDPval, que testa a capacidade dos agentes de produzir trabalho de conhecimento específico em 44 ocupações. No OSWorld-Verified, que mede as operações autónomas reais do computador do modelo, este chegou a 78,7%. O GPT-5.5 obteve 98% no Tau2-bench Telecom, que testa fluxos de serviço ao cliente extremamente difíceis.

Um funcionário da equipa de Go-to-Market confirmou que a automatização dos relatórios semanais de negócios poupará cerca de 5-10 horas de trabalho manual por semana.

Geração de Código e Otimização de Sistema

A OpenAI afirma que o GPT-5.5 foi usado para ajudar a escrever código para a sua própria infraestrutura de atendimento. O modelo alcançou “Otimização a Nível de Sistema” ao analisar padrões de tráfego de produção para escrever heurísticas personalizadas de balanceamento de carga, aumentando a sua própria velocidade de geração de tokens em 20%.

Num teste para programadores, foi pedido ao modelo que “rearquitetasse um editor de markdown” e este devolveu uma stack quase completa de 12 diffs com correção humana mínima. A OpenAI nota que o novo modelo chega à resposta correta em menos turnos e usa 40% menos tokens para as mesmas tarefas do Codex em comparação com o GPT-5.4.

Dan Shipper, fundador e CEO da Every, descreveu o GPT-5.5 como o primeiro modelo de codificação que tem “clareza conceptual séria”. Shipper testou o GPT-5.5 depois de ele e o seu melhor engenheiro terem passado dias a depurar um problema pós-lançamento numa aplicação. De acordo com Shipper, o GPT-5.5 alcançou aquilo que o GPT-5.4 não conseguiu: analisou o código avariado e produziu a reescrita que o engenheiro acabou por decidir. O modelo pode “lembrar” e fazer referência cruzada a bibliotecas inteiras de informação sem perder o seu lugar, reduzindo as “alucinações” que assombraram versões anteriores.

Capacidades Autónomas e Auto-Correção

A OpenAI afirma que o GPT-5.5 é otimizado para “auto-correção” e autonomia. É melhor a interpretar instruções ambíguas e a usar uma interface de computador (clicking, typing, browsing) para cumprir objetivos sem intervenção humana. O modelo torna-se particularmente útil quando é necessário que um agente opere software, gerencie fluxos de trabalho com muitos recursos de terminal, ou raciocine em toda uma base de código (500K+ tokens) com elevada precisão de recuperação.

Funcionalidade de Pensamento do GPT-5.5

No ChatGPT, a OpenAI introduziu o “GPT-5.5 Thinking”, que a empresa afirma desbloquear ajuda mais rápida para problemas mais difíceis. A funcionalidade fornece respostas mais inteligentes e mais concisas para ajudar os utilizadores a concluir tarefas complicadas de forma mais eficiente. Destaca-se em trabalho profissional como síntese e análise de informação, programação e tarefas com muito conteúdo documental, como pesquisa, especialmente ao usar plugins.

Os primeiros testers Pro do GPT-5.5 reportam uma melhoria massiva tanto na qualidade como na dificuldade do trabalho que o ChatGPT consegue assumir. A sua menor latência torna-o mais prático para tarefas exigentes do que o GPT-5.4 Pro. As respostas do GPT-5.5 Pro são bem estruturadas, relevantes, úteis e precisas, com um desempenho particularmente forte em direito, ciência de dados, negócios e educação.

Preços e Acessibilidade

Embora exista uma versão básica disponível, a versão mais capaz (GPT-5.5 Pro) custa $100/mês para subscritores individuais. Para empresas, o custo por token de saída é aproximadamente o dobro do GPT-5.4, mesmo com 40% mais eficiência de tokens. O gasto total para implementações em grande escala de agentes pode ser considerável. Há uma preocupação crescente de que o raciocínio no escalão mais alto se torne um “luxo” acessível apenas a empresas bem financiadas, potencialmente alargando o fosso de produtividade entre grandes empresas e pequenos startups.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
AprDaydreamvip
· 3h atrás
Espero que o oficial forneça um mecanismo de registo de ações/audição que seja auditável, caso contrário, será difícil responsabilizar, especialmente em contas de ativos operadas automaticamente.
Ver originalResponder0
PaperHandsProvip
· 3h atrás
A "compreensão de intenção" na aplicação prática é realmente o ponto difícil, espero que não volte a acontecer aquela situação embaraçosa de você querer reservar um bilhete de avião e ele alterar o seu currículo.
Ver originalResponder0
Half-SectionedSucculentvip
· 3h atrás
Estou um pouco ansioso, mas também um pouco assustado: poder clicar com o mouse equivale a poder fazer muitas coisas que só os "cliques humanos" podem fazer, e o controle de risco e a luta contra fraudes precisam ser aprimorados.
Ver originalResponder0
ACalmnessWithAHintOfPomelovip
· 3h atrás
Esta onda também terá impacto no Web3, se as operações automáticas na cadeia, os processos de assinatura e a interação com carteiras puderem ser feitos de forma integrada, a forma do produto mudará.
Ver originalResponder0
StarsInTheGlassDomevip
· 3h atrás
API e preços, primeiro não se apresse, primeiro veja se ele consegue resistir a janelas pop-up, múltiplas janelas e oscilações de rede em ambientes de desktop complexos.
Ver originalResponder0
GateUser-b665e41cvip
· 3h atrás
Sinto que a evolução de "saber falar e escrever" para "saber fazer e entregar" passa a próxima etapa de fornecer a ela uma melhor memória e gestão de tarefas.
Ver originalResponder0
LintCollectorvip
· 3h atrás
Se realmente for possível conectar entre aplicações: pesquisar no navegador → processar no Excel → criar apresentação no PowerPoint → enviar por email, então será um ciclo completo de fluxo de trabalho de escritório.
Ver originalResponder0
DegenWithNotebookvip
· 3h atrás
Finalmente chegou à operação nativa na área de trabalho? Agora realmente vai ser um "estagiário digital".
Ver originalResponder0