A Alibaba Cloud muda para IA agentica, as receitas de tokens disparam 15x em 5 meses

BABA-0,9%

Abertura

A Alibaba Cloud anunciou, a 20 de maio de 2026, no Alibaba Cloud Summit, uma atualização abrangente do seu sistema de tecnologia full-stack, posicionando-se para a era de AI Agentic. A empresa apresentou novos produtos, incluindo o website do produto Qwen Cloud, o chip de IA auto-desenvolvido Pangu M890 integrado no servidor supernó Panjiu AL128, e o modelo de topo Qwen3.7-Max. Esta mudança reflete um alteração fundamental nos principais utilizadores da computação em nuvem: como os agentes de IA operam 24 horas por dia, de forma contínua, com demandas infinitas de IA e de nuvem, a Alibaba Cloud está a reestruturar toda a sua pilha tecnológica, desde chips da camada de base, a infraestruturas de Agentic Cloud, modelos e, até, plataformas de inferência. De acordo com executivos da empresa, as receitas de IA baseadas em tokens estão na mira para substituir a ECS (Elastic Compute Service) como a maior linha de produtos da Alibaba Cloud, assinalando uma transição de serviços de nuvem tradicionais para modelos de consumo orientados por IA. Nos últimos cinco meses, a receita diária média da Alibaba Cloud em tokens cresceu aproximadamente 15 vezes, sinalizando a aceleração desta transformação.

Série de chips Pangu AI e infraestrutura de hardware

A Alibaba Cloud disponibilizou um agressivo roadmap de chips centrado no Pangu M890, um chip de IA unificado para treino e inferência de próxima geração, com desempenho três vezes superior ao da geração anterior Pangu M810E. O servidor supernó Panjiu AL128, alimentado pelo M890 e equipado com o chip de interligação ICN Switch 1.0 desenvolvido internamente, permite que 128 chips de IA funcionem como uma única unidade de computação, com latência ponto-a-ponto abaixo de 150 nanossegundos, endereçando inferência massiva e concorrente e exigências de treino de grandes modelos em cenários de agentes.

A Alibaba Cloud divulgou o roadmap da série de chips Pangu, comprometendo-se a lançar uma nova geração por ano nos próximos dois anos, com lançamentos planeados dos chips Pangu V900 e Pangu J900, oferecendo maior capacidade de computação. Até à data, a série Pangu já foi entregue num total acumulado de 560.000 chips, servindo mais de 400 clientes em mais de 20 indústrias.

Crescimento das receitas em tokens e posicionamento no mercado

A Alibaba Cloud detém a maior quota no mercado MaaS de grandes modelos (Model-as-a-Service). A empresa referiu que as receitas em tokens registaram uma aceleração significativa a partir deste ano, sendo o período anterior caracterizado apenas como um “prólogo”. De acordo com executivos da empresa, a receita diária média em tokens aumentou aproximadamente 15 vezes nos últimos cinco meses, refletindo a adoção rápida de serviços de IA. Esta trajetória de crescimento indica que as métricas baseadas em tokens estão a tornar-se na unidade de medição principal para a expansão das receitas da Alibaba Cloud.

Redesign dos produtos de nuvem para cargas de trabalho de agentes

A Alibaba Cloud está a reestruturar fundamentalmente os seus produtos de nuvem para operarem como sistemas nativos para agentes. Os produtos tradicionais de nuvem foram concebidos tendo em mente operadores humanos, mas as cargas de trabalho de agentes apresentam características incompatíveis com a computação em nuvem convencional: elasticidade irregular, ciclos de vida curtos e escalonamento instantâneo. A empresa tem realizado a “Skill-ification”, a transformação MCP (Model Context Protocol) e a padronização de CLI (Command Line Interface) de todos os produtos de nuvem, permitindo que os agentes invoquem capacidades da nuvem como chamadas de função padronizadas.

Esta filosofia de redesign levou a Alibaba Cloud a lançar o Qwen Cloud, um novo website do produto, separado do portal principal da Alibaba Cloud. Na página inicial do website é apresentada uma única instrução de prompt legível por agentes. Todas as capacidades de serviço de modelos ficam encapsuladas como Skills padronizadas e ferramentas de CLI, permitindo que os agentes interpretem a instrução, adquiram capacidades completas da plataforma e invoquem autonomamente as funções necessárias. Segundo a liderança da empresa, o juízo central que sustenta esta iniciativa é que os principais utilizadores da computação em nuvem futura serão agentes de IA e não engenheiros humanos, o que exige uma mudança fundamental na arquitetura do produto e no desenho da interação.

Capacidades e desempenho do modelo Qwen3.7-Max

A Alibaba Cloud lançou o Qwen3.7-Max como o seu mais recente modelo de linguagem de grandes dimensões de topo. No ranking dos testes globais “blind” de grandes modelos da Arena, o Qwen3.7-Max ocupa o primeiro lugar entre os modelos chineses, ultrapassando Kimi-K2.6, DeepSeek-v4-pro e GLM-5.1, enquanto se aproxima dos níveis de desempenho dos modelos mais fortes da GPT, Claude e Gemini.

Um estudo de caso em produção demonstra a capacidade autónoma do modelo para além do benchmarking padrão. No chip Pangu M890 — uma plataforma com a qual o modelo nunca tinha contactado durante o treino — o Qwen3.7-Max concluiu, por si só, uma tarefa de implementação e otimização de um kernel de computação de IA com qualidade de produção ao longo de 35 horas, usando apenas uma descrição de tarefa, alcançando um desempenho 10 vezes superior ao da versão de referência oficial. Este caso exemplifica uma mudança fundamental nos objetivos de desenho do modelo: de otimizar para alinhamento com preferências humanas para otimizar para conclusão autónoma de tarefas. De acordo com a liderança da divisão de grandes modelos da Alibaba, o Qwen3.7-Max foi desenhado para servir como o núcleo inteligente de agentes, equipado com capacidades de planeamento autónomo, iteração contínua e colaboração entre ferramentas.

A Alibaba Cloud identificou a AI Coding (programação orientada por IA) como um domínio de aplicação primário. A empresa refere que a AI Coding cria novas aplicações, ao mesmo tempo que moderniza código legado acumulado ao longo de décadas. Executivos da empresa salientaram que a AI Coding tem como alvo despesas de desenvolvimento de software e de subcontratação externa que, anteriormente, estavam fora da captura de receitas dos serviços de nuvem tradicionais, representando uma expansão significativa da oportunidade de mercado endereçável.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário