Alibaba Cloud passe à l’IA agentique, les revenus en tokens explosent de 15× en 5 mois

BABA-0,89%

Ouverture

Alibaba Cloud a annoncé une mise à niveau complète de son système de technologie full-stack le 20 mai 2026, lors du Alibaba Cloud Summit, se positionnant pour l’ère de l’IA agentique. La société a présenté de nouveaux produits, dont le site web du produit Qwen Cloud, la puce IA auto-développée Pangu M890 intégrée au serveur supernode Panjiu AL128, et le modèle phare Qwen3.7-Max. Ce changement traduit une modification fondamentale des principaux utilisateurs du cloud : alors que les agents IA fonctionnent 24 heures sur 24 en continu, avec des besoins en IA et en cloud infinis, Alibaba Cloud restructure l’ensemble de sa pile technologique, des puces de couche basse, à l’infrastructure Agentic Cloud, aux modèles, jusqu’aux plateformes d’inférence. D’après des responsables de l’entreprise, les revenus de l’IA basés sur des tokens seraient prêts à remplacer l’ECS (Elastic Compute Service) en tant que plus grande ligne de produits d’Alibaba Cloud, marquant une transition des services cloud traditionnels vers des modèles de consommation pilotés par l’IA. Au cours des cinq derniers mois, le revenu quotidien moyen en tokens d’Alibaba Cloud a augmenté d’environ 15 fois, signalant l’accélération de cette transformation.

Série de puces d’IA Pangu et infrastructure matérielle

Alibaba Cloud a publié une feuille de route agressive des puces centrée sur la Pangu M890, une puce IA unifiée entraînement-inférence de nouvelle génération dont les performances sont trois fois supérieures à celles de la puce Pangu M810E de génération précédente. Le serveur supernode Panjiu AL128, alimenté par la M890 et équipé de la puce d’interconnexion ICN Switch 1.0 auto-développée, permet à 128 puces IA de fonctionner comme une seule unité de calcul, avec une latence pair-à-pair inférieure à 150 nanosecondes, répondant aux besoins d’inférence massivement concurrente et d’entraînement de grands modèles dans des scénarios d’agents.

Alibaba Cloud a dévoilé la feuille de route de la série de puces Pangu, s’engageant à publier une nouvelle génération chaque année au cours des deux prochaines années, avec des sorties prévues des puces Pangu V900 et Pangu J900 offrant une capacité de calcul accrue. À ce jour, la série Pangu a été expédiée à un total cumulé de 560 000 puces, au service de plus de 400 clients dans plus de 20 secteurs.

Croissance des revenus en tokens et position sur le marché

Alibaba Cloud détient la plus grande part sur le marché MaaS (Model-as-a-Service) des grands modèles. La société a indiqué que les revenus en tokens ont connu une accélération significative à partir de cette année, la période précédente étant qualifiée de simple « prologue ». D’après des responsables de l’entreprise, le revenu quotidien moyen en tokens a augmenté d’environ 15 fois sur les cinq derniers mois, reflétant l’adoption rapide des services IA. Cette trajectoire de croissance indique que les indicateurs basés sur des tokens deviennent l’unité de mesure principale pour l’expansion des revenus d’Alibaba Cloud.

Reconception des produits cloud pour les charges de travail d’agents

Alibaba Cloud reconçoit fondamentalement ses produits cloud pour fonctionner comme des systèmes natifs d’agents. Les produits cloud traditionnels ont été conçus en pensant aux opérateurs humains, mais les charges de travail d’agents présentent des caractéristiques incompatibles avec le cloud conventionnel : élasticité irrégulière, cycles de vie courts et montée en charge instantanée. La société a entrepris la Skill-ification, la transformation MCP (Model Context Protocol) et la standardisation des CLI (Command Line Interface) de tous les produits cloud, permettant aux agents d’invoquer les capacités cloud comme des appels de fonctions standardisés.

Cette philosophie de reconception a poussé Alibaba Cloud à lancer Qwen Cloud, un nouveau site web produit distinct du portail principal d’Alibaba Cloud. Sur la page d’accueil, le site affiche une seule instruction d’invite lisible par un agent. Toutes les capacités de service de modèles sont encapsulées sous forme de Skills et d’outils CLI standardisés, permettant aux agents d’analyser l’instruction, d’acquérir l’ensemble des capacités de la plateforme et d’invoquer de manière autonome les fonctions requises. D’après les responsables de l’entreprise, le jugement central à l’origine de cette initiative est que les principaux utilisateurs du futur cloud seront des agents IA plutôt que des ingénieurs humains, ce qui nécessite un changement fondamental de l’architecture produit et du design d’interaction.

Capacités et performances du modèle Qwen3.7-Max

Alibaba Cloud a publié Qwen3.7-Max comme son dernier modèle phare de grands langages. Dans les classements du test à l’aveugle global des grands modèles de Arena, Qwen3.7-Max arrive en première position parmi les modèles chinois, dépassant Kimi-K2.6, DeepSeek-v4-pro et GLM-5.1, tout en se rapprochant des niveaux de performance des modèles les plus forts de GPT, Claude et Gemini.

Une étude de cas en production démontre la capacité autonome du modèle au-delà du simple benchmarking standard. Sur la puce Pangu M890 — une plateforme que le modèle n’avait jamais rencontrée pendant l’entraînement — Qwen3.7-Max a achevé de façon autonome une tâche d’implémentation et d’optimisation de kernel de calcul IA prête pour la production en plus de 35 heures, en n’utilisant qu’une description de tâche, atteignant 10 fois les performances de la version de référence officielle. Ce cas illustre un changement fondamental des objectifs de conception du modèle : passer de l’optimisation de l’alignement aux préférences humaines à l’optimisation de l’accomplissement autonome de tâches. D’après la direction du département des grands modèles d’Alibaba, Qwen3.7-Max a été conçu pour servir de cœur intelligent aux agents, doté de capacités de planification autonome, d’itération continue et de collaboration entre outils.

Alibaba Cloud a identifié le Coding IA (programmation pilotée par l’IA) comme un domaine d’application principal. La société indique que le Coding IA crée de nouvelles applications tout en modernisant simultanément un code hérité accumulé au fil de décennies. Les responsables de l’entreprise ont souligné que le Coding IA cible des dépenses de développement logiciel et d’externalisation externe qui étaient auparavant en dehors de la captation des revenus des services cloud traditionnels, représentant une expansion significative de la taille du marché adressable.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire