OpenAI dévoile sa première puce IA Jalapeño, avec des performances comparables à celles du Blackwell de NVIDIA.

OpenAI a officiellement dévoilé le 24 juin son premier processeur AI développé en interne, le Jalapeño, développé conjointement avec Broadcom. Positionné comme un processeur d’inférence optimisé pour les grands modèles de langage (LLM), il est fabriqué par TSMC, tandis que l’électronique canadienne Celestica construit les systèmes de serveurs. Le PDG de Broadcom, Hock Tan, a déclaré que les performances du Jalapeño sont comparables à celles du Blackwell de Nvidia.

Spécifications techniques du Jalapeño : tape-out en 9 mois, conception optimisée pour l’inférence et données de test précoces

Selon un article officiel d’OpenAI, le Jalapeño est un processeur spécialement conçu pour les besoins d’inférence, et non une puce d’entraînement. Il n’a fallu que 9 mois entre la conception initiale et le tape-out, un délai rendu possible grâce à l’utilisation par OpenAI de ses propres modèles d’IA pour optimiser la conception de la puce.

Richard Ho, responsable du matériel chez OpenAI, a souligné que la puce peut exécuter efficacement les charges de travail critiques ; les premiers tests officiels montrent une efficacité par watt nettement supérieure aux produits comparables sur le marché. Le PDG de Broadcom, Hock Tan, a déclaré que les performances sont comparables au Blackwell de Nvidia et au TPU de Google.

Déclaration de performance du PDG de Broadcom et défi de marge sur la HBM

Hock Tan a livré des échantillons physiques du Jalapeño à Sam Altman ; tout en reconnaissant que, étant donné que les puces AI nécessitent beaucoup de mémoire à large bande passante (HBM), la marge bénéficiaire actuelle des puces personnalisées est inférieure à celle de produits comme les commutateurs réseau. La HBM est principalement fournie par SK Hynix et Samsung Electronics.

Il a également souligné que la demande des clients pour la puissance de calcul explose et devrait se poursuivre jusqu’en 2028. Greg Brockman, président d’OpenAI, a déclaré à CNBC que le degré d’accélération du développement de puces par les modèles d’IA est surprenant, et que l’entreprise a un besoin urgent de puissance de calcul.

Stratégie de calcul diversifiée d’OpenAI : collaborations avec Broadcom, AWS Trainium, AMD et Cerebras

Le Jalapeño fait partie de la stratégie de calcul diversifiée d’OpenAI. Ben Barringer, responsable de la recherche technologique chez l’investisseur Quilter Cheviot, analyse que les géants de la tech diversifient activement leurs sources de puces pour éviter la dépendance à un seul fournisseur. Outre sa collaboration avec Broadcom, OpenAI a également conclu un accord avec AWS pour utiliser les puces Trainium, et a établi des partenariats avec AMD et Cerebras, qui sera cotée en mai 2026.

OpenAI et Broadcom ont précédemment annoncé leur intention de collaborer avec des partenaires comme Microsoft dans les années à venir pour déployer des centres de données d’une capacité de 10 GW. Ce lancement de puce survient à un moment critique où OpenAI se prépare pour son introduction en bourse (IPO), avec une valorisation attendue sur le marché pouvant atteindre 1 billion de dollars. La puce développée en interne aide à établir un avantage technologique full-stack et à réduire les coûts de service, soutenant ainsi des attentes de valorisation plus élevées.

Questions fréquentes

Quelle est l’origine et la signification du nom Jalapeño ?

Le Jalapeño est un piment mexicain au goût extrêmement piquant. Le média technologique Engadget qualifie cela de « début épicé » pour OpenAI dans le domaine des puces ; BusinessKorea souligne que ce nom révèle également qu’OpenAI cible directement le marché des infrastructures de calcul AI monopolisé par Nvidia. Dans l’industrie des semi-conducteurs et du logiciel, les équipes de R&D ont l’habitude d’utiliser des noms de nourriture, de plantes ou de lieux comme noms de code. L’équipe d’OpenAI a utilisé ce nom de code pendant les 9 mois de développement secret et l’a conservé lors du lancement.

Le Jalapeño est-il une puce d’inférence ou d’entraînement, et quelle est la différence ?

Selon les rapports, le Jalapeño est un processeur d’inférence, optimisé pour les besoins d’inférence des grands modèles de langage, et non une puce d’entraînement. L’inférence est le processus par lequel un modèle AI génère des réponses en utilisation réelle, plus sensible à l’efficacité énergétique et à la latence ; l’entraînement nécessite une densité de calcul très élevée. Les premiers tests du Jalapeño montrent une efficacité par watt nettement supérieure aux produits d’inférence comparables.

Quel est l’impact du développement de sa propre puce par OpenAI sur Nvidia ?

Selon l’évaluation de l’analyste Ben Barringer, les géants de la tech (y compris OpenAI) diversifient activement leurs sources de puces pour éviter la dépendance à un seul fournisseur. Le lancement du Jalapeño permet à OpenAI de réduire sa dépendance aux GPU de Nvidia, en combinant des approvisionnements diversifiés comme AWS Trainium, AMD et Cerebras pour construire un portefeuille de calcul plus flexible. Cependant, l’échelle et la maturité du Jalapeño en sont encore au stade de déploiement préliminaire, et il est difficile de remplacer complètement la position de marché de Nvidia à court terme.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire