Message de Gate News, 23 avril — Google a annoncé le 22 avril qu’il publiera cette année des puces TPU de huitième génération distinctes pour l’entraînement et l’inférence, en remplacement de sa conception précédente combinée. La démarche vise les charges de travail d’agents IA et offre aux clients de Google Cloud une alternative au matériel Nvidia.
La puce d’entraînement offre 2,8 fois les performances du TPU Ironwood de septième génération de Google au même prix, tandis que la puce d’inférence est 80% plus rapide et intègre 384 MB de SRAM, soit trois fois la quantité présente dans Ironwood. La séparation des capacités d’entraînement et d’inférence reflète un changement dans la manière dont les entreprises optimisent pour des besoins de calcul différents.
L’initiative s’appuie sur un partenariat de long terme avec Broadcom et Anthropic. Anthropic prévoit d’utiliser environ 3,5 gigawatts de calcul TPU via Broadcom à partir de 2027, Broadcom assurant la fabrication des puces et les composants réseau jusqu’en 2031. Anthropic, la startup d’IA à l’origine de Claude, a vu récemment son chiffre d’affaires annualisé dépasser $30 milliard. Pendant ce temps, Apple, Microsoft, Meta et Amazon élargissent elles aussi leurs efforts de puces IA sur mesure afin de réduire leur dépendance à Nvidia, qui demeure le leader du marché.
Related News
Les expéditions de Nvidia H200 vers la Chine retardées en raison d’un accord d’approbation, désaccords sur les conditions
Google Ironwood TPU : 10 fois les performances + quatre partenaires contre Nvidia
Google dévoile Deep Research Max : prise en charge de MCP, accès aux données privées des entreprises