L’IA alimente un « super cycle » des semi-conducteurs : les puces de stockage passent au premier plan

Zhang Haixiao, gérant de fonds actions chez Yongyingfund, a déclaré lors d’une récente apparition sur le programme « Chief Connection » du média The Paper que le « super cycle » actuel des semi-conducteurs est fondamentalement différent des cycles précédents en raison d’un changement des sources de la demande : elle provient davantage de la production d’IA que de facteurs liés aux stocks. D’après Zhang, la demande en aval n’a pas diminué malgré la hausse des prix ; au contraire, les dépenses d’investissement continuent d’augmenter, et même les hausses de prix des tokens n’ont pas réussi à freiner la demande, créant une chaîne de transmission particulièrement fluide dans l’ensemble de l’industrie.

Explosion de la demande en aval redessinant les dynamiques offre-demande de stockage

Zhang a retracé une trajectoire d’évolution claire de la demande, amorcée par la sortie de ChatGPT fin 2022. Dans un premier temps, la demande matérielle s’est concentrée sur des points d’entraînement visant des performances extrêmes, avec la mémoire à bande passante élevée (HBM) qui a atteint pour la première fois une application à grande échelle. Lorsque les modèles ont introduit de nouveaux paradigmes comme le raisonnement « chain-of-thought » et des contextes étendus pour améliorer les résultats, la demande s’est déplacée vers les endpoints d’inférence, où la consommation de tokens a enregistré une croissance à deux chiffres en pourcentage d’une année sur l’autre.

Au second semestre 2025, les agents d’IA capables d’appeler des outils de manière autonome et d’accomplir des tâches complexes sont passés du concept à la réalité, augmentant encore davantage la dépendance au stockage. Sur la base de cette série d’explosions de demande, Zhang a conclu : « Le point de départ de la hausse des prix des puces de stockage lors de ce cycle se situe au T3 2025. » Il a attribué le renversement de l’écart offre-demande exclusivement à la croissance explosive côté demande en aval, un jugement corroboré par des divulgations financières d’entreprises récentes faisant état de sorties de bénéfices solides dans le matériel d’IA, notamment parmi les produits liés à la hausse des prix des puces de stockage.

Distinction fondamentale par rapport aux cycles précédents de semi-conducteurs

Zhang a souligné que le « super cycle » actuel diffère fondamentalement du cycle de 2019-2021, la différence structurelle la plus critique étant un changement fondamental des caractéristiques de la demande. La période 2019-2021 correspondait à un cycle typique tiré par les stocks : la croissance de la demande finale provenait principalement des besoins matériels liés au travail à domicile et des perturbations de la chaîne d’approvisionnement déclenchant des comportements d’accumulation. Par conséquent, à partir du milieu de 2022, l’industrie est rapidement tombée dans un « scénario de déstockage et de forte baisse rapide des prix des puces ».

« Cette vague de demande part des endpoints de production d’IA », a déclaré Zhang. « L’aval n’a pas réduit ses achats à cause des hausses de prix ; au contraire, les dépenses d’investissement continuent d’augmenter. Même les hausses de prix des tokens n’ont pas réussi à freiner la demande, et toute la chaîne de transmission est extrêmement fluide. » Il a en outre indiqué que les dépenses d’investissement mondiales liées à l’IA devraient atteindre 700 milliards de dollars en 2026, et que ce chiffre continue d’être révisé à la hausse.

En parallèle, des mesures de retenue côté offre ont considérablement amplifié l’écart offre-demande. Les principaux fournisseurs de stockage prévoient environ une hausse de 50% de leurs dépenses d’investissement en 2026, mais il existe un décalage temporel important entre l’investissement en capital et la formation effective de l’offre. De plus, les nouveaux financements visent principalement le stockage haute performance spécifique à l’IA, tandis que l’augmentation générale des capacités de stockage attend encore une mise en service ultérieure.

Séquence de bénéfices pour la chaîne industrielle : deux voies distinctes

Zhang a divisé les bénéfices de la chaîne industrielle en deux parcours : d’abord, la chaîne de ventes des fabricants d’équipements d’origine (OEM), des fabricants de modules et des entreprises de conception, qui connaissent une prospérité en premier—ce qui est déjà validé par des rapports financiers récents ; ensuite, la chaîne d’expansion de l’équipement, des matériaux et de la construction des installations, où la transmission de la prospérité s’effectue avec un décalage relatif, dans une progression graduelle.

À noter, la position prudente des OEM en amont sur l’offre se reflète dans des ajustements stratégiques. Zhang a révélé que « les fabricants d’équipements d’origine en amont, en tant qu’entreprises très capitalistiques préoccupées par le risque que la demande future soit inférieure aux attentes et entraîne des pertes, signent activement des accords d’approvisionnement à long terme (LTA) avec les clients afin de verrouiller la demande future ».

Les puces de stockage passent au centre de la scène

L’évolution de l’architecture technologique redessine la hiérarchie de la valeur matérielle. Zhang a expliqué ce changement avec le « principe du tonneau » : sous l’architecture de Von Neumann, le calcul, le stockage et la communication entrées-sorties constituent trois fonctions centrales, avec un élément qui devient le goulot d’étranglement de performance à différents stades. En 2023, la puissance de calcul était la contrainte évidente, mais lorsque la demande des endpoints d’inférence a explosé, le goulot s’est rapidement déplacé vers l’extrémité stockage.

Les cycles d’itération du matériel s’accélèrent. Avant 2022, la HBM était généralement mise à jour tous les trois à quatre ans ; depuis 2023, ce cycle s’est comprimé en « mises à niveau sur deux ans ». Cette tendance à l’accélération se retrouve aussi sur les puces de calcul et les puces de communication. En parallèle, l’évolution de l’architecture de calcul ramène le CPU au centre. Zhang a cité des dynamiques industrielles indiquant que le ratio GPU vers CPU à l’avenir pourrait passer de l’actuel 8:1 à 4:1, puis vers 2:1 voire 1:1, ce qui augmente directement la demande en mémoire et impose des exigences plus élevées en vitesse de transmission aux puces de mémoire et d’interface—des mises à niveau qui continueront de pousser les prix unitaires des produits à la hausse.

Progrès du semi-conducteur domestique et suivi des risques

Au-delà de la synchronisation des cycles mondiaux, l’avancement des semi-conducteurs domestiques représente un autre axe d’investissement clé. Zhang a noté que les fabricants d’équipements d’origine en amont de puces de stockage domestiques ont réalisé des progrès remarquables : leur part de marché est passée de zéro à environ 10%, devenant une force incontournable de l’industrie. « L’amélioration des capacités des fabricants d’équipements d’origine stimulera le développement dans les secteurs de la conception en milieu et en aval, ainsi que dans les secteurs de l’équipement et des matériaux en amont. Chaque transfert précédent dans l’histoire de l’industrie mondiale du stockage a entraîné des mises à niveau complètes de la chaîne d’approvisionnement dans les régions locales, et cette fois-ci ne fera pas exception. Toutefois, il s’agit d’un processus destiné à s’étendre dans le temps, et non de quelque chose accompli du jour au lendemain. »

Concernant les risques potentiels, Zhang a identifié des variables clés des deux côtés, offre et demande. Côté offre, le suivi du calendrier de libération des capacités de production est crucial : les fabricants maximisent d’abord la capacité existante, puis ajoutent des équipements dans les installations actuelles (généralement 6 à 12 mois pour une production effective), avant de construire de nouvelles installations (habituellement 2 à 3 ans pour une capacité réellement opérationnelle). Il a mis en garde : « La majeure partie de la libération de capacité devrait se concentrer au cours des deux prochaines années, ce qui nécessite une surveillance continue pour vérifier si le rythme de libération dépasse les attentes. »

Côté demande, l’attention doit se porter sur le rythme des dépenses d’investissement liées à l’IA et sur les évolutions technologiques. Zhang a conclu : « Les dépenses d’investissement liées à l’IA sont l’indicateur de suivi le plus direct, tandis que l’émergence de nouvelles technologies ouvre entièrement de nouveaux espaces de marché, ce qui influence les prédictions de dépenses d’investissement de la part des fabricants de modèles et des géants d’Internet—et tout cela nécessite une observation soutenue. »

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire