Entrevista com o CEO da Micron: "Armazenamento" é o gargalo negligenciado da IA, a escassez de oferta pode continuar até após 2026

robot
Geração de resumo em curso

Autor original: Li Jia

Fonte do texto original: Wall Street Journal

「A competição de IA não é apenas uma corrida de poder de processamento, mas também de armazenamento。」 O CEO da Micron Technology, Sanjay Mehrotra, fez essa avaliação.

No podcast "A Bit Personal" em 5 de junho, Sanjay participou de uma entrevista profunda rara gravada em sua casa. Além das percepções habituais do setor, essa conversa com um toque pessoal também o levou a falar abertamente sobre sua trajetória de crescimento, influências familiares e escolhas profissionais.

A IA ainda está em estágio muito inicial, essa é uma das principais avaliações de Sanjay.

Na sua opinião, à medida que modelos grandes, agentes de IA e aplicações de raciocínio continuam evoluindo, a IA precisa de mais do que apenas maior poder de processamento; ela também precisa de uma maior "capacidade de memória".

Janelas de contexto mais longas, modelos de maior escala e o consumo crescente de tokens estão impulsionando a demanda por armazenamento de forma contínua.

A essência da IA é dados, e os dados dependem do armazenamento, portanto, o armazenamento se tornará uma das infraestruturas mais importantes na melhoria das capacidades de IA.

Ao mesmo tempo, a oferta não está suficientemente preparada. Sanjay aponta que o setor de armazenamento atualmente enfrenta não uma simples discrepância de oferta e demanda de curto prazo, mas restrições estruturais de fornecimento. Produtos avançados de armazenamento consomem mais wafers, e construir novas fábricas de wafers geralmente leva de três a quatro anos, com uma escalada de capacidade subsequente igualmente longa.

Mais importante ainda, com o avanço dos nós tecnológicos, o aumento na capacidade de armazenamento por wafer está diminuindo. Ele acredita que a escassez de oferta no setor pode persistir até após 2026.

Ao explicar por que a tecnologia de armazenamento tem sido subestimada por tanto tempo, Sanjay afirma abertamente: "As pessoas frequentemente confundem memória com algo fácil de fabricar, mas não sabem o quão difícil é produzir memória." Desde física, química até ciência de materiais, garantir que cada um dos trilhões de bits funcione corretamente na produção em larga escala é uma tarefa tecnicamente extremamente desafiadora. Ele acredita que a competição de IA também é uma competição de armazenamento, e esse fato tem sido negligenciado pelo mercado por muito tempo.

De uma perspectiva mais de longo prazo, Sanjay acredita que a lógica fundamental de sucesso de empresas e indivíduos não mudou. Seja impulsionando um plano de investimento de 200 bilhões de dólares ou liderando a Micron através dos ciclos do setor de armazenamento, as palavras-chave que ele repete são resiliência, disciplina e visão de longo prazo. Investimentos devem ser baseados em dados e fundamentos, e os líderes precisam entender claramente as tendências do setor, bem como aprofundar-se nos detalhes técnicos.

Assim como aprendeu com seu pai, o sucesso exige tanto perseverança quanto a capacidade de aproveitar oportunidades em momentos críticos.

Os principais pontos da entrevista com Sanjay Mehrotra, CEO da Micron Technology, são os seguintes:

O armazenamento é o gargalo subestimado da IA, cuja dificuldade de fabricação e valor estratégico estão muito além do que o mercado reconhece. A IA está se estendendo de uma "corrida de poder de processamento" para uma "corrida de armazenamento". A expansão do tamanho dos modelos, o aumento da janela de contexto e o consumo explosivo de tokens fazem com que a IA dependa não apenas de maior poder de processamento, mas também de uma maior "capacidade de memória". Sem armazenamento suficiente e largura de banda, nem o maior poder de processamento pode ser plenamente utilizado.

As restrições estruturais na oferta determinam que a escassez de armazenamento não é uma flutuação de curto prazo, mas um estado de longo prazo. Produtos avançados de armazenamento consomem mais wafers, e a construção de novas fábricas de wafers leva de três a quatro anos, com uma escalada de capacidade igualmente longa. Além disso, o avanço dos nós tecnológicos está reduzindo o aumento na produção por wafer. Com a discrepância entre oferta e demanda, a escassez de fornecimento deve persistir pelo menos até após 2026.

As pessoas sempre subestimam a dificuldade de fabricar memória, mas essa é justamente a barreira mais profunda do setor. Desde física, química até ciência de materiais, garantir que cada um dos trilhões de bits funcione perfeitamente na produção em larga escala é uma tarefa de complexidade técnica extrema. A dificuldade de fabricação de chips de armazenamento é comparável à de qualquer outro semicondutor, e em muitos aspectos, até mais difícil.

O sucesso vem de resiliência, disciplina e visão de longo prazo, e não de julgamentos de tendências de curto prazo. Seja impulsionando um investimento de 200 bilhões de dólares ou atravessando ciclos do setor de armazenamento, os líderes precisam entender claramente as tendências do setor e aprofundar-se nos detalhes técnicos. Assim como seu pai, que não desistiu após ser recusado três vezes no visto, o sucesso exige tanto perseverança quanto a capacidade de aproveitar oportunidades em momentos críticos.

O armazenamento está se tornando a espinha dorsal da IA

Ao falar sobre a posição atual do setor de armazenamento na história, Sanjay afirma abertamente: "Tenho mais de 45 anos de experiência nesse setor. Este é o momento mais empolgante que já vivi na indústria."

Ele explica ainda mais o significado estratégico do armazenamento para a IA:

"Sem semicondutores, não há IA. E o armazenamento é a espinha dorsal da IA, sendo a base fundamental que sustenta a evolução contínua da IA."

Na sua visão, o papel do armazenamento não é mais apenas uma peça dentro de um dispositivo, mas sim uma carga direta da "inteligência" em si: "Hoje, o armazenamento não serve apenas para fazer o dispositivo funcionar, ele sustenta a própria 'inteligência' da IA, ajudando a tornar a inteligência artificial mais inteligente."

À medida que o tamanho dos modelos aumenta, a demanda por raciocínio explode e os agentes de IA (Agent AI) surgem rapidamente, a lógica do crescimento da demanda por armazenamento é bastante clara para Sanjay: "À medida que os modelos ficam maiores, a demanda por raciocínio aumenta, a IA evolui do treinamento para a inferência, do data center para a borda, e a necessidade de armazenamento só aumenta — ela precisa de maior capacidade, maior desempenho e menor consumo de energia."

Ele também destaca a dependência do armazenamento na economia de tokens: "Quando olhamos para a economia de tokens, ela também depende fortemente do armazenamento. Com o aumento do uso de tokens, a janela de contexto fica maior, a demanda por cache KV aumenta, e os próprios modelos ficam maiores — a IA não precisa apenas de capacidade de cálculo, mas também de 'lembrar'."

A escassez de oferta deve persistir até após 2026

Para a questão mais preocupante do mercado, a oferta e demanda, Sanjay dá uma avaliação clara: a escassez de oferta no setor deve continuar até após 2026, e por um período bastante longo.

Ele explica as restrições estruturais na oferta: "Construir uma fábrica de wafers leva muito tempo. Desde o início da construção até a produção do primeiro lote de wafers, geralmente leva de três a quatro anos. Depois, é preciso continuar escalando a produção, aumentando gradualmente a capacidade."

Mais importante, o aumento na dificuldade tecnológica está comprimindo a eficiência de produção por wafer: "Cada avanço tecnológico na produção traz uma melhora na eficiência, ou seja, o aumento de bits por wafer, está diminuindo."

Sanjay revela que a Micron já previa essa tendência por volta de 2021.

Naquela época, a participação de armazenamento de alta largura de banda (HBM) na indústria era inferior a 1%, mas eles já previam que várias gerações de HBM consumiriam uma quantidade enorme de wafers, impactando significativamente o cenário de oferta: "Por isso, em 2021, já dissemos que a indústria precisaria construir novas fábricas de wafers do zero. Mas ninguém previu a velocidade com que a IA explodiria."

Quanto à preocupação do mercado de que a oferta possa superar a demanda e gerar excesso de capacidade, Sanjay não descartou essa possibilidade, mas reforçou que a demanda de IA ainda está em estágio inicial, e o crescimento estrutural de longo prazo é a base de sua confiança: "Do lado da demanda, tudo ainda está em uma fase muito inicial. Acreditamos que a IA ainda tem um longo caminho a percorrer."

A lógica por trás do investimento de 200 bilhões de dólares: disciplina

Anunciando um investimento de 200 bilhões de dólares nos EUA para construir uma cadeia de produção de armazenamento, a Micron tomou uma das decisões de capital mais comentadas na indústria de semicondutores nos últimos tempos. Quanto à lógica fundamental dessa decisão, Sanjay enfatiza repetidamente a palavra "disciplina":

"Investimento nunca é feito de forma cega; deve ser disciplinado e baseado em dados. Você precisa entender a tecnologia, entender as aplicações, e para onde essas aplicações estão indo. Além disso, deve trabalhar de perto com os clientes, entender para onde eles querem ir e qual papel a Micron desempenhará nesse processo."

Ele explica ainda a disciplina na execução: "Hoje, estamos investindo na construção de várias fábricas de wafers do zero. A primeira etapa é construir as instalações e infraestrutura. Quando essas fábricas estiverem prontas, ao instalar os equipamentos e formar a capacidade real, manteremos a disciplina — avaliando continuamente as previsões de demanda, o quanto o avanço tecnológico pode impulsionar o crescimento, e como as necessidades de produto vão evoluir."

Quando questionado se já teve dúvidas sobre o próprio projeto, Sanjay responde de forma direta:

"Não temos dúvidas. Acreditamos absolutamente na oportunidade do armazenamento. Hoje, isso está muito claro. Mas, no nosso negócio, o mais importante é manter a capacidade de adaptação e agilidade."

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado