A utilização da GPU está baixa, em apenas 11%. O Musk estaria a alugar capacidade de computação para a Anthorpic para criar uma apresentação de avaliação visando uma futura listagem da SpaceX?

ChainNewsAbmedia

Analista da Citrini Research Jukan apontou recentemente que Musk terá alugado à Anthorpic capacidade de computação do xAI Memphis Colossus 1 para fazer avaliação para o IPO da SpaceX. Os investidores não gostam de «laboratórios de AGI que queimam dinheiro», mas gostam de «proprietários de infraestruturas de IA que cobram rendas de forma estável». Se a SpaceXAI conseguir, antes do IPO, provar que o xAI não é apenas uma área de I&D, mas sim uma plataforma cloud capaz de transformar capacidade de computação ociosa em receitas de aluguer com elevado rendimento, a narrativa do custo de capital e a avaliação do mercado podem mudar completamente.

E, além disso, este centro de dados, localizado em Memphis, no estado do Tennessee, mistura três gerações de GPUs: H100, H200 e GB200. Para treino distribuído em grande escala, uma arquitectura heterogénea causa um grave «straggler effect»: depois de as GPUs mais rápidas terminarem, ainda é preciso esperar que GPUs mais lentas ou com erros cheguem ao mesmo ponto para o cluster avançar para o passo seguinte. Mas o trabalho de inferência não precisa de uma sincronização tão alta de todas as GPUs como acontece no treino; as tarefas podem ser divididas de forma mais flexível por GPUs diferentes. A The Information tinha referido anteriormente que a utilização de GPUs do xAI terá chegado a apenas 11%.

O raciocínio central de Jukan é que Musk não está a entregar ao concorrente os melhores activos de treino; está antes a alugar o Colossus 1 — com arquitectura mista e menor eficiência de treino — enquanto mantém para si o Colossus 2, mais adequado para treinar modelos frontier. Por outras palavras, o xAI transforma «pontos dolorosos do treino» em «rendas de inferência».

Ajudar Musk a acelerar a corrida da Claude atrás da OpenAI em capacidade de computação

De acordo com o comunicado oficial do xAI, o Colossus 1 tem mais de 220 mil GPUs NVIDIA, incluindo H100, H200 e GB200; a Anthropic irá utilizar toda a capacidade de computação desse centro de dados. Jukan considera que o ponto-chave desta transacção não é apenas a Anthropic ficar com um supercomputador, mas sim que o significado de «capacidade de computação entregável» está a ser reavaliado.

No passado, a OpenAI conseguiu uma vantagem estrutural com um roadmap de capacidade de computação de longo prazo de 30GW, mas a Anthropic, num curto espaço de tempo, conseguiu captar de forma intensa recursos da AWS, Google, Broadcom, Google Cloud e SpaceXAI, fazendo com que os seus compromissos acumulados de capacidade de computação se aproximassem rapidamente. Mesmo que o volume total da Anthropic ainda fique abaixo do objectivo de 2030 da OpenAI, o Colossus 1 deverá entrar em funcionamento no curto prazo, dando-lhe capacidade imediata para expandir serviços de inferência.

Jukan acrescenta ainda que esta transacção também tem um forte significado estratégico. Elon Musk continua a ser um adversário-chave no processo judicial contra a OpenAI, mas ao mesmo tempo entrega 220 mil GPUs e 300MW de capacidade de computação a um dos mais fortes concorrentes da OpenAI, a Anthropic. Em outras palavras, Musk enfraquece a legitimidade moral da OpenAI no campo jurídico e, no campo do mercado, ajuda a Anthropic a conquistar receitas e utilizadores da OpenAI.

Porque é que o xAI está disposto a entregar o Colossus 1?

Jukan apresenta uma explicação mais técnica: para o xAI, o Colossus 1 pode não ser um cluster de treino ideal, mas sim mais adequado para ser alugado à Anthropic para inferência.

A razão está em que o Colossus 1 mistura três gerações de GPUs: H100, H200 e GB200. Para treino distribuído em grande escala, a arquitectura heterogénea provoca um grave «straggler effect»: depois de as GPUs mais rápidas concluírem o processamento, ainda é necessário esperar por GPUs mais lentas ou com erros, para que todo o cluster possa seguir para o passo seguinte. A The Information tinha referido anteriormente que a utilização das GPUs do xAI já terá chegado a 11%, em contraste com os mais de 40% de MFU conseguidos pela Meta e pela Google.

Mas para inferência, o problema é muito menor. O trabalho de inferência não precisa de fazer com que todas as GPUs estejam altamente sincronizadas como no treino; as tarefas podem ser repartidas de forma mais flexível por GPUs diferentes. Por isso, Jukan considera que, embora o Colossus 1 possa ser pouco eficiente como cluster de treino, como um cluster de inferência para um único inquilino pode tornar-se, afinal, um activo de elevado cash-flow.

A avaliação central de Jukan é que Musk não está a ceder ao concorrente os melhores activos de treino; está antes a alugar ao concorrente o Colossus 1, com arquitectura mista e eficiência de treino inferior, enquanto mantém para si o Colossus 2, mais adequado para treinar modelos frontier. Por outras palavras, o xAI transforma «pontos dolorosos do treino» em «rendas de inferência».

Ele estima que, considerando um preço de cerca de 2,6 dólares por GPU-hour, o aluguer do Colossus 1 à Anthropic possa gerar ao xAI/SpaceXAI cerca de 5 a 6 mil milhões de dólares de receita anual. Outras estimativas do mercado são mais conservadoras; por exemplo, a Fortune cita uma estimativa do analista Antoine Chkaiban, da New Street Research, segundo a qual a operação poderá render à SpaceX 3 a 4 mil milhões de dólares de receita anual e mais de 2,5 mil milhões de dólares de lucro em dinheiro.

Isto é crucial para a narrativa de IPO da SpaceXAI. Jukan considera que os investidores não gostam de «laboratórios de AGI que queimam dinheiro», mas gostam de «proprietários de infraestruturas de IA que cobram rendas de forma estável». Se a SpaceXAI conseguir provar antes do IPO que o xAI não é apenas uma área de I&D, mas sim uma plataforma cloud capaz de transformar capacidade de computação ociosa em receitas de aluguer com elevado rendimento, a narrativa do custo de capital e da avaliação no mercado pode mudar completamente.

Este artigo, no qual a utilização de GPUs chega a 11%, alega que Musk aluga capacidade de computação à Anthorpic para embrulhar uma valorização para o IPO da SpaceX? A estreia mais cedo foi na Cadeia de notícias ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário