A Nvidia abre uma parceria de IA a longo prazo com a Deepinfra, que angaria 107 milhões de dólares na sua ronda B para criar uma «fábrica de tokens»

GLM-1,87%

A startup de IA DeepInfra anunciou a conclusão de uma ronda B de 1,07 mil milhões de dólares, liderada pela 500 Global e por Georges Harik, engenheiro de início de carreira na Google, com a participação de investidores estratégicos como a NVIDIA, a Samsung Next e a Supermicro. De acordo com a informação oficial, o investimento será usado para expandir a capacidade de centros de dados globais, de modo a enfrentar os custos de computação e os estrangulamentos de eficiência que surgem quando as aplicações de IA passam do “treino de modelos” para o “raciocínio em grande escala”.

A procura por inferência de IA dispara e torna-se um gargalo crítico para a implementação pelas empresas

À medida que a IA avança para a comercialização, o foco das cargas de trabalho das empresas tem-se deslocado de forma significativa. A DeepInfra observou que, desde a ronda A, o volume de Token processado na sua plataforma aumentou 25 vezes, o que indica que a Inference (inferência) se tornou a principal força motriz das cargas de trabalho de IA das empresas. Atualmente, a eficácia dos modelos open source já consegue rivalizar com sistemas proprietários, reduzindo drasticamente a barreira à inovação. No entanto, com a chegada de aplicações de agentes autónomos (Agentic Systems), uma única tarefa pode exigir a ativação de centenas de chamadas a modelos. Como as plataformas de cloud tradicionais e generalistas não foram desenhadas com base nas necessidades de inferência, as empresas enfrentam desafios como custos operacionais demasiado elevados e latência imprevisível, fazendo com que a inferência se torne uma restrição sistémica das cargas de trabalho.

Integração vertical da pilha para otimizar a eficiência da economia de tokens

A DeepInfra adota uma estratégia de integração vertical e defende que a inferência de elevada performance só pode ser alcançada através de um desenho coordenado entre hardware, rede e software. O projeto tem, no passado, experiência no desenvolvimento e operação da imo com 200 milhões de utilizadores em sistemas distribuídos globais, e atualmente já criou oito infraestruturas-base de GPU nos EUA. Em comparação com serviços que alugam capacidade a terceiros, a DeepInfra tem controlo total da pilha, desde o nível do chip até à interface de API. Este design permite otimizar tarefas de geração de tokens “sempre online”, garantindo que, ao executar cargas de trabalho de inteligência artificial, consegue fornecer uma latência mais previsível do que em ambientes de cloud generalistas.

Deepinfra como parceiro de infraestruturas para o ecossistema de IA aberto de longo prazo da NVIDIA

A Deepinfra é um parceiro de infraestruturas de base no início do ecossistema de IA aberto da NVIDIA, apoiando o modelo Nemotron, a arquitetura de agente NemoClaw e o software de inferência NVIDIA Dynamo. A implantação inicial das GPUs Blackwell e a integração que se aproxima da Vera Rubin e do Dynamo farão com que a eficiência custo-benefício da inferência aumente até 20 vezes.

Deepinfra disponibiliza modelos open source com capacidade competitiva

No controlo de custos, a DeepInfra, através de operações de hardware otimizadas, suporta mais de 190 modelos open source, procurando oferecer preços altamente competitivos no mercado. Como exemplo, no modelo de inferência open source GLM-5, o seu preço híbrido é de 1,24 dólares por milhão de tokens, abaixo do valor médio da indústria em cerca de 20 %. Para “modelos de pensamento” que exigem grande quantidade de computação interna de tokens, a plataforma desenvolveu um mecanismo de cache, com preços com desconto para texto estático repetido na entrada, reduzindo efetivamente os custos de conversas multi-etapas e de pipelines de Retrieval-Augmented Generation (RAG). Para responder às exigências de segurança das empresas, a DeepInfra disponibiliza uma API compatível com a OpenAI e compromete-se com a retenção zero de dados, além de obter certificações SOC 2 e ISO 27001, assegurando que os developers podem aplicar os modelos diretamente em ambientes de produção.

A importância de infraestruturas dedicadas de inferência para a próxima fase da IA

O apoio do mercado de investimento à DeepInfra reflete que a importância das infraestruturas de IA está a ultrapassar, progressivamente, o próprio modelo. Tony Wang, sócio-gerente da 500 Global, afirmou que, em ambientes de desenvolvimento impulsionados por agentes, os developers precisam de plataformas dedicadas com maior flexibilidade, velocidade e fiabilidade. Após a conclusão desta ronda de financiamento, o financiamento total da DeepInfra já atinge 133 milhões de dólares, e os fundos serão usados para a expansão da capacidade de computação a nível global, o aprofundamento das ferramentas para developers e o apoio a modelos de agentes autónomos da próxima geração. À medida que a quantidade de tokens processada semanalmente se aproxima dos 5 biliões de tokens, a DeepInfra pretende construir uma “fábrica de tokens” altamente eficiente, fornecendo uma base sustentável de capacidade computacional para aplicações em escala de IA por parte das empresas.

Esta artigo A parceria de longa data de IA aberta da NVIDIA com a Deepinfra, que obteve 1,07 mil milhões de dólares na ronda B, para criar uma “fábrica de tokens”, surgiu pela primeira vez em Cadeia News ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário