Gate News mensagem, 24 de abril — O DeepSeek V4-Pro e o DeepSeek V4-Flash foram oficialmente lançados e open-source em 24 de abril, com o comprimento de contexto de processamento significativamente expandido de 128K para 1M, representando um aumento de capacidade de quase 10 vezes. A Huawei Computing anunciou que os seus produtos de supernó Ascend suportam totalmente os modelos da série DeepSeek V4 através de uma colaboração estreita entre tecnologias de chips e de modelos.
O Huawei Ascend 950 alcança uma implementação de inferência dos modelos DeepSeek V4 com elevada taxa de transferência e baixa latência através de técnicas de kernel fundido e paralelismo multi-stream para reduzir a sobrecarga de computação de Attention e acessos à memória. Para o DeepSeek V4-Pro com entrada de 8K, o Ascend 950 atinge aproximadamente 20ms de TPOT com 4,700 TPS de throughput Decode por cartão; para o DeepSeek V4-Flash com entrada inferior a 8K, atinge aproximadamente 10ms de TPOT com 1,600 TPS de throughput. A série de supernós Ascend A3 também alcança compatibilidade total, com implementações de referência de treino fornecidas para uma afinação rápida. Com base no supernó Ascend A3 de 64 cartões com modo EP grande, o DeepSeek V4-Flash atinge mais de 2,000 TPS de throughput Decode por cartão em cenários de entrada/saída 8K/1K utilizando o motor de inferência vLLM. As linhas completas de produtos Huawei Ascend A2, A3 e 950 suportam tanto o DeepSeek V4-Flash como o V4-Pro.
A Huawei Cloud anunciou compatibilidade de primeira-mão com o DeepSeek V4, fornecendo aos programadores serviços de token de API com um clique através da sua plataforma MaaS. A Huawei Cloud otimizou as capacidades da camada de sistema, da camada de operadores e da camada de cluster para garantir adaptação rápida do modelo e uma implementação de alto desempenho. Empresas incluindo Kingsoft WPS e 360 já integraram o novo modelo da DeepSeek via a Huawei Cloud.
A Cambricon também anunciou compatibilidade Day 0 com o DeepSeek V4-Flash e o V4-Pro baseada no framework de inferência vLLM, com código de adaptação open-source para a comunidade GitHub. A Cambricon tinha anteriormente alcançado adaptação de primeira-mão quando o DeepSeek V3.2 foi lançado no ano passado, após ter realizado uma optimização profunda de desempenho colaborativa entre software e hardware nos modelos da série DeepSeek.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A Google Planeia Investir Até $40 Mil Milhões na Anthropic, Compromete 5+ Gigawatts de Poder de Computação
Mensagem da Gate News, 24 de Abril — De acordo com fontes do mercado, a Google planeia investir até $40 mil milhões na Anthropic. O investimento começará com um montante inicial de $10 mil milhões em numerário, seguido de até mais $30 mil milhões, condicionado ao cumprimento de marcos especificados.
A Google também vai fornecer à Anthropic, no âmbito da parceria, pelo menos 5 gigawatts de poder de computação.
GateNews29m atrás
O regulador suíço FINMA alerta que a ferramenta de IA Mythos da Anthropic representa risco financeiro
Mensagem do Gate News, 24 de abril — a Autoridade de Supervisão dos Mercados Financeiros da Suíça (FINMA) afirmou que permitir que os bancos adoptem de forma rápida e conveniente a ferramenta de inteligência artificial da Anthropic Mythos representaria riscos sérios para o
GateNews52m atrás
Fere AI conclui ronda de financiamento de $1,3M liderada pela Ethereal Ventures
Mensagem do Gate News, 24 de Abril — A Fere AI, uma plataforma de agentes de negociação de activos digitais com base em IA, anunciou a conclusão de uma ronda de financiamento de $1,3 milhões liderada pela Ethereal Ventures, com a participação da Galaxy Vision Hill e da Kosmos Ventures.
A plataforma suporta redes cross-chain, incluindo a Ethereum,
GateNews2h atrás
A Anthropic reverte as alterações do Claude Code após quebra de qualidade; todas as correções concluídas
Mensagem de Gate News, 24 de abril — A Anthropic reconheceu uma recente quebra na qualidade do Claude Code e confirmou que todos os problemas relacionados foram resolvidos através de rollbacks e correções. Os problemas tiveram origem em três ajustes de produto e de prompts realizados entre o início e meados de abril.
Em 4 de março, a
GateNews3h atrás
Cofundador da NeoSoul Kaelan: A Indústria de IA Deve Permitir que Existam Brinquedos; a Inovação Frequentemente Começa como Produtos Experimentais
Mensagem do Gate News, 24 de Abril — Num recente fórum em Hong Kong sobre finanças inteligentes encriptadas, o cofundador da NeoSoul, Kaelan, partilhou conhecimentos sobre como avaliar projectos de IA numa fase inicial, numa indústria de IA em rápida evolução. Para além de avaliar os produtos actuais, as equipas devem demonstrar a capacidade de acompanhar as capacidades dos modelos subjacentes, afirmou.
GateNews4h atrás
Meta vai implementar dezenas de milhões de chips AWS Graviton5 num acordo multianual de vários mil milhões
Mensagem do Gate News, 24 de abril — A Meta assinou um acordo plurianual com a Amazon Web Services para implementar dezenas de milhões de processadores Graviton5 na sua infraestrutura de IA, tornando a Meta um dos maiores clientes globais da AWS em Graviton. O acordo, com a duração de três a cinco anos, tem um valor de milhares de milhões de d
GateNews4h atrás