Mensagem do Gate News, 24 de abril — o engenheiro da OpenAI, Clive Chan, levantou objeções detalhadas ao capítulo de recomendações de hardware no relatório técnico V4, chamando-o de “surpreendentemente medíocre e propenso a erros” em comparação com a aclamada versão V3. A orientação de hardware da V3, que incluía sessões de Q&A que se tornaram o tópico de discussão mais popular na conferência acadêmica ISCA, ofereceu recomendações específicas alinhadas com padrões de interconexão da indústria. A V4, por outro lado, é muito mais vaga.

Chan contestou sistematicamente três recomendações-chave. Em consumo de energia, o relatório sugere que a otimização de software permite que os chips executem computação, armazenamento e comunicação com capacidade total simultaneamente, e recomenda que os fabricantes de chips reservem margem de energia adicional. Chan argumenta que isso é contraproducente: o poder total do chip é limitado por limitações do processo físico, então reservar mais margem de energia apenas reduz a frequência de operação, diminuindo, por fim, o desempenho computacional. No que diz respeito à transferência de dados de GPU para GPU, o relatório defende um modelo pull—no qual as GPUs buscam ativamente os dados—em vez de um modelo push, citando alto overhead de notificação nas operações push. Chan contesta isso, afirmando que o pull na verdade é mais lento e que capacidades aprimoradas do adaptador de rede seriam preferíveis. No entanto, os dois podem estar discutindo camadas diferentes do problema: o relatório aborda o overhead do mecanismo de notificação, enquanto Chan se refere à própria latência de transmissão.

Quanto às funções de ativação, o relatório recomenda substituir o SwiGLU por funções mais simples para reduzir a carga computacional. Chan não vê mérito nisso, observando que o Sonic MoE já demonstrou desempenho ideal usando SwiGLU. Chan suspeita que o DeepSeek possa ter “enfraquecido deliberadamente esta seção.”

Ver fonte

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

DeepSeek V4-Flash entra no Ollama Cloud, servidor nos EUA: Claude Code, OpenClaw conectados em um clique

Notícias do setor de IA Ferramentas e apps de IA

Ollama Cloud colocou DeepSeek V4-Flash à venda, com inferência em servidores nos EUA, oferecendo três conjuntos de comandos de um clique para conectar ao Claude Code, OpenClaw e Hermes. V4-Flash/V4-Pro adotam uma arquitetura MoE, com suporte nativo a contexto de 1M, e reduzem custos com compressão Token-wise + atenção esparsa DSA; em cenários de 1M, o FLOPs por token cai 27% e o cache KV diminui 10%. A API é compatível com OpenAI ChatCompletions e Anthropic, facilitando a alternância entre diferentes fluxos de trabalho, reduzindo custos e riscos de soberania de dados.

ChainNewsAbmedia19m atrás

Web3 AI Infrastructure AIW3 Capta $2M na Rodada Seed Liderada pela Buffalo Capital

Agente de IA Notícias do setor de IA

Mensagem do Gate News, 24 de abril — A plataforma de infraestrutura de IA Web3 AIW3 anunciou a conclusão de uma rodada de captação seed de $2 milhões. A rodada foi liderada pela Buffalo Capital, com GalaXin Capital e Three-stones Ventures participando como co-investidoras. A AIW3 está fazendo a transição para um paradigma de execução on-chain de Agente-como-Serviço

GateNews40m atrás

Cohere Adquire Empresa Alemã de IA Aleph Alpha e Garante $600M Investimento para Expansão na Europa

Notícias do setor de IA

Mensagem do Gate News, 24 de abril — A empresa canadense de IA Cohere anunciou planos para adquirir a empresa alemã de IA Aleph Alpha para fortalecer sua presença na Europa. A Schwarz Group, apoiadora da Aleph Alpha, planeja investir $600 milhões na rodada de financiamento Série E da Cohere. A rodada de financiamento deve ser concluída em 202

GateNews1h atrás

Xpeng e Xiaomi lideram avanço de IA embarcada no Beijing Auto Show

Notícias do setor de IA

Mensagem da Gate News, 24 de abril — Montadoras chinesas exibiram sistemas avançados de IA embarcada no Beijing Auto Show em 24 de abril, à medida que o país acelera sua estratégia AI Plus e busca maior independência de semicondutores estrangeiros. A Xpeng demonstrou estacionamento controlado por voz que permite que os motoristas emitam comandos falados em vez de selecionar manualmente localizações.

GateNews2h atrás

Ex-engenheiro da Seed da ByteDance: A iteração de IA da ByteDance leva seis meses vs. os três meses do Google

Notícias do setor de IA

Mensagem do Gate News, 24 de abril — Zhang Chi, ex-engenheiro da equipe Seed da ByteDance e atual professor assistente na Universidade de Pequim, revelou no podcast "Into Asia" que a ByteDance exige aproximadamente seis meses para concluir um ciclo completo de treinamento de pré-treinamento de modelo de linguagem grande (

GateNews2h atrás

Naver lança beta do AI Tab à medida que o Google Gemini entra no mercado de buscas da Coreia do Sul

Notícias do setor de IA

Mensagem do Gate News, 24 de abril — A Naver anunciou o início de um beta fechado para o AI Tab, seu novo recurso de busca conversacional, após o lançamento do Gemini pela Google no Chrome na Coreia do Sul. O AI Tab aparecerá ao lado das abas de busca existentes da Naver, oferecendo aos usuários um espaço dedicado para consultas conversacionais

GateNews3h atrás

Comentário

0/400

Sem comentários