Segundo as informações, investigadores da NVIDIA e do MIT lançaram o Lightning OPD (Offline On-Policy Distillation), um novo quadro de pós-treino para modelos de linguagem de grande dimensão que elimina a necessidade de manter um modelo “teacher” em funcionamento durante o treino. Ao pré-computar, offline, as log-probabilidades do modelo “teacher”, o quadro melhora a eficiência do treino em 4x, libertando todos os recursos da GPU para o treino do modelo “student”.
Em testes com 8 GPUs NVIDIA H100, o Lightning OPD conseguiu destilar com sucesso o Qwen3-30B-A3B-Base (um modelo MoE com 30 mil milhões de parâmetros) e atingiu 71,0 no benchmark AIME 2024, enquanto o OPD standard ficou sem memória no mesmo hardware. Para o modelo Qwen3-8B mais pequeno, o quadro exigiu apenas 30 horas de GPU para alcançar 69,9 pontos.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A plataforma B.AI adiciona 8.756 utilizadores em 11 de maio, com o DeepSeek-V4 a impulsionar 60% do consumo de tokens
De acordo com a B.AI, a plataforma adicionou 8.756 novos utilizadores a 11 de maio, enquanto a adoção de pagamentos da Stripe entre os utilizadores pagadores de referência atingiu 69,0%, refletindo uma melhoria na retenção de programadores tradicionais e utilizadores de nível produção. Os modelos da série DeepSeek-V4 responderam por quase 60% do consumo de tokens, tirando partido de capacidades de latência ultra-baixa, alta concorrência e elevada capacidade de processamento para servir como moto
GateNews13m atrás
Esta semana, catalisadores macroeconómicos em grande escala: uma leitura panorâmica desde a publicação do CPI até à análise do projecto de lei CLARITY
Em meados de maio de 2026, o mercado de criptomoedas está a atravessar uma janela macroeconómica extremamente rara e sensível. Os dados do CPI dos EUA de abril foram divulgados a 12 de maio, o encontro de cúpula entre Chuan e Xi em Pequim está marcado para 13 a 15 de maio e, entretanto, a Comissão de Banca do Senado vai analisar o projeto de lei CLARITY (Lei de Clareza do Mercado de Ativos Digitais) a 14 de maio. Três acontecimentos independentes, mas altamente interligados, concentram-se e ganh
GateInstantTrends36m atrás
A startup de voz por IA Vapi conclui $50M Série B liderada pela Peak XV Partners
De acordo com a TechCrunch, a Vapi, uma startup de voz com IA, concluiu uma ronda de financiamento Série B no valor de 50 milhões de dólares, liderada pela Peak XV Partners, com uma avaliação pós-financiamento de aproximadamente 500 milhões de dólares. A Ring, subsidiária da Amazon, colocou a Vapi a tratar de 100% das suas chamadas recebidas após avaliar mais de 40 fornecedores de voz com IA, ajudando a impulsionar a ronda de financiamento.
GateNews1h atrás
A precisão do GPT-5.4 cai de 100% para 54% no ARC-AGI após repetida sumarização de memória
De acordo com Beating, um estudo recente sobre memória de agentes, de Dylan Zhang, estudante de doutoramento na Universidade de Illinois, concluiu que a sumarização repetida das experiências do modelo pode degradar o desempenho em vez de melhorá-lo. Em tarefas ARC-AGI, o GPT-5.4 obteve 100% de precisão em 19 problemas sem memória, mas após múltiplas rondas de compressão de memória com base em trajectórias de solução correctas, a precisão caiu para 54%. De forma semelhante, em tarefas de compras
GateNews1h atrás
A OpenAI alarga o Programa de Acesso Confiável a dezenas de empresas europeias a 12 de maio
De acordo com relatos de 12 de maio, a OpenAI anunciou planos para expandir o seu Programa de Acesso Confiável para dezenas de empresas europeias.
GateNews1h atrás
Transformers em versão real! A ยู樹科技 lançou o primeiro veículo robótico de produção em série a nível mundial, com um preço de 570 mil dólares
A empresa chinesa de robótica Unitree Robotics, com sede em Hangzhou, lançou a 12 de maio o seu mais recente produto, o GD01 — um mecha robótico tripulado que consegue alternar livremente entre modos de marcha humanoide bípede e escalada quadrúpede. Pode dizer-se que é como se as imagens de ficção científica dos filmes “Transformers” e “Pacific Rim” tivessem sido transportadas para o mundo real. O lançamento não é apenas uma curiosidade tecnológica; mostra também a rapidez com que a indústria ch
ChainNewsAbmedia2h atrás