Mensagem do Gate News, 29 de abril — Os pesos do modelo flash Ling-2.6 da Ant Group agora foram disponibilizados como código aberto, após anteriormente estarem disponíveis apenas via API. O modelo tem 104 bilhões de parâmetros no total, com 7,4 bilhões ativados por inferência, uma janela de contexto de 256K e licenciamento MIT. Versões de precisão BF16, FP8 e INT4 estão disponíveis no HuggingFace e no ModelScope.

O Ling-2.6-flash introduz melhorias híbridas de atenção linear sobre o Ling 2.0, atualizando o GQA original para uma arquitetura híbrida 1:7 MLA mais Lightning Linear, combinada com MoE altamente esparso. A eficiência da inferência excede significativamente a de modelos comparáveis: a velocidade máxima de geração chega a 340 tokens/s em 4 GPUs H20, com throughput de prefill e decode aproximadamente 4x maior do que em modelos comparáveis de código aberto. Benchmarks relacionados a agentes mostram forte desempenho: BFCL-V4, TAU2-bench, SWE-bench Verified (61.2%), Claw-Eval e PinchBench atingem ou se aproximam de níveis SOTA. Em toda a suíte de benchmarks do Artificial Analysis, o consumo total de tokens é de apenas 15 milhões. No AIME 2026, o modelo marcou 73,85%.

O site oficial da Ant Group também lista a versão carro-chefe Ling-2.6-1T (trilion-parameter) e a versão leve Ling-2.6-mini (lightweight version), embora, até a publicação, seus pesos permaneçam não lançados no HuggingFace, com apenas a série flash disponível para download.

Ver fonte

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Modelos da OpenAI para Migrar Gradualmente para o Chip Personalizado Trainium da Amazon, Diz Altman Ele Está 'Ansioso' por Isso

Notícias do setor de IA

Mensagem do Gate News, 29 de abril — Modelos da OpenAI executados no Amazon Web Services' Bedrock irão migrar gradualmente para o Trainium, o chip de IA personalizado da Amazon, de acordo com comentários recentes do CEO da OpenAI, Sam Altman, e de executivos da AWS. Atualmente, os modelos operam em um ambiente misto usando tanto GPUs e Tr

GateNews38m atrás

Altman: Precificação Baseada em Tokens Ficando Obsoleta à medida que o GPT-5.5 Muda o Foco para Conclusão de Tarefas em vez de Contagem de Tokens

Notícias do setor de IA

Mensagem do Gate News, 29 de abril — O CEO da OpenAI, Sam Altman, disse em uma entrevista com Ben Thompson na Stratechery que a precificação baseada em tokens não é um modelo viável a longo prazo para serviços de IA. Usando o GPT-5.5 como exemplo, Altman observou que, embora o preço por token seja significativamente mais alto do que o do GPT-5.4, o modelo usa muito menos tokens para concluir a mesma tarefa, o que significa que os clientes não se importam com a contagem de tokens — eles só se importam se a tarefa é concluída e qual é o custo total.

GateNews42m atrás

Sam Altman publica capturas de tela do Codex em dois modos, com as funções de escritório e programação oficialmente separadas

Notícias do setor de IA

O CEO da OpenAI, Sam Altman, publicou no dia 29 de abril no X uma captura de tela e um comunicado: o Codex está lançando uma nova interface de orientação; ao entrar pela primeira vez, os usuários devem escolher entre dois modos, respectivamente para Excelmogging e Codemaxxing. Os usuários ativos semanais atuais do Codex já ultrapassam 4 milhões, e os casos de uso já se estenderam de geração de código para usos não técnicos.

MarketWhisper1h atrás

O Codex da OpenAI lança interface de dois modos: Excelmogging para trabalho de escritório, Codemaxxing para programação

Notícias do setor de IA

Mensagem do Gate News, 29 de abril — O CEO da OpenAI, Sam Altman, anunciou hoje no X uma interface do Codex redesenhada, introduzindo dois modos distintos para os usuários. "Excelmogging" mira tarefas comuns do escritório com uma interface simplificada e o slogan "Mesmas ferramentas, interface mais simples," trazendo exemplos de tarefas como

GateNews2h atrás

Mídia americana: rascunho de ordem executiva da Casa Branca permite que o modelo Anthropic Mythos entre no governo

Notícias do setor de IA

De acordo com uma reportagem citada por fontes informadas pela Axios em 28 de abril, a Casa Branca está elaborando diretrizes para permitir que agências federais contornem a avaliação de risco da cadeia de suprimentos (SCRD) da Anthropic e introduzam novos modelos para uso governamental, incluindo o modelo Mythos da Anthropic. A esse respeito, a Casa Branca emitiu uma declaração oficial afirmando que quaisquer comunicados de política seriam publicados diretamente pelo presidente, e que qualquer outra alegação é pura especulação.

MarketWhisper2h atrás

Taylor Swift solicita marcas registradas de voz e imagem para se proteger contra a disseminação de conteúdo falsificado por IA

Notícias do setor de IA

De acordo com uma reportagem da BBC em 28 de abril, a cantora pop americana Taylor Swift já apresentou três pedidos de marca registrada nos Estados Unidos, cobrindo trechos de áudio de voz e imagens de palco, com o objetivo de proteger sua voz e aparência contra imitações por IA; o advogado de marcas Josh Gerben divulgou inicialmente os detalhes dessas solicitações em seu blog.

MarketWhisper2h atrás

Comentário

0/400

Sem comentários