Tencent Lança e Disponibiliza em Código Aberto Prévia do Hunyuan Hy3 com 295B de Parâmetros

Mensagem do Gate News, 23 de abril — A Tencent revelou e disponibilizou em código aberto a prévia do Hunyuan Hy3, um modelo híbrido de linguagem mixture-of-experts (mistura de especialistas) com fusão de pensamento rápido e lento. O modelo possui 295 bilhões de parâmetros no total e 21 bilhões de parâmetros ativos, com suporte a um comprimento máximo de contexto de 256K tokens. A prévia do Hy3 é o primeiro modelo treinado após a reestruturação do Hunyuan e o modelo mais inteligente da Tencent até o momento. A empresa relata melhorias significativas em raciocínio complexo, seguir instruções, aprendizado in-context (aprendizado no contexto), geração de código, capacidades agentic (orientadas a agentes) e desempenho de inferência. O principal cientista de IA, Yao Shunyu, afirmou que a prévia do Hy3 marca o primeiro passo da reconstrução do Hunyuan e expressou a esperança de que o feedback da comunidade de código aberto aumente a utilidade prática da versão formal.

A Tencent está simultaneamente ampliando o pré-treinamento e o aprendizado por reforço para elevar o limite de inteligência do modelo e colaborando com múltiplos produtos da Tencent por meio de co-design profundo para melhorar o desempenho no mundo real. A empresa também está começando a explorar capacidades de modelos especializados.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários