Mensagem do Gate News, 23 de abril — A Tencent revelou e disponibilizou em código aberto a prévia do Hunyuan Hy3, um modelo híbrido de linguagem mixture-of-experts (mistura de especialistas) com fusão de pensamento rápido e lento. O modelo possui 295 bilhões de parâmetros no total e 21 bilhões de parâmetros ativos, com suporte a um comprimento máximo de contexto de 256K tokens.
A prévia do Hy3 é o primeiro modelo treinado após a reestruturação do Hunyuan e o modelo mais inteligente da Tencent até o momento. A empresa relata melhorias significativas em raciocínio complexo, seguir instruções, aprendizado in-context (aprendizado no contexto), geração de código, capacidades agentic (orientadas a agentes) e desempenho de inferência. O principal cientista de IA, Yao Shunyu, afirmou que a prévia do Hy3 marca o primeiro passo da reconstrução do Hunyuan e expressou a esperança de que o feedback da comunidade de código aberto aumente a utilidade prática da versão formal.
A Tencent está simultaneamente ampliando o pré-treinamento e o aprendizado por reforço para elevar o limite de inteligência do modelo e colaborando com múltiplos produtos da Tencent por meio de co-design profundo para melhorar o desempenho no mundo real. A empresa também está começando a explorar capacidades de modelos especializados.