DeepSeek e a Universidade de Pequim publicam artigo DSpark a 27 de Junho, fundador Liang Wenfeng listado como autor

Segundo o Guru Club, a 27 de junho, a equipa da DeepSeek e a Universidade de Pequim publicaram um artigo de investigação intitulado "DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation." O artigo apresenta um módulo de descodificação especulativa para otimizar o desempenho de inferência nos modelos existentes DeepSeek-V4-Pro e DeepSeek-V4-Flash. Simultaneamente, a equipa disponibilizou em código aberto o DeepSpec, uma base de código full-stack para treinar e avaliar modelos de rascunho de descodificação especulativa sob a licença MIT. O DeepSpec suporta atualmente três implementações: DSpark, DFlash e Eagle3. Notavelmente, o fundador da DeepSeek, Liang Wenfeng, é listado como autor do artigo.
Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
ManeyToFuturevip
· 1h atrás
Vamos lá 🔥
Ver originalResponder0