DeepSeek et l'Université de Pékin publient un article sur DSpark le 27 juin, le fondateur Liang Wenfeng figure comme auteur.

Selon Guru Club, le 27 juin, l'équipe de DeepSeek et l'Université de Pékin ont publié un document de recherche intitulé « DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation ». Le document présente un module de décodage spéculatif pour optimiser les performances d'inférence sur les modèles existants DeepSeek-V4-Pro et DeepSeek-V4-Flash. Simultanément, l'équipe a open-sourcé DeepSpec, une base de code complète pour la formation et l'évaluation des modèles de brouillon de décodage spéculatif sous licence MIT. DeepSpec prend actuellement en charge trois implémentations : DSpark, DFlash et Eagle3. Notamment, le fondateur de DeepSeek, Liang Wenfeng, est répertorié comme auteur du document.
Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
ManeyToFuturevip
· Il y a 1h
C'est parti 🔥
Voir l'originalRépondre0