DeepSeek lance les modèles V4-Pro et V4-Flash à un coût inférieur de 98 % à celui du GPT-5.5 Pro d’OpenAI

Message de Gate News, 25 avril — DeepSeek a publié des versions préliminaires de V4-Pro et V4-Flash le 24 avril, deux modèles open-weight avec des fenêtres de contexte d’un million de tokens. V4-Pro dispose de 1,6 billion de paramètres au total, mais n’active que 49 milliards par passe d’inférence en utilisant une architecture de type Mixture-of-Experts. V4-Flash a 284 milliards de paramètres au total, dont 13 milliards activés.

La tarification est nettement plus basse que celle des concurrents : V4-Pro coûte 1,74 $ par million de tokens d’entrée et 3,48 $ par million de tokens de sortie — environ 98 % de moins que le GPT-5.5 Pro d’OpenAI ($30 input, $180 output) et environ un vingtième du coût de Claude Opus 4.7. V4-Flash est facturé 0,14 $ en entrée et 0,28 $ en sortie par million de tokens. Les deux modèles sont open source sous licence MIT et peuvent être exécutés localement gratuitement.

DeepSeek a réalisé des gains d’efficacité grâce à deux nouveaux mécanismes d’attention : Compressed Sparse Attention et Heavily Compressed Attention, qui réduisent les coûts de calcul à 27 % de ceux du prédécesseur V4-Pro (V3.2) et à 10 % pour V4-Flash. La société a partiellement entraîné V4 sur des puces Huawei Ascend, en contournant les restrictions d’exportation américaines sur les processeurs Nvidia avancés. DeepSeek a déclaré qu’une fois que 950 nouveaux supernœuds seront mis en ligne plus tard en 2026, la tarification baissera davantage.

Sur des benchmarks de performance, V4-Pro-Max arrive en première position sur Codeforces compétitif (3,206, se classant autour de la 23e place parmi les candidats humains) et obtenant 90,2 % sur les problèmes de mathématiques d’Apex Shortlist contre 85,9 % pour Claude Opus 4.6. Cependant, il est en retrait sur les benchmarks de multitâche : MMLU-Pro (87,5 % contre 91,0 % de Gemini-3.1-Pro) et Humanity’s Last Exam (37,7 % contre 44,4 %). Sur les tâches à long contexte, V4-Pro mène les modèles open source mais perd face à Claude Opus 4.6 sur les tests de récupération MRCR.

V4-Pro introduit le « interleaved thinking », permettant aux workflows d’agents de conserver le contexte de raisonnement sur plusieurs appels d’outils sans vider entre les étapes. Les deux modèles prennent en charge des intégrations de codage avec Claude Code et OpenCode. D’après une enquête auprès des développeurs de DeepSeek portant sur 85 utilisateurs, 52 % ont déclaré que V4-Pro était prêt comme agent de codage par défaut, et 39 % penchaient pour son adoption. Les anciens endpoints deepseek-chat et deepseek-reasoner seront mis à la retraite le 24 juillet 2026.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Chrome télécharge automatiquement le modèle d’IA Gemini Nano de plusieurs gigaoctets le 9 mai, suscitant des inquiétudes en matière de sécurité dans la communauté crypto

D’après BlockBeats, le 9 mai, Chrome a automatiquement téléchargé un fichier de modèle d’IA multi-gigaoctets (Gemini Nano) sur les appareils des utilisateurs, sans consentement explicite, pour la détection locale de fraude, la synthèse de pages web et des fonctionnalités d’IA. Alors que Google a déclaré que l’exécution locale d’une IA renforce la confidentialité et la sécurité, les utilisateurs de crypto ont exprimé des inquiétudes concernant le manque de transparence et d’autorisation explicite

GateNewsIl y a 41m

Un juge américain estime que la réduction de la subvention pour DOGE est illégale après l’utilisation de ChatGPT et de mots-clés liés au DEI, et bloque son application jeudi

D’après ABC News, jeudi, une juge fédérale américaine a statué que les coupes de subventions menées par le DOGE, soutenu par Elon Musk, étaient illégales. La juge de district Colleen McMahon, à New York, a déclaré que le personnel avait utilisé ChatGPT et des recherches par mots-clés, incluant « DEI », « Equity », « Inclusion » et « LGBTQ », pour aider à interrompre des programmes de financement au sein du National Endowment for the Humanities. La magistrate a empêché l’administration Trump d’ap

GateNewsIl y a 1h

Un responsable de la BCE déclare que les risques liés à l’IA pousseront à une révision de l’infrastructure financière ce samedi

José Luis Escrivá, membre du Conseil des gouverneurs de la Banque centrale européenne et gouverneur de la Banque d’Espagne, a déclaré samedi que les banques centrales doivent évaluer la résilience des infrastructures financières et la cybersécurité, compte tenu de l’essor de l’intelligence artificielle. « Les développements récents de l’intelligence artificielle nous obligent à réévaluer la robustesse de notre infrastructure financière et de notre cybersécurité », a déclaré Escrivá lors d’un évé

GateNewsIl y a 2h

L’action Cloudflare chute de 23,62 % le 8 mai après des résultats du T1 et l’annonce de licenciements de 1 100 employés

Les actions de Cloudflare ont chuté de 23,62 % le 8 mai, à 196,13 dollars par action, après la publication des résultats du premier trimestre de l'entreprise et l’annonce d’environ 1 100 suppressions de postes. Si le chiffre d’affaires du T1, à 640 millions de dollars, a dépassé les attentes avec une croissance de 34 % d’une année sur l’autre, les prévisions de chiffre d’affaires pour le deuxième trimestre de 664–665 millions de dollars ont été inférieures à l’attente du marché précédente de 666

GateNewsIl y a 4h

Helsing vise à lever des fonds à une valorisation de 18 milliards de dollars

Selon le Financial Times, Helsing, une start-up allemande de drones alimentés par l’IA, prévoit de lever de nouveaux fonds à une valorisation d’environ 18 milliards de dollars.

GateNewsIl y a 4h

L’IA co-mathématicienne de Google DeepMind atteint 47,9 % sur FrontierMath, catégorie 4, dépasse GPT-5,5 Pro, et résout 3 problèmes précédemment impossibles

Google DeepMind a publié AI co-mathématicien, un assistant de recherche en mathématiques multi-agents, atteignant 47,9% de précision sur le banc d’essai FrontierMath de niveau 4, dépassant l’ancien record de 39,6% de GPT-5.5 Pro le 9 mai. Le système a résolu 23 problèmes sur 48, dont 3 que tous les modèles précédents n’avaient pas réussi à résoudre. Construit sur Gemini 3.1 Pro, l’architecture utilise une conception hiérarchique avec un agent coordinateur de projet qui distribue les tâches à des

GateNewsIl y a 4h
Commentaire
0/400
Aucun commentaire