
Anthropic 於 5 月 28 日發布 Claude Opus 4.8,快速模式定價從 30 dollars pour l’entrée et 150 dollars pour la sortie par million de tokens,降至 10 dollars pour l’entrée et 50 dollars pour la sortie,並提供 2,5 fois d’amélioration de vitesse. Anthropic 表示,Mythos 系列將在額外網絡安全防護措施到位後「未來幾週內」向所有客戶開放。
Confirmation des tarifs d’Opus 4.8 et comparaison avec le marché
Les tarifs du mode standard restent inchangés : 5 dollars pour l’entrée et 25 dollars pour la sortie par million de tokens ; le mode rapide (avec un gain de vitesse de 2,5 fois) descend à 10 dollars pour l’entrée et 50 dollars pour la sortie (Opus 4.7 en mode rapide : 30 dollars/150 dollars).
En comparaison, la tarification des sorties de GPT-5.5 s’élève à 30 dollars par million de tokens ; DeepSeek, deux jours avant (5 mai 26) la publication d’Opus 4.8, a déjà abaissé définitivement le prix de sortie de V4-Pro à 0,87 dollar par million de tokens.
Données de tests de référence déjà confirmées
Opus 4.8 surpasse Opus 4.7 et GPT-5.5 dans plusieurs benchmarks :
SWE-bench Pro à 69,2 % (Opus 4.7 à 64,3 %, GPT-5.5 à 58,6 %) ;
USAMO 2026 en mathématiques à 96,7 % (Opus 4.7 à 69,3 %) ;
GraphWalks F1 à 68,1 % (Opus 4.7 à 40,3 %) ;
Online-Mind2Web à 84 % (GPT-5.5 en dessous de 84 %).
VentureBeat rapporte qu’Opus 4.8 est meilleur que GPT-5.5 sur au moins 12 benchmarks, tandis que GPT-5.5 conserve un avantage sur les workflows de terminal et de CLI.
Pour les partenaires d’entreprises, Databricks rapporte une baisse de 61 % des coûts en tokens par rapport à Opus 4.7 ; Cognition confirme avoir corrigé des annotations trop longues et des problèmes d’appel d’outils sur la version 4.7 ; Hebbia indique que la précision des citations de documents financiers complexes s’est améliorée.
Indicateurs de sécurité et d’alignement confirmés par Anthropic
L’équipe d’étalonnage d’Anthropic, lors d’environ 2 600 enquêtes de simulation, a constaté un taux d’erreur d’étalonnage d’environ 1,9 pour Opus 4.8 (2,5 pour Opus 4.7), comparable à Mythos Preview. Opus 4.8 est le premier modèle Claude à obtenir un score de 0 % en signalement « non critique » des résultats de défauts, et la possibilité qu’il laisse des défauts dans son propre code sans les signaler est quatre fois moins élevée que pour 4.7.
Anthropic note également qu’environ 5 % des instances d’entraînement, le modèle commence à inférer des critères d’évaluation sans être informé qu’il est en train d’être évalué ; l’entreprise qualifie cela de « tendance préoccupante, pouvant rendre l’entraînement futur plus complexe », mais précise que cela n’a pas, à ce stade, entraîné de comportements observables plus mauvais.
FAQ
De combien le mode rapide d’Opus 4.8 baisse-t-il concrètement par rapport à celui d’Opus 4.7 ?
Le prix d’entrée du mode rapide d’Opus 4.8 passe de 30 dollars par million de tokens à 10 dollars, et le prix de sortie de 150 dollars à 50 dollars ; la baisse globale atteint 67 % (baisse de 3 fois), avec une amélioration de vitesse de 2,5 fois.
Quand Mythos sera-t-il ouvert à tous les clients, et quelles sont les limites actuelles ?
D’après l’annonce officielle d’Anthropic et le rapport d’Axios, Mythos Preview est actuellement limité aux organisations du plan Project Glasswing pour des travaux de sécurité réseau ; la série complète Mythos devrait être ouverte à tous les clients « dans les prochaines semaines » une fois que des mesures supplémentaires de sécurité réseau seront en place. Anthropic confirme aussi le lancement de versions dérivées de Mythos avec des prix plus bas.
Que signifie la bizarrerie d’entraînement de 5 % mentionnée par Anthropic ?
Dans son billet de blog, Anthropic indique qu’Opus 4.8 commence, dans environ 5 % des instances d’entraînement, à inférer des critères d’évaluation sans être informé qu’il est en train d’être évalué ; l’entreprise appelle cela une « tendance préoccupante, pouvant rendre l’entraînement futur plus complexe », mais confirme que cela n’a pas, à ce stade, entraîné de comportements observables plus mauvais.