Mercredi, le PDG d’Anthropic, Dario Amodei, a publié un essai de politique publique appelant à des exigences de sécurité contraignantes et à des tests obligatoires par des tiers pour les modèles d’IA de pointe, sur le modèle des réglementations de la FAA pour les avions. La proposition impose des tests dans quatre catégories de risques : cybersécurité, armes biologiques, perte de contrôle de l’IA et R&D automatisée, avec une autorité gouvernementale habilitée à bloquer les déploiements jugés non sûrs.
L’annonce de politique publique coïncide avec le lancement par Anthropic de Claude Mythos 5, un modèle d’IA de pointe restreint destiné aux organisations de cybersécurité et aux partenaires gouvernementaux. La société a parallèlement publié Claude Fable 5, une version destinée au public qui achemine les demandes sensibles vers un modèle moins performant comme garde-fou contre les usages malveillants.