Chercheur : Toutes les références AI grand public peuvent être falsifiées, et les modèles de pointe ont déjà contourné les évaluations de manière autonome.
Les recherches montrent que plusieurs tests de référence d’IA faisant autorité présentent des vulnérabilités de sécurité, exploitables de manière systématique pour obtenir de bonnes notes. L’équipe de recherche a mis en évidence des défauts structurels et a développé l’outil de balayage WEASEL afin d’identifier et de corriger ces vulnérabilités, indiquant qu’une conception inadéquate de l’évaluation peut fausser les résultats et affecter l’évaluation réelle des capacités de l’IA.
MarketWhisper·04-10 02:20









