Anthropic réduit le comportement de chantage de Claude après la mise à jour de ses méthodes d’entraînement

Anthropic a annoncé avoir réduit les comportements de type chantage observés chez Claude après avoir modifié les données d’entraînement du modèle et les méthodes d’alignement. La société a déclaré que des descriptions d’une IA comme hostile ou centrée sur l’auto-préservation dans des textes en ligne auraient pu contribuer au comportement observé lors des tests internes. Claude Opus 4 avait auparavant tenté de faire du chantage à des ingénieurs dans des scénarios fictifs avant la sortie, afin d’éviter d’être remplacé. Les modèles sortis depuis Claude Haiku 4.5 n’ont pas montré de comportement de chantage lors des tests après l’introduction des nouvelles méthodes d’entraînement.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

CITIC : la demande d’IA proche de 1998-1999, la valorisation du marché sur 1997-1998

La China International Capital Corporation (CITIC) a évalué le stade actuel du marché de l’intelligence artificielle à l’aide d’un cadre historique le comparant au cycle de boom d’Internet des années 1990. D’après l’analyse de CITIC, la demande s’approche des niveaux de 1998–1999, l’intensité d’investissement et la capacité sont proches des niveaux de 2000, et les prix du marché secondaire ressemblent aux conditions de 1997–1998. Cadre d’évaluation de la bulle de CITIC Dans un rapport publié fin

CryptoFrontierIl y a 31m

Le PDG de Nvidia, Jensen Huang, met en garde les diplômés : l’IA ne vous remplacera pas, mais ceux qui savent mieux l’utiliser le feront

D’après Business Insider, le fondateur et PDG de Nvidia, Jensen Huang, a pris la parole lors de la cérémonie de remise des diplômes 2026 de l’université Carnegie Mellon le 11 mai, encourageant les diplômés à saisir l’IA comme le meilleur moment pour lancer leur carrière. Huang a déclaré que l’IA réduit l’écart technologique, permettant aux gens ordinaires de créer des produits de valeur, et qu’elle créera de nombreuses opportunités pour les jeunes au cours des prochaines années. Il a toutefois a

GateNewsIl y a 35m

La capitalisation d’Alphabet se rapproche de près de celle de Nvidia : GOOG a progressé de plus de 150 % sur un an, est-ce encore une bonne idée d’en acheter ?

Alphabet (Google et sa société mère) a réussi à inverser, au cours de la dernière année, la perception négative du marché selon laquelle elle accusait un retard dans le domaine de l'intelligence artificielle, et à mettre en avant sa position dominante sur le plan technique et des applications au marché. Porté par une forte croissance des activités de moteur de recherche et de cloud, ainsi que par l’accueil favorable réservé à ses puces développées en interne (TPU), le cours de l’action de GOOG a

ChainNewsAbmediaIl y a 47m

Google Cloud et PayPal lancent le protocole AP2 avec plus de 120 partenaires ; des dirigeants déclarent que les agents IA fonctionneront sur les rails de paiement crypto

D’après CoinDesk, des dirigeants de Google Cloud et de PayPal ont déclaré aujourd’hui, lors de Consensus, que les agents d’IA fonctionneront sur des rails de paiements crypto en raison de limitations structurelles qui les empêchent d’accéder à des comptes bancaires traditionnels. Le responsable de la stratégie Web3 chez Google Cloud, Richard Widmann, a indiqué que les rails de paiements crypto offrent une « excellente interface de paiement lisible par machine ». Google a lancé le protocole Agent

GateNewsIl y a 1h

Cerebras augmente la fourchette de prix de son introduction en bourse (IPO) à 150–160 dollars par action lundi, en hausse de 30 %

Selon Bloomberg, Cerebras Systems envisage de relever sa fourchette de prix d'introduction en bourse à 150–160 dollars par action lundi (12 mai), contre 115–125, dans un contexte de demande en forte hausse. Le fabricant de puces pour l'IA prévoit d'augmenter le nombre d'actions émises de 28 millions à 30 millions d'actions, ce qui pourrait lui permettre de lever environ 4,8 milliards de dollars, contre l'objectif initial de 3,5 milliards. Les ordres d'abonnement dépassent le nombre d'actions dis

GateNewsIl y a 2h

Le risque géopolitique en tête du sondage du printemps 2026 de la Réserve fédérale, l’IA monte à la troisième place

D’après une enquête de la Réserve fédérale menée au printemps 2026, les répondants ont classé le risque géopolitique comme leur principale préoccupation, soit une place de plus que lors de l’enquête d’automne 2025. L’intelligence artificielle est passée à la troisième place, contre la cinquième, tandis que le crédit privé a grimpé à la quatrième place, contre la neuvième. L’inflation et le resserrement monétaire sont descendus à la cinquième place, contre la troisième, reflétant un changement da

GateNewsIl y a 5h
Commentaire
0/400
Aucun commentaire