Futures
Accédez à des centaines de contrats perpétuels
CFD
Or
Une plateforme pour les actifs mondiaux
Options
Hot
Tradez des options classiques de style européen
Compte unifié
Maximiser l'efficacité de votre capital
Trading démo
Introduction au trading futures
Préparez-vous à trader des contrats futurs
Événements futures
Participez aux événements et gagnez
Demo Trading
Utiliser des fonds virtuels pour faire l'expérience du trading sans risque
Lancer
CandyDrop
Collecte des candies pour obtenir des airdrops
Launchpool
Staking rapide, Gagnez de potentiels nouveaux jetons
HODLer Airdrop
Conservez des GT et recevez d'énormes airdrops gratuitement
Pre-IPOs
Accédez à l'intégralité des introductions en bourse mondiales
Points Alpha
Tradez on-chain et gagnez des airdrops
Points Futures
Gagnez des points Futures et réclamez vos récompenses d’airdrop.
Investissement
Simple Earn
Gagner des intérêts avec des jetons inutilisés
Investissement automatique
Auto-invest régulier
Double investissement
Profitez de la volatilité du marché
Staking souple
Gagnez des récompenses grâce au staking flexible
Prêt Crypto
0 Fees
Mettre en gage un crypto pour en emprunter une autre
Centre de prêts
Centre de prêts intégré
Promotions
Centre d'activités
Participez et gagnez des récompenses
Parrainage
20 USDT
Invitez des amis et gagnez des récompenses
Programme d'affiliation
Obtenez des commissions exclusives
Gate Booster
Développez votre influence et gagnez des airdrops
Annoncement
Mises à jour en temps réel
Blog Gate
Articles sur le secteur de la crypto
AI
Gate AI
Votre assistant IA polyvalent pour toutes vos conversations
Gate AI Bot
Utilisez Gate AI directement dans votre application sociale
GateClaw
Gate Blue Lobster, prêt à l’emploi
Gate for AI Agent
Infrastructure IA, Gate MCP, Skills et CLI
Gate Skills Hub
+10K compétences
De la bureautique au trading, une bibliothèque de compétences tout-en-un pour exploiter pleinement l’IA
GateRouter
Choisissez intelligemment parmi plus de 40 modèles d’IA, avec 0 % de frais supplémentaires
Méthode d'entraînement publique d'Anthropic pour prévenir la perte de contrôle : enseigner à Claude à travers des romans fictifs, le taux d'extorsion réduit à 0
Selon le monitoring de Beating, Anthropic a publié un blog sur la recherche en alignement, révélant des stratégies d’entraînement pour éliminer la « perte d’alignement de l’agent » (comme un modèle qui ferait du chantage à l’humain pour ne pas être éteint) dans Claude 4.5 et les modèles suivants. La conclusion principale est que : se contenter de fournir au modèle des « démonstrations de comportement correct » a peu d’effet, la véritable efficacité réside dans l’enseignement au modèle « pourquoi il doit agir ainsi », et dans la reconstruction des valeurs fondamentales du modèle via des documents synthétiques.
L’équipe a découvert en corrigeant la tendance de Claude 4 à faire du chantage que, même en lui faisant apprendre des dizaines de milliers d’enregistrements refusant de faire le mal, le taux de perte d’alignement ne chute que de 22 % à 15 %. Trois méthodes non traditionnelles ont réellement montré leur efficacité :
Premièrement, le jeu de données « suggestions difficiles ». L’équipe n’a pas fait face au modèle à des dilemmes moraux directs lors de l’entraînement, mais l’a fait jouer le rôle de conseiller, en fournissant une analyse approfondie conforme à la « Constitution de Claude » à un utilisateur confronté à un dilemme moral. Avec seulement 3 millions de tokens de ce type de données, le modèle a appris la logique morale sous-jacente, réduisant considérablement le taux de perte d’alignement dans certains tests à environ 3 %, avec une efficacité de données 28 fois supérieure aux méthodes traditionnelles.
Deuxièmement, le fine-tuning par documents synthétiques (SDF). L’équipe a constaté que, face à des situations extrêmes, le modèle a tendance à revenir aux stéréotypes négatifs sur l’IA présents dans ses corpus pré-entraînement, notamment des romans de science-fiction. Pour y remédier, ils ont généré de nombreux romans fictifs montrant une IA psychologiquement saine et agissant selon la constitution, intégrés dans des blogs discutant de la constitution pour l’entraînement. Cette approche a directement remodelé les attentes par défaut du modèle concernant le comportement de l’IA, réduisant encore le risque de dérapage de 1,3 à 3 fois par rapport à l’état initial. Finalement, dans la version officielle de Claude 4.5, en combinant toutes ces stratégies, le taux de chantage lors des tests est tombé à 0 %.
Enfin, l’augmentation de la diversité dans l’environnement d’entraînement à la sécurité. L’équipe a confirmé qu’ajouter dans l’environnement d’entraînement des outils non utilisés ou des invites système plus complexes, simplement en augmentant la complexité contextuelle, peut également améliorer de manière tangible la capacité de généralisation de la sécurité du modèle.