L’API OpenRouter Fusion correspond aux performances de Claude Fable 5 pour un coût divisé par deux

DEEPSEEK-2,81%

OpenRouter a lancé Fusion le 12 juin, une API côté serveur qui distribue des prompts à plusieurs modèles d’IA en parallèle, puis utilise un modèle juge et un synthétiseur pour fusionner les réponses en une réponse unifiée. La société affirme que le système peut égaler les performances de Claude Fable 5 pour environ la moitié du coût, d’après des tests réalisés avec le benchmark DRACO de Perplexity, où un panel avec budget d’environ modèles a obtenu 64,7 % contre 65,3 % pour Fable 5. Le lancement est intervenu peu après qu’Anthropic ait suspendu Fable 5 et Mythos 5 la semaine dernière à la suite d’une directive américaine de contrôle des exportations, citant une découverte de jailbreak contestée, OpenRouter présentant Fusion comme une alternative offrant « une intelligence au niveau de Fable au prix de moitié ».

OpenRouter Fusion traite les prompts via une architecture de panel multi-modèles

Lorsqu’un utilisateur envoie un prompt à Fusion, OpenRouter le distribue à un panel de modèles en parallèle, chaque modèle recevant des outils de recherche web et bash. Un modèle juge extrait ensuite des points de consensus, des contradictions et des angles morts de chaque réponse. Après cette phase d’analyse, un synthétiseur — Claude Opus 4.8 par défaut — rédige la réponse finale en s’appuyant sur cette analyse. L’ensemble du processus se déroule côté serveur. Les utilisateurs peuvent remplacer leur chaîne de modèle par « openrouter/fusion » pour un panel par défaut, ajouter un outil de fusion pour que leur modèle l’appelle de manière sélective, ou construire un panel personnalisé dans le chatroom Fusion sans code.

Le panel AI avec budget obtient 64,7 % sur le benchmark DRACO contre 65,3 % pour Fable 5

OpenRouter a testé Fusion sur DRACO, un benchmark de Perplexity construit à partir de demandes réelles de recherche approfondie d’utilisateurs. Fable 5 associé à GPT-5.5 d’OpenAI et synthétisé par Opus a dominé le classement à 69 %. Fable en solo a obtenu 65,3 %, bien que sept de ses 100 tâches n’aient jamais été exécutées car les filtres de contenu propres à Fable les ont bloquées. Le duo « budget » composé de Gemini 3 Flash combiné à des modèles chinois open-source Kimi K2.6 et DeepSeek V4 Pro, fusionnés et synthétisés par Opus, a atteint 64,7 % — dépassant GPT-5.5 en solo (60 %) et Opus 4.8 en solo (58,8 %), tout en se situant à moins d’un point de pourcentage de Fable pour environ la moitié du coût. Associer Opus 4.8 avec une instance séparée de lui-même a obtenu 65,5 %, soit un gain de 6,7 points par rapport à Opus en solo. OpenRouter indique que, sur environ trois quarts de cette amélioration, provient à elle seule de l’étape de synthèse, le reste venant d’une diversité réelle des modèles.

OpenRouter a révélé que donner au panel un accès web en direct permet aux modèles de faire ressortir la propre grille d’évaluation de DRACO dans les résultats de recherche, un risque de contamination que la société qualifie de coïncident plutôt que délibéré. La correction a nécessité une ligne de configuration pour exclure les domaines d’hébergement du benchmark des outils de recherche, et chaque chiffre publié reflète cette exécution nettoyée.

Anthropic a suspendu Fable 5 et Mythos 5 après une directive américaine de contrôle des exportations

Peu après la publication de Fable 5 et Mythos 5 la semaine dernière, une directive américaine de contrôle des exportations a forcé Anthropic à suspendre ces modèles pour tout ressortissant étranger dans le monde entier, invoquant une conclusion de jailbreak contestée. OpenRouter a annoncé Fusion sur X le 13 juin, en la positionnant comme une alternative avec la promesse de « l’intelligence de type Fable au prix de moitié ».

OpenRouter identifie des limites de Fusion pour le code et les tâches à long horizon

OpenRouter affirme que Fusion n’est pas un remplacement intégral de Fable. DRACO ignore le travail à long horizon, où Fable continuerait d’être en tête, selon les affirmations. Pour le code, Fusion fonctionne comme un outil qu’un modèle de codage appelle de manière sélective, plutôt que comme un remplacement global. Le fil de lancement a divisé à peu près deux pour un en termes d’opinions positives. Le chercheur en IA Andrew Trask a déclaré que c’était « bien plus important que ce qu’il n’y paraît », en soutenant que les laboratoires de pointe ne contrôleront plus jamais seuls la frontière. Les sceptiques ont cité de mauvais résultats en matière de code, une faible qualité dans l’appel aux outils, et un manque de transparence puisque Fable 5 n’est plus disponible pour comparer les résultats. Fusion s’exécute entièrement sur des modèles routés via l’infrastructure propre d’OpenRouter, de sorte qu’elle ne traite pas le problème de contrôle des exportations à la source.

FAQ

Qu’a lancé OpenRouter le 12 juin ?

OpenRouter a lancé Fusion le 12 juin, une API côté serveur qui distribue des prompts à plusieurs modèles d’IA en parallèle, puis utilise un modèle juge et un synthétiseur pour fusionner les réponses en une réponse unifiée.

Comment le panel avec budget de Fusion a-t-il performé sur le benchmark DRACO par rapport à Claude Fable 5 ?

Sur le benchmark DRACO de Perplexity, le panel avec budget de Fusion combinant Gemini 3 Flash, Kimi K2.6 et DeepSeek V4 Pro a obtenu 64,7 %, se situant à moins d’un point de pourcentage de la note de 65,3 % de Fable 5 en solo, pour environ la moitié du coût.

Pourquoi Anthropic a-t-il suspendu Claude Fable 5 et Mythos 5 ?

Anthropuic a suspendu Fable 5 et Mythos 5 la semaine dernière à la suite d’une directive américaine de contrôle des exportations citant une découverte de jailbreak contestée, ce qui a affecté l’accès de tout ressortissant étranger dans le monde entier.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire