Le modèle open source Ling-2.6-flash d’Ant Group : 104B de paramètres avec 7,4B actifs, atteint plusieurs repères SOTA

Message de Gate News, 29 avril — Les poids du modèle flash Ling-2.6 d’Ant Group sont désormais open source, alors qu’ils n’étaient auparavant disponibles que via une API. Le modèle présente 104 milliards de paramètres au total, 7,4 milliards activés par inférence, une fenêtre de contexte de 256K et une licence MIT. Des versions de précision BF16, FP8 et INT4 sont disponibles sur HuggingFace et ModelScope.

Ling-2.6-flash introduit des améliorations de l’attention linéaire hybride par rapport à Ling 2.0, en passant de la GQA originale à une architecture hybride 1:7 MLA plus Lightning Linear combinée à un MoE hautement clairsemé. L’efficacité de l’inférence dépasse nettement celle des modèles comparables : la vitesse de génération maximale atteint 340 jetons/s sur 4 GPU H20, avec un débit de préremplissage et de décodage environ 4 fois plus élevé que celui des modèles open source comparables. Les benchmarks liés aux agents montrent de solides performances : BFCL-V4, TAU2-bench, SWE-bench Verified (61.2%), Claw-Eval et PinchBench atteignent ou se rapprochent des niveaux SOTA. Sur l’ensemble de la suite de benchmarks Artificial Analysis, la consommation totale de jetons n’est que de 15 millions. Sur AIME 2026, le modèle a obtenu 73,85%.

Le site officiel d’Ant Group répertorie également la version phare Ling-2.6-1T (à mille milliards de paramètres) et la version allégée Ling-2.6-mini (légère), bien que, au moment de la publication, leurs poids restent non publiés sur HuggingFace, seuls les modèles de la série flash étant disponibles au téléchargement.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Google lance un protocole de paiement pour agents d’IA avec 120+ partenaires, dont PayPal

D’après CoinDesk, des cadres de Google Cloud et de PayPal ont discuté de la manière dont les paiements en cryptomonnaie permettront de soutenir le commerce piloté par des agents d’IA. Le responsable de la stratégie Web3 chez Google Cloud, Richard Widmann, a annoncé que Google a lancé le protocole de paiements Agentic Payments Protocol (AP2), fait un don à la FIDO Foundation, et compte plus de 120 partenaires, dont PayPal, désormais impliqués. Widmann a souligné que les agents d’IA ne peuvent pas

GateNewsIl y a 4h

Accord Apple de 250 millions de dollars dans une affaire de publicité trompeuse sur l’iPhone et le marketing de l’IA : jusqu’à 95 dollars de compensation par appareil

Apple accepte de payer 250 millions de dollars pour régler un recours collectif lié à des allégations selon lesquelles la société aurait exagéré les fonctionnalités d’IA « Apple Intelligence » sur iPhone. Synthèse publiée par Top Class Actions : les plaignants affirment qu’Apple, dans ses campagnes marketing pour l’iPhone 16 et certains modèles d’iPhone 15, a laissé entendre que des fonctions d’IA (y compris Siri avec une mise à niveau importante) seraient disponibles dès la mise sur le marché,

ChainNewsAbmediaIl y a 5h

Alphabet a progressé de 160 % sur un an, et sa capitalisation a brièvement dépassé celle de Nvidia : la valeur portée par « l’ensemble de la pile IA » se concrétise

Le cours de l’action Alphabet (GOOGL) a progressé d’environ 160% au cours des 12 derniers mois. Après la publication des résultats du T1 2026, les analystes attribuent cette hausse à la position concurrentielle de Google sur le marché de l’IA en mode « full stack ». CNBC a synthétisé : Alphabet a enregistré au T1 un chiffre d’affaires consolidé en hausse de 22% en glissement annuel, à 109,9 milliards de dollars, et un bénéfice net en forte hausse de 81%, à 62,6 milliards de dollars. Les revenus

ChainNewsAbmediaIl y a 5h

Les investissements en actions de Nvidia dépassent 400 milliards de dollars en 2026, avec l’extension de l’écosystème IA

D’après Gelonghui, les investissements en actions de Nvidia ont dépassé 400 milliards de dollars en 2026, au 9 mai. Les investissements couvrent des entreprises en amont et en aval dans l’ensemble du secteur de l’IA, formant un écosystème intégré, de la fabrication de puces au développement de modèles d’IA. Des observateurs de l’industrie soulignent que cette stratégie d’investissement permet à Nvidia de sécuriser des clients en aval tout en renforçant son pipeline de demande en matériel.

GateNewsIl y a 5h

Quantra et FishWar annoncent un partenariat stratégique pour intégrer le jeu vidéo basé sur l’IA à l’infrastructure RWA le 9 mai

D’après des annonces officielles du 9 mai, Quantra et FishWar ont annoncé un partenariat stratégique visant à combiner des expériences de jeu propulsées par l’IA avec l’infrastructure blockchain des actifs du monde réel. La collaboration, partagée via les canaux de médias sociaux officiels des deux entreprises, vise à intégrer les solutions de tokenisation RWA de Quantra à la plateforme GameFi de FishWar sur le réseau Sei. Le partenariat cherche à renforcer la scalabilité du gaming sur blockchai

GateNewsIl y a 5h

Sam Altman révèle les parts d’utilisation de ChatGPT par âge, avec plus d’un tiers des 18-24 ans l’utilisant quotidiennement le 10 mai

D’après Fortune, le PDG d’OpenAI, Sam Altman, a révélé le 10 mai que les utilisateurs de ChatGPT, dans différents groupes d’âge, ont des modes d’utilisation distincts. Les utilisateurs plus âgés considèrent la plateforme comme un remplacement de Google, tandis que ceux dans la vingtaine et la trentaine l’utilisent comme un conseiller personnel. Les étudiants universitaires s’en servent comme d’un système d’exploitation quotidien, en tirant parti de la mémoire des conversations pour obtenir des c

GateNewsIl y a 6h
Commentaire
0/400
Aucun commentaire