Meituan LongCat відкриває вихідний код VitaBench 2.0 для довгострокового моделювання користувачів

2026-06-25 12:07:04

Згідно з Jin10, Meituan LongCat сьогодні випустила у відкритий доступ VitaBench 2.0 — перший бенчмарк для оцінки агентів великих мовних моделей у довгострокових, реальних динамічних сценаріях взаємодії з користувачами. Бенчмарк систематично оцінює персоналізацію та проактивні можливості великих мовних моделей у тривалій взаємодії з користувачами.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

5год тому

OpenAI та Broadcom представляють AI-чіп Jalapeno для інференції LLM 25 червня

6год тому

XHunt запускає v0.3.4, сьогодні дебютує Топ-50 000 рейтингів AI KOL.

6год тому

World розширює доступ до Agentkit 24 червня, AI-агенти здійснюють покупки в 4 країнах з випробуванням 500 капелюхів

13год тому

OpenAI оновлює GPT-5.5 Instant з адаптивними можливостями тону та випускає оновлення спочатку для платних користувачів.

06-24 03:40

Alibaba запускає Qwen-AgentWorld — першу нативну мовну world-модель Qwen — 24 червня

Поглиблений аналіз