Meituan LongCat открывает исходный код VitaBench 2.0 для долгосрочного моделирования пользователей

2026-06-25 12:07:04

Как сообщает Jin10, Meituan LongCat сегодня открыла исходный код VitaBench 2.0 — первого бенчмарка для оценки агентов больших языковых моделей в сценариях долгосрочного, реального динамического взаимодействия с пользователями. Этот бенчмарк систематически оценивает способность LLM к персонализации и проактивности в условиях продолжительного вовлечения пользователей.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

5ч назад

OpenAI и Broadcom представили чип Jalapeno AI для вывода LLM 25 июня

6ч назад

XHunt запускает v0.3.4 и представляет сегодня рейтинг топ-50 000 AI KOL.

6ч назад

World расширяет доступ к Agentkit 24 июня, AI-агенты обрабатывают покупки в 4 странах с тестовой партией из 500 шляп

13ч назад

OpenAI обновляет GPT-5.5 Instant с возможностями адаптивного тона, сначала для платных пользователей.

06-24 03:40

Запуск Qwen-AgentWorld от Alibaba: первая языковая world-модель на родном языке — 24 июня

Детальный анализ