DGrid AI выпустила исследовательскую работу PoQ-Judge, сократив расходы на оценку качества LLM на 72%

ChainCatcher: DGrid AI выпустила сегодня свой последний исследовательский документ «PoQ-Judge», представив многоархитектурную систему оценки качества, которая исключает необходимость в эталонных ответах. Эта система достигла корреляции 0,747 с оценками человека на скрытых тестовых наборах, одновременно снизив стоимость оценок более чем на 72% благодаря каскадной оценке и онлайн-калибровке весов. PoQ (Proof of Quality) — собственный механизм консенсуса DGrid, созданный для предотвращения развертывания моделей низкого качества и манипуляций данными на уровне протокола.
Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев