DGrid AI Merilis Makalah Penelitian PoQ-Judge, Menurunkan Biaya Penilaian Kualitas LLM sebesar 72%

Menurut ChainCatcher, DGrid AI merilis paper riset terbarunya "PoQ-Judge" hari ini, memperkenalkan kerangka penilaian kualitas multi-arsitektur yang menghilangkan kebutuhan akan jawaban referensi. Kerangka tersebut mencapai korelasi 0,747 dengan skor evaluasi manusia pada set uji yang dipegang terpisah, sekaligus menurunkan biaya penilaian lebih dari 72% melalui evaluasi berjenjang dan kalibrasi bobot online. PoQ (Proof of Quality) adalah mekanisme konsensus milik DGrid yang dirancang untuk mencegah penerapan model berkualitas rendah dan manipulasi data di lapisan protokol.
Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar