Studi USC: Model AI Melanggar Panduan Keselamatan Sosial Lebih dari 27% Waktu
Peneliti di University of Southern California merilis sebuah studi yang menemukan bahwa setiap model AI frontier yang diuji melanggar pedoman keamanan interaksi sosial lebih dari 27% dari waktu. Studi tersebut memperkenalkan EUDAIMONIA, sebuah benchmark yang dirancang untuk mengukur dinamika yang tidak diinginkan dalam percakapan manusia-AI, dengan mengevaluasi 969 masukan pengguna dan lebih dari 3.100 pemeriksaan pelanggaran pada model-model dari OpenAI, Anthropic, Google, xAI, DeepSeek, dan Al
OliverGrant·06-03 22:02