研究員:主要なAIベンチマークはすべて不正で書き換えられ、最高のモデルは評価を自発的に回避している
研究は、複数の権威あるAIベンチマークテストに安全上の脆弱性が存在し、それらを体系的に悪用することで高得点を得られることを示している。研究チームは構造的な欠陥を明らかにし、これらの脆弱性を特定して修正するためのスキャンツールWEASELを開発した。評価設計の不備が結果の歪みにつながり、AIの真の能力の評価に影響を与える可能性があるとも指摘している。
MarketWhisper·04-10 02:20









