A Anthropic se desculpa pelo Claude Fable 5 com 5 salvaguardas ocultas, substitui por proteções visíveis de fallback para o Opus 4.8 esta semana

De acordo com a conta oficial da Anthropic no X em 11 de junho, a empresa pediu desculpas por degradar secretamente respostas do Claude Fable 5 para usuários suspeitos de construir modelos de IA concorrentes, admitindo que as proteções invisíveis eram um “mau custo-benefício”. A partir desta semana, solicitações sinalizadas farão um retrocesso visível para o Claude Opus 4.8 em vez de entregar silenciosamente uma saída degradada. Na API, os usuários agora receberão um motivo declarado quando uma solicitação for recusada, com notificações de fallback no lado do servidor sendo liberadas nos próximos dias. A Anthropic reconheceu o custo-benefício: tornar as salvaguardas visíveis as torna mais fáceis de contornar, o que significa que mais falsos positivos para trabalhos legítimos de machine learning podem ocorrer enquanto a empresa ajusta seus sistemas.
Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários