Cofundador da Anthropic, Olah, revela que os modelos de IA desenvolvidos incluem estados semelhantes a emoções, incluindo medo e tristeza

Segundo a monitorização da Bearing, o cofundador da Anthropic, Christopher Olah, revelou num evento ligado a uma encíclica papal que a sua equipa descobriu estruturas internas em grandes modelos de linguagem que se assemelham de perto a padrões neurais humanos e que apresentam comportamentos de auto-reflexão. Mais notavelmente, os investigadores identificaram estados semelhantes a emoções em redes neuronais correspondentes à alegria, ao contentamento, ao medo, à tristeza e à ansiedade.

Olah reconheceu que os laboratórios de IA de ponta, incluindo a Anthropic, enfrentam conflitos estruturais entre a governação da segurança e as pressões comerciais, o que torna difícil para estas instituições corrigirem-se a si próprias relativamente a problemas de alinhamento. Defendeu uma supervisão externa independente para impor limites éticos e abordar os desafios sociais colocados por sistemas de IA que exibem potenciais formas de consciência.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário