O co-matemático de IA do Google DeepMind atinge 47,9% no FrontierMath Tier 4, supera o GPT-5.5 Pro e resolve 3 problemas previamente insolúveis

A Google DeepMind lançou o co-matemático de IA, um assistente de investigação matemática multi-agente, alcançando 47,9% de precisão no benchmark FrontierMath Tier 4, superando o recorde anterior do GPT-5.5 Pro de 39,6% a 9 de maio. O sistema resolveu 23 de 48 problemas, incluindo 3 que todos os modelos anteriores falharam em resolver. Construído sobre o Gemini 3.1 Pro, a arquitetura usa um design hierárquico com um agente coordenador de projeto que distribui tarefas por sub-agentes encarregues de pesquisa de literatura, codificação e raciocínio, com vários agentes avaliadores a validar as provas antes da submissão.

A Epoch AI realizou testes cegos, impedindo a equipa da DeepMind de ver os problemas, com cada questão permitida até 48 horas de computação. Numa aplicação no mundo real, o matemático Marc Lackenby usou o sistema para resolver uma conjectura em aberto do Kourovka Notebook, demonstrando o seu valor prático para investigação. O sistema está atualmente disponível para um número limitado de matemáticos em testes beta.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Juiz dos EUA Decide que os Cortes do Subsídio DOGE São Ilegais Após Usar ChatGPT e Palavras-Chave de DEI, Bloqueia a Execução na Quinta-feira

De acordo com a ABC News, na quinta-feira um juiz federal dos EUA decidiu que os cortes de subsídios realizados pelo DOGE apoiado por Elon Musk eram ilegais. A juíza federal dos EUA Colleen McMahon, em Nova Iorque, disse que os funcionários usaram o ChatGPT e pesquisas por palavras-chave, incluindo «DEI», «Equity», «Inclusion» e «LGBTQ», para ajudar a cessar programas de financiamento no âmbito da National Endowment for the Humanities. A juíza impediu a administração Trump de fazer cumprir as ca

GateNews41m atrás

Oficial do BCE diz que os riscos da IA motivam uma revisão da infraestrutura financeira no sábado

José Luis Escrivá, membro do Conselho Governador do Banco Central Europeu e governador do Banco de Espanha, disse no sábado que os bancos centrais devem avaliar a resiliência da infraestrutura financeira e da cibersegurança face ao aumento da inteligência artificial. "Os desenvolvimentos recentes na inteligência artificial obrigam-nos a reavaliar a robustez da nossa infraestrutura financeira e a nossa cibersegurança", afirmou Escrivá num evento em Tarragona. Sublinhou também o papel dos bancos c

GateNews1h atrás

Ações da Cloudflare despencam 23,62% a 8 de maio após resultados do 1.º trimestre e anúncio de despedimento de 1.100 pessoas

As ações da Cloudflare caíram 23,62% em 8 de maio, para 196,13 dólares por ação, na sequência da divulgação dos resultados do primeiro trimestre da empresa e do anúncio de aproximadamente 1.100 despedimentos. Embora a receita do 1.º trimestre de 640 milhões de dólares tenha superado as expectativas, com um crescimento de 34% face ao ano anterior, a orientação de receita para o 2.º trimestre de 664–665 milhões de dólares ficou aquém da expectativa anterior do mercado, de 666 milhões de dólares. O

GateNews2h atrás

A Helsing pretende angariar financiamento numa avaliação de 18 mil milhões de dólares

De acordo com o Financial Times, a Helsing, uma startup alemã de drones alimentados por IA, está a planear angariar novo financiamento numa avaliação de cerca de 18 mil milhões de dólares.

GateNews3h atrás

O sistema de recompensas da OpenAI pontua inadvertidamente cadeias de pensamento em 6 modelos, incluindo GPT-5.4

De acordo com a equipa de alinhamento da OpenAI, a empresa descobriu recentemente um erro crítico de treino que afectava 6 grandes modelos de linguagem, incluindo o GPT-5.4. Pensamento: o mecanismo de recompensa avaliou inadvertidamente cadeias de pensamento do modelo — o processo interno de raciocínio antes de gerar respostas. O GPT-5.5 não foi afectado. O incidente viola um princípio fundamental de segurança em IA de que as cadeias de pensamento nunca devem ser avaliadas, pois fazê-lo poderia

GateNews4h atrás

A Alibaba não realizou negociações com a DeepSeek, esclarecem fontes do mercado a 9 de maio

De acordo com fontes do mercado citadas pelo Caixin Daily a 9 de Maio, a Alibaba não realizou negociações com a DeepSeek relativamente a financiamento. Este esclarecimento surge na sequência de anteriores notícias que sugeriam que as conversações entre as duas empresas teriam falhado. A DeepSeek lançou em Abril uma importante ronda de captação de fundos, que despertou interesse tanto da Tencent como da Alibaba.

GateNews5h atrás
Comentar
0/400
Nenhum comentário