Karpathy se junta à Anthropic: o pai do “Vibe Coding” lidera o pré-treinamento do Claude

Andrej Karpathy加入Anthropic

O cofundador da OpenAI e ex-diretor de IA da Tesla, Andrej Karpathy, anunciou em 19 de maio no X que está se juntando à Anthropic. A partir desta semana, ele começou a liderar o trabalho do time para conduzir pesquisas de pré-treinamento do Claude. A Anthropic confirmou que o pré-treinamento é a fase de treinamento base que confere ao Claude as capacidades centrais de linguagem, e também o trecho mais caro em termos de custos computacionais no fluxo inteiro de construção de modelos de IA.

Responsabilidades do pré-treinamento confirmadas: a etapa mais cara para dar ao Claude capacidades centrais

Em uma declaração oficial, a Anthropic confirmou que Karpathy responde pelas pesquisas de pré-treinamento do Claude — isto é, por um treinamento base do modelo com grandes volumes de dados. Esse processo define as capacidades centrais de compreensão de linguagem e raciocínio. Karpathy já havia combinado agentes de codificação por IA com modelos de linguagem menores em 2024: ele concluiu 700 experimentos em 2 dias, reduzindo com sucesso o tempo de treinamento de modelos grandes em 11%. Esse método automatizado de pesquisa é chamado na indústria de “Karpathy Loop”.

Trajetória de carreira de Karpathy: do OpenAI à Anthropic

Karpathy foi um dos cofundadores do OpenAI em 2015. Em 2017, Elon Musk o recrutou para a Tesla, durante o período em que ocupava simultaneamente cargos no conselho da Tesla e da OpenAI, para atuar como diretor-geral de IA, liderando a equipe de visão computacional para condução assistida por computador. Documentos judiciais indicam que, na época, Musk avaliou Karpathy como “o segundo lugar no mundo” em visão computacional e disse: “As pessoas da OpenAI vão querer matá-lo, mas é algo que tem que ser feito.”

Karpathy deixou a Tesla em 2022, voltou brevemente ao OpenAI e depois fundou uma startup de educação em IA chamada Eureka Labs. Ele também é o proponente de “Vibe Coding” — em que os usuários instruem um assistente de codificação de IA por meio de prompts, sem precisar escrever código diretamente. Esse conceito rapidamente se tornou um termo comum na comunidade de desenvolvimento de IA.

Movimentações de pessoal confirmadas pela Anthropic neste mês

Ross Nordeen (integrante fundador da xAI) se juntou à Anthropic antes do anúncio de Karpathy neste mês. A Anthropic também confirmou que Chris Rohlf, que já trabalhou na Yahoo e na Meta e tem 20 anos de experiência em segurança cibernética, entrou para um time de red team de ponta, participando de trabalhos de testes de estresse. No mesmo dia em que Nordeen anunciou sua entrada, a Anthropic fechou um acordo com a SpaceX para alugar capacidade computacional da xAI. A Anthropic foi fundada em 2021 por sete ex-funcionários da OpenAI, incluindo o atual CEO Dario Amodei e a atual presidente Daniela Amodei.

Perguntas frequentes

Qual é o papel do pré-treinamento no desenvolvimento de modelos de IA, e por que o custo é tão alto?

O pré-treinamento é o processo de treinar uma base do modelo de IA com grandes volumes de dados. Ele determina a compreensão de linguagem, o raciocínio e a acumulação de conhecimento do modelo. Durante o treinamento, é necessário um grande volume de computação por GPU para operar continuamente por semanas a meses, tornando-se a etapa que mais consome capacidade computacional e também a mais cara no fluxo inteiro de desenvolvimento de modelos de IA. É ainda a base prévia para os treinamentos posteriores de fine-tuning e de alinhamento (Alignment) com segurança.

Qual é o conceito específico de Vibe Coding, e como Karpathy o define?

Vibe Coding (codificação por atmosfera/“vibe”) é uma forma de desenvolvimento assistido por IA proposta por Karpathy: o usuário fica principalmente responsável por conceber ideias e lógica; depois, usa comandos de prompts em linguagem natural para que a IA gere o código por meio de um assistente de codificação, sem que o usuário precise escrever o código por conta própria. Depois que esse conceito foi apresentado, ele rapidamente virou um termo amplamente adotado na comunidade de desenvolvimento de IA, representando um padrão de programação de colaboração homem-máquina centrado na IA.

Qual é a relação específica de criação entre a Anthropic e a OpenAI?

A Anthropic foi fundada em 2021 por sete ex-funcionários da OpenAI, incluindo Dario Amodei (atual CEO) e Daniela Amodei (atual presidente). Depois disso, continuaram a chegar novos ex-funcionários da OpenAI, incluindo John Schulman, que em 2024 passou a integrar a Anthropic, além da entrada de Karpathy desta vez.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários