Karpathy endossa a saída em HTML para modelos de linguagem de grande escala, prevendo o vídeo neural interativo como a forma definitiva

De acordo com Andrej Karpathy, membro fundador da OpenAI e criador do conceito de “vibe coding”, hoje ele endossou a abordagem da equipa do Claude Code de usar HTML em vez de Markdown para as saídas de modelos de linguagem. Karpathy descreveu um roteiro de evolução para interfaces de interação com IA: do texto simples para o Markdown para o HTML, seguido de múltiplas formas intermédias, até chegar ao estágio final de vídeo neural interactivo gerado diretamente por modelos de difusão.

Karpathy atribuiu esta evolução à largura de banda do cérebro humano, referindo que cerca de um terço do cérebro humano processa sinais visuais em paralelo — uma “autoestrada de dez faixas” para a introdução de informação. Defendeu que a interação ideal humano-IA combina uma voz eficiente para a introdução humana e uma saída visual de alta largura de banda (imagens, animações ou vídeo) por parte da IA. Recomendou que os utilizadores adicionem imediatamente “respostas estruturadas como HTML” aos prompts como uma melhoria de curto prazo.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Dezasseis mil milhões de dólares em novas startups: Thinking Machines lança modelo de IA interativo em tempo real, com destaque para “dizer, ouvir e executar ao mesmo tempo”

Fundada em conjunto pela antiga cúpula da OpenAI Mira Murati e por John Schulman, cofundador da OpenAI, a nova empresa de IA Thinking Machines, avaliada em cem mil milhões de dólares, lançou na terça-feira uma pré-visualização do seu primeiro modelo de IA “falar e ouvir” em simultâneo, em modo full duplex, com uma latência de apenas 0,4 segundos, desafiando os actuais modelos de interacção em tempo real homem-máquina. (Investimento da Nvidia na Thinking Machines Lab com o Vera Rubin para melhora

ChainNewsAbmedia24m atrás

Atacantes sequestram pipelines oficiais do TanStack, OpenSearch e Mistral, publicam 84 versões maliciosas a 12 de maio

De acordo com a monitorização da Beating, a 12 de maio, entre as 3:20 e as 3:26 (UTC+8), atacantes associados à TeamPCP sequestraram as cadeias de distribuição oficiais de TanStack, OpenSearch da Amazon e Mistral, fazendo avançar 84 versões de pacotes maliciosos em npm e PyPI. Os pacotes afetados incluem @tanstack/react-router (10M+ downloads semanais), @opensearch-project/opensearch (1,3M downloads semanais) e o cliente mistralai do Mistral. Os pacotes maliciosos contornaram mecanismos de confi

GateNews42m atrás

Ixirpad estabelece parceria com a Cware Labs para apoiar startups de IA e Web3

De acordo com um anúncio de 11 de maio, a Ixirpad celebrou uma parceria estratégica com a Cware Labs para acelerar o desenvolvimento de infraestruturas sustentáveis na indústria Web3. A Cware Labs, operando como venture studio, irá identificar e apoiar projectos de blockchain e IA com elevado potencial. A colaboração tem como objectivo ajudar as empresas emergentes a transitarem de conceitos em fase inicial para negócios escaláveis e prontos para investimento, fornecendo orientação operacional,

GateNews56m atrás

Vista do Agente Claude Code: gestão de sessões em paralelo com um ecrã único

A Anthropic, a 11 de Maio, lançou uma nova funcionalidade para o Claude Code: «Agent View», que permite gerir, numa única interface, vários workspaces do Claude Code a funcionar em simultâneo, eliminando a necessidade de alternar entre separadores de múltiplos terminais. De acordo com o blogue oficial da Anthropic, esta funcionalidade foi disponibilizada no formato Research Preview, sendo aplicável às opções Pro, Max, Team, Enterprise e ao Claude API. A publicação X oficial do canal recebeu mais

ChainNewsAbmedia1h atrás

Austrac alerta para riscos de branqueamento de capitais impulsionados por IA à medida que a Austrália alarga as regras de prevenção do branqueamento de capitais a partir de 1 de julho

De acordo com a Austrac, a 12 de maio, a agência australiana de inteligência financeira alertou que a inteligência artificial está a aumentar os riscos de branqueamento de capitais ao permitir que os criminosos fabriquem identidades, forjem documentos e ocultem proveitos mais rapidamente e em maior escala. A partir de 1 de julho de 2026, os agentes imobiliários, os comerciantes de metais e pedras preciosas, bem como os prestadores de serviços de trust e serviços a empresas, ficarão sujeitos às r

GateNews1h atrás

Google: grandes modelos de linguagem estão a ser usados para ataques reais, a IA pode contornar mecanismos de segurança de autenticação em duas etapas

De acordo com a CoinEdition, a 12 de maio, o grupo de Threat Intelligence do Google publicou um relatório de alerta, avisando que os atacantes já têm usado modelos de linguagem em ataques informáticos reais que estão a afetar sistemas a nível global, e confirmou que os hackers desenvolveram uma vulnerabilidade zero-day baseada em Python que pode contornar os mecanismos de segurança de autenticação multifator (2FA); o Google afirma que existe uma ligação entre as atividades em causa, ataques info

MarketWhisper1h atrás
Comentar
0/400
Nenhum comentário