A Ramp Labs apresenta uma nova solução para a partilha de memória entre múltiplos agentes, reduzindo o consumo de tokens em até 65%

GateNews

Notícias do Gate News, a 11 de abril, a empresa de infraestruturas de IA Ramp Labs publicou resultados de investigação «Latent Briefing», permitindo uma partilha eficiente de memória entre sistemas multiagente através da compressão direta da cache KV de grandes modelos. Isto faz uma grande redução do consumo de Tokens sem perda de exatidão. Nas arquiteturas multiagente mais comuns, o orquestrador (Orchestrator) decompõe tarefas e chama repetidamente modelos de trabalhadores (Worker). À medida que a cadeia de inferência se vai tornando mais longa, a quantidade de Tokens cresce de forma exponencial. A ideia central do Latent Briefing é, com o auxílio do mecanismo de atenção, identificar as partes verdadeiramente essenciais no contexto e eliminar informação redundante diretamente na camada de representação, em vez de depender de resumos de LLM que são lentos ou de pesquisas RAG com baixa estabilidade. Nos testes de referência do LongBench v2, o método teve um desempenho notável: o consumo de Tokens do modelo Worker diminuiu 65%, a mediana de Tokens poupados em documentos de comprimento médio (32k a 100k) atingiu 49%, a exatidão global melhorou cerca de 3 pontos percentuais face à linha de base e o tempo adicional para cada compressão foi apenas de cerca de 1,7 segundos, o que equivale a acelerar aproximadamente 20 vezes em relação ao algoritmo original. O experimento usou Claude Sonnet 4 como orquestrador e Qwen3-14B como modelo de trabalhador, cobrindo cenários de documentos variados, como artigos académicos, documentos jurídicos, romances e relatórios governamentais. O estudo também descobriu que o limiar de compressão ideal varia em função da dificuldade da tarefa e do comprimento do documento — para tarefas difíceis, é mais adequado uma compressão mais agressiva para filtrar ruído de inferência oportunista; para documentos longos, é mais apropriada uma compressão mais ligeira para preservar informação-chave dispersa.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

0G integra o Alibaba Cloud Qianwen LLM e o primeiro agente de IA on-chain obtém acesso a um modelo de grande porte para uso comercial

A Fundação 0G anunciou em 21 de abril uma colaboração oficial com a Alibaba Cloud, trazendo o modelo de linguagem de larga escala Qianwen (Qwen) para a infraestrutura descentralizada, para que agentes de IA possam chamar LLMs de nível comercial diretamente a partir do ambiente na cadeia. Desenvolvedores poderão usar recursos de inferência do Qianwen por meio de um mecanismo de controle de acesso por portão de tokens, convertendo de forma efetiva as chamadas a LLM em operações verificáveis e mensuráveis na cadeia, fazendo com que o Qianwen se torne um dos principais LLMs comerciais da primeira leva a ser incorporada ao framework de agentes descentralizados.

MarketWhisper21m atrás

ProCap Financial e Kalshi Lançam Produto de Pesquisa para Mercados Preditivos

Mensagem do Gate News, 22 de abril — A ProCap Financial, apoiada pelo empreendedor de cripto Anthony Pompliano, fez parceria com a operadora de mercado de previsões Kalshi para lançar um produto profissional de pesquisa voltado a mercados preditivos. A ProCap acessará os dados da Kalshi por meio de um pipeline direto e empregará agentes de IA para analisar mercados de previsões, gerando percepções de investimento, pontos de dados do mercado de ações e integrando dados de ações aos mercados de previsões.

GateNews48m atrás

Meta lança IA de treinamento para monitorar as teclas do teclado dos funcionários e um novo ferramenta de rastreamento durante a onda de demissões

A Meta anunciou em 21 de abril que instalará, nos computadores de funcionários nos Estados Unidos, uma nova ferramenta de rastreamento chamada “Model Capabilities Initiative” (MCI), para capturar o movimento do mouse, cliques, entradas de teclado e capturas de tela periódicas da tela de trabalho dos funcionários, a fim de treinar modelos de agentes de IA capazes de executar tarefas de trabalho de forma autônoma. A medida ocorre em meio ao contexto de a Meta ter cortado cerca de 2.000 empregos de funcionários este ano, o que gerou uma forte reação dos funcionários.

MarketWhisper2h atrás

Volkswagen vai implantar agentes de IA no mercado chinês a partir do 2º semestre de 2026

A Volkswagen vai implementar IA exclusiva da China em carros a partir do 2º semestre de 2026, em parceria com a Horizon Robotics, permitindo navegação, reservas e estacionamento; a meta é impulsionar a liderança em software e a competitividade de preços na China, lançando mais de 20 novos modelos eletrificados na China e 50 globalmente até 2030. Resumo: A Volkswagen anunciou em 21 de abril, em um evento em Pequim, que vai incorporar um assistente de IA em seus veículos para o mercado chinês a partir do segundo semestre de 2026, usando uma arquitetura eletrônica exclusiva da China desenvolvida com a Horizon Robotics. O sistema de IA supera os assistentes de voz convencionais ao executar tarefas de múltiplas etapas, como localizar e reservar restaurantes, fornecer navegação e coordenar o estacionamento. O CEO da Volkswagen China, Ralf Brandstätter, descreveu a plataforma como parte da estratégia da montadora para fechar a lacuna de software com concorrentes locais e para reduzir a pressão de preços no maior mercado de EV do mundo. O plano acompanha um lançamento agressivo de produtos, incluindo mais de 20 novos modelos eletrificados na China e cerca de 50 globalmente até 2030, sinalizando uma ênfase renovada em diferenciação habilitada por software em seu avanço global de eletrificação.

GateNews2h atrás

NeoCognition sai do modo stealth com rodada seed de $40M liderada pela Cambium Capital

Mensagem do Gate News, 22 de abril — A NeoCognition, uma startup de IA fundada pelo professor da Universidade Estadual de Ohio Yu Su, saiu do modo stealth com uma rodada seed de $40 milhões liderada pela Cambium Capital e Walden Catalyst Ventures. A Vista Equity Partners também participou da rodada, com investidores-anjo incluindo o CEO da Intel

GateNews3h atrás

Moonshot AI Lança Modelo Open-Source Kimi K2.6 com Fluxos de Trabalho Avançados de Agentes

Mensagem de Gate News, 22 de abril — A Moonshot AI lançou seu modelo open-source Kimi K2.6 em 20 de abril, trazendo novos recursos para programação, geração de front-end e orquestração multiagente. O modelo foi projetado para apoiar fluxos de trabalho complexos de empresas por meio de recursos avançados de Agent Programming e Deep

GateNews4h atrás
Comentário
0/400
Sem comentários