Blockify reescreve empresas com RAG: usa IdeaBlock em vez de chunking, comprime 40 vezes, reduz tokens em 3 vezes

ChainNewsAbmedia

A nova ferramenta de otimização de dados para IA corporativa Blockify, em 9 de maio, foi organizada e divulgada por akshay_pachaar, que alega que, no processo de RAG (Retrieval-Augmented Generation), é possível comprimir os bancos de dados corporativos em 40 vezes, reduzir em 3 vezes o consumo de tokens na busca e aumentar a precisão da pesquisa vetorial em 2,3 vezes. A documentação oficial do GitHub da Blockify diz que o produto foi desenvolvido pela Iternal Technologies, usando unidades estruturadas de conhecimento do tipo “IdeaBlock” para substituir o tradicional chunking, e mantendo o banco de conhecimento compacto, coerente e governável por meio de desduplicação com mesclagem de sobreposições.

Conceito central: usar IdeaBlock em vez de chunking tradicional

Projeto técnico do Blockify:

Abordagem tradicional: dividir documentos longos em chunks de tamanho fixo, incorporar vetores e, na recuperação, pegar top-k

Abordagem do Blockify: converter o conteúdo original em IdeaBlock — unidades estruturadas de conhecimento em formato XML

Cada IdeaBlock inclui: perguntas embutidas, respostas confiáveis, tags, entidades, palavras-chave

IdeaBlocks semelhantes fazem desduplicação e mesclagem automaticamente, e a base de conhecimento não aumenta de tamanho de forma explosiva conforme o conteúdo cresce

O problema do chunking tradicional é que a mesma informação pode aparecer repetida em vários chunks, gerando redundância na recuperação e desperdício de tokens; o IdeaBlock melhora a densidade da informação com a desduplicação, representando o mesmo conteúdo com menos espaço de armazenamento.

Benefícios específicos: compressão de 40 vezes, tokens -3 vezes, precisão +2,3 vezes

Indicadores de benefício específicos divulgados pela Blockify:

Compressão de dados: a base de dados corporativa foi reduzida para cerca de 2,5% do tamanho original (40 vezes de compressão), mantendo mais de 99% das informações

Tokens por consulta: de cerca de 303 (chunk tradicional) para cerca de 98 (IdeaBlock) — eficiência 3,09 vezes maior

Precisão da recuperação vetorial: aumento de 2,29 vezes

Melhoria geral de precisão: cerca de 78 vezes (efeito combinado entre desduplicação e melhorias na recuperação)

Simulação de economia de custos: 100 milhões de consultas/ano, economizando cerca de US$ 738 mil em custos de tokens

O aumento geral de precisão de 78 vezes é um efeito composto: a desduplicação reduz ruído, o conteúdo estruturado em IdeaBlock favorece a recuperação por busca vetorial e a quantidade de tokens por resposta diminui ao mesmo tempo que reduz a margem de erro do modelo.

Escopo de integração: LlamaIndex, LangChain, Milvus, Cloudflare e outras estruturas populares

Ferramentas de desenvolvimento e infraestrutura já integradas na Blockify:

Frameworks RAG: LlamaIndex, LangChain

Gestão de conhecimento: Obsidian

Banco de dados vetorial: Milvus, Elastic, Supabase

Computação de borda: Cloudflare

Integração low-code: n8n (via templates de fluxos de trabalho)

A estratégia de integração da Blockify é “não substituir os frameworks RAG existentes, e sim atuar como uma camada de otimização de dados na frente”. Os desenvolvedores podem substituir o passo de chunking pelo Blockify dentro dos fluxos existentes do LlamaIndex ou LangChain, mantendo o restante inalterado.

Próximos eventos específicos a acompanhar: crescimento de estrelas no GitHub da Blockify e adoção da comunidade, se a Iternal Technologies vai solicitar ou divulgar detalhes técnicos sobre a estrutura IdeaBlock (atualmente em destaque “patented ingestion”) e se os principais frameworks RAG vão incorporar lógicas semelhantes de desduplicação como função padrão.

Este artigo “Blockify reescreve o RAG corporativo: usa IdeaBlock no lugar de chunking, comprime 40 vezes, reduz tokens em 3 vezes” apareceu pela primeira vez em Cadeia de Notícias ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Xiaohu demonstra um fluxo de trabalho entre modelos: GPT gera imagens + Gemini 3.1 Pro transforma em conteúdo 3D interativo

O observador de IA chinês xiaohu compartilhou em 10 de maio um exemplo de fluxo de trabalho que combina GPT e Gemini 3.1 Pro: primeiro, usar GPT para gerar imagens e, depois, usar Gemini 3.1 Pro para transformar as imagens em conteúdo interativo 3D. Isso permite transformar qualquer tema de conhecimento em aplicações científicas rotacionáveis e acionáveis. O post do xiaohu no Twitter mostra exemplos como exibições de planetas em 3D, modelos científicos interativos etc., que são uma prática concr

ChainNewsAbmedia2h atrás

Alibaba vai integrar a IA Qwen ao Taobao, lançando um serviço de compras com IA com 4 bilhões de produtos

Com base em fontes citadas por Jinshi, a Alibaba está prestes a integrar sua plataforma de IA Qwen ao serviço de e-commerce Taobao para permitir compras por meio de IA conversacional, em vez de buscas por palavras-chave. A integração permitirá que os consumidores naveguem, comparem e comprem itens por meio de diálogos com um assistente de IA no app Qwen, com acesso ao catálogo do Taobao e do Tmall, que tem mais de 4 bilhões de produtos. O serviço fornecerá recomendações de compras com base no hi

GateNews8h atrás

A DMG Blockchain cria uma subsidiária de infraestrutura da DMG para operações de IA e HPC

De acordo com a BlockBeats, em 9 de maio, a empresa de mineração de Bitcoin DMG Blockchain criou a subsidiária DMG Infrastructure para operar negócios de inteligência artificial e computação de alto desempenho (HPC). A empresa planeja fazer a transição de seus data centers para serviços de IA e HPC. A DMG Blockchain produziu 21 BTC em abril, abaixo dos 23 BTC em março.

GateNews05-09 04:25

O Spotify Lança Recurso de Podcasts Pessoais Gerados por IA Hoje, Permitindo Salvar na Biblioteca

De acordo com a MacRumors, o Spotify lançou hoje (8 de maio) um novo recurso que permite aos usuários gerar e salvar podcasts pessoais com tecnologia de IA diretamente na biblioteca do Spotify. Os usuários podem instalar e fazer login no "Save to Spotify CLI" no desktop e, em seguida, usar agentes de codificação de IA da OpenAI, Anthropic e outros t

GateNews05-08 14:46

Benzinga Lança Motor de Tradução em Coreano e um Conjunto de Dados Financeiros de IA com 400 milhões de palavras

A Benzinga lançou recentemente um mecanismo de tradução em coreano e um grande conjunto de dados financeiros em coreano, voltado para treinamento de IA, de acordo com a empresa. O sistema traduz notícias do mercado dos EUA para o coreano em tempo real, mantendo a terminologia financeira, as referências a tickers e o contexto do mercado. A

GateNews05-08 11:32

A FLock.io participa da Oxford Roundtable para avançar o MoU de IA soberana de Sarawak

De acordo com a Foresight News, a FLock.io participou de uma discussão em mesa-redonda na Universidade de Oxford para avançar um memorando de entendimento tripartite sobre o desenvolvimento soberano de IA em Sarawak. A discussão se concentrou em soberania de dados, colaboração em IA, governança de segurança de dados e hardware

GateNews05-08 11:01
Comentário
0/400
Sem comentários