Blockify 改写企业 RAG:用 IdeaBlock 取代 Chunking、压缩 40 倍、token 减 3 倍

鏈新聞abmedia

企业 AI 数据优化新工具 Blockify 5 月 9 日由 akshay_pachaar 整理推广、宣称在 RAG(Retrieval-Augmented Generation)流程中、可把企业数据库压缩 40 倍、查询 token 用量减 3 倍、向量搜索准确率提升 2.3 倍。Blockify 官方 GitHub 说明:产品由 Iternal Technologies 推出、用「IdeaBlock」结构化知识单元取代传统 chunking、并通过去重合并让知识库保持精简、连贯、可治理。

核心概念:用 IdeaBlock 取代传统 chunking

Blockify 的技术设计:

传统做法:把长文件切成固定大小的 chunk、嵌入向量、检索时取 top-k

Blockify 做法:把原始内容转换为 IdeaBlock—XML 结构化知识单元

每个 IdeaBlock 内含:自带问题、可信答案、tag、实体、关键词

相似 IdeaBlock 自动去重合并、知识库不会随内容增长膨胀

传统 chunking 的问题是同一信息可能在多个 chunk 中重复出现、造成检索冗余与 token 浪费;IdeaBlock 通过去重把信息密度提升、同样内容用更小的存储空间表达。

具体效益:压缩 40 倍、token 减 3 倍、准确率升 2.3 倍

Blockify 公布的具体效益指标:

数据压缩:企业数据库缩减至原大小约 2.5%(40 倍压缩)、保留 99% 以上信息

每次查询 token:从约 303 个(传统 chunk)降至约 98 个(IdeaBlock)—3.09 倍效率

向量检索准确率:提升 2.29 倍

整体准确率改善:约 78 倍(含去重与检索改进综合效应)

成本节省试算:1 亿次查询/年、节省 token 成本约 73.8 万美元

78 倍的整体准确率提升是综合效应—去重减少噪音、IdeaBlock 结构化内容对向量检索友善、单次回答 token 数下降同时减少模型出错空间。

整合范围:LlamaIndex、LangChain、Milvus、Cloudflare 等主流框架

Blockify 已整合的开发者工具与基础设施:

RAG 框架:LlamaIndex、LangChain

知识管理:Obsidian

向量数据库:Milvus、Elastic、Supabase

边缘运算:Cloudflare

低代码整合:n8n(通过工作流程模板)

Blockify 的整合策略是「不取代既有 RAG 框架、而是作为前置数据优化层」。开发者可在现有 LlamaIndex 或 LangChain 流程中、用 Blockify 替换原本的 chunking 步骤,其余流程不变。

后续可追踪的具体事件:Blockify GitHub 星数增长与社群采用率、Iternal Technologies 是否就 IdeaBlock 结构申请或披露技术细节(目前标榜「patented ingestion」)、以及主流 RAG 框架是否将类似去重逻辑内建为默认功能。

这篇文章 Blockify 改写企业 RAG:用 IdeaBlock 取代 chunking、压缩 40 倍、token 减 3 倍 最早出现在 链新闻 ABMedia。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

小虎演示跨模型工作流:GPT 生圖 + Gemini 3.1 Pro 转 3D 互动內容

中文 AI 观察家 xiaohu 5 月 10 日分享一个结合 GPT 与 Gemini 3.1 Pro 的工作流示例:先用 GPT 生成图像、再用 Gemini 3.1 Pro 把图像转换为 3D 互动内容、可把任何知识主题做成可旋转、可操作的科学应用。xiaohu 推文展示的示例包括 3D 行星展示、互动科学模型等、是「跨模型工作流」(multi-model workflow)的具体实践。 工作流结构:GPT 生图 → Gemini 3.1 Pro 3D 化 整个工作流的两阶段设计: 阶段一:用 GPT(GPT-image-1 或 ChatGPT 内建的图像生成)产出主题图像、提供视觉基础 阶段二:把图像输入 Gemini 3.1 Pro、由 Gemini 把 2D 图像转换为 3D 互动内容 输出形式:可在浏览器内旋转、缩放、互动的 3D 物件 适用场景:科学教育、产品展示、知识互动内容 「跨模型工作流」是 2026 年 AI 应用层的关键趋势之一—单一模型不再是万能工具、开发者把不同模型最强的部分串接起来、做出单一模型做不到的应用。 具体展示:3D 行星、互动科学内容、机器人工

鏈新聞abmedia2小时前

阿里巴巴将集成 Qwen AI 与淘宝,推出包含 40 亿个商品的 AI 购物服务

据 Jinshi 引述的消息源称,阿里巴巴计划将其 Qwen AI 平台与淘宝电商服务整合,以通过对话式人工智能购物,而不是关键词搜索。此次整合将使消费者能够在 Qwen 应用中通过与 AI 助手对话浏览、比较并购买商品,并可访问淘宝和天猫超过 40 亿件商品的目录。该服务将基于用户的订单历史和偏好提供购物推荐,并由一个技能库管理物流和售后服务。此外,阿里巴巴还将在淘宝内推出由 Qwen 驱动的 AI 购物助手,提供虚拟试穿以及 30 天价格追踪工具。

GateNews8小时前

DMG Blockchain 成立 DMG Infrastructure 子公司,用于 AI 和 HPC 运营

据 BlockBeats 报道,5 月 9 日,比特币挖矿公司 DMG Blockchain 成立子公司 DMG Infrastructure,用于运营人工智能和高性能计算(HPC)业务。该公司计划将其数据中心转向 AI 和 HPC 服务。DMG Blockchain 在 4 月产出 21 BTC,低于 3 月的 23 BTC。

GateNews05-09 04:25

Spotify 今天推出 AI 生成的个人播客功能,并允许保存至收藏库

据 MacRumors 报道,Spotify 今天(5 月 8 日)推出了一项新功能,允许用户生成并保存由 AI 驱动的个人播客,直接存入其 Spotify 资料库。用户可以在桌面端安装并登录“Save to Spotify CLI”,然后使用来自 OpenAI、Anthropic 等的 AI 代码代理 t

GateNews05-08 14:46

Benzinga 推出韩文翻译引擎和 4亿词 AI 金融数据集

根据该公司消息,Benzinga 最近推出了一个韩语翻译引擎以及用于 AI 训练的大规模韩语金融数据集。该系统在实时将美国市场新闻翻译成韩语的同时,保留金融术语、代码(ticker)引用以及市场背景。

GateNews05-08 11:32

FLock.io 参与牛津圆桌会议以推进砂拉越主权 AI MoU

据 Foresight News 称,FLock.io 参与了牛津大学的一场圆桌讨论,以推动就砂拉越主权人工智能发展达成三方谅解备忘录。讨论聚焦于数据主权、AI 协作、数据安全治理以及硬件

GateNews05-08 11:01
评论
0/400
暂无评论