Oppo X-OmniClaw:開源 Android AI 代理可在本地運行,無需雲端
Oppo 的 Multi-X 團隊已發布 X-OmniClaw,一個開源的 Android AI 代理(agent)框架:在保留核心邏輯於裝置端的同時,僅在進行艱鉅推理時才呼叫雲端的語言模型。與多數在雲端伺服器上運行、並承載虛擬 Android 副本的行動端 AI 系統不同,X-OmniClaw 會直接在使用者的實體裝置上執行,從而維持對手機相機、照片與本地檔案的存取權。 架構:三大支柱的裝置端智慧 根據 Oppo 的技術文件,X-OmniClaw 透過三個相互連接的組件運作,並形成一個連續不斷的迴圈。 Omni Perception 將相機影像、螢幕內容與語音輸入整合成單一管線。視覺-語言模型會先解讀代理行動前的場景。例如:當使用者將相機對準一個產品並詢問價格時,代理會先辨識正在查看的內容,接著打開相關購物 App 並開始搜尋,無需使用者手動輸入。 Omni Memory 透過在任務、App 切換與工作階段之間維持上下文,將 X-OmniClaw 與一次性聊天機器人區分開來。代理會從使用者的照片畫廊建立長期語意記憶,將原始影像轉換為關於物件、場景與事件的結構化筆記。該報告指出:「執行
Oliver Grant·05-18 19:17
