手机智能体的记忆系统建设:OPPO Agentic-RAG技术实践全解析

2026年3月21日

79

543

手机智能体的记忆系统建设:OPPO Agentic-RAG技术实践全解析

在人工智能快速发展的今天,智能手机正在从单纯的通讯工具演变为用户的“第二大脑”。OPPO AI中心提出了“Personal X”战略,旨在通过构建个性化数字记忆体,让手机能够真正理解并服务于每一位用户的独特需求。这一战略的核心支撑之一便是AI搜索技术,它解决了记忆的检索与调用问题,使用户能够便捷地获取个人化的信息与服务。

RAG技术架构设计与端云协同

在具体应用层面,OPPO在2025年初发布的Find N5中推出了“意图搜索”功能,集成于手机负一屏搜索框内。当用户输入日程、文档、图片等关键词时,系统能够智能识别搜索意图并精准返回结果。随后在Find X8上推出的“左记右问”功能更为创新——机身左侧的专属记忆按键允许用户在任意界面一键收藏内容,系统会自动解析并存储为可检索的记忆点,支持按旅行、记账等主题自动分类整理。

多维过滤与提示工程实践

OPPO的记忆搜索系统采用了端侧与云端协同的双层架构设计。在端侧,系统预部署了文本嵌入、多模态嵌入、OCR识别、CLIP模型等多项自研能力,在用户数据进行本地向量化的同时保障隐私。查询发起时,系统并行执行稠密向量检索与BM25稀疏检索,通过混合排序输出结果。端侧架构的核心挑战在于召回率、响应时延与功耗控制,团队通过模型量化、剪枝及NPU算子优化等手段实现高效部署。 云端架构则采用两轮交互模式:第一轮并行执行端侧处理与云端查询预处理,包括查询规划、内容安全检查与查询改写;第二轮携带端侧本地信息上传,进行RAG检索与智能体分发。云端更注重准确率与响应时延优化,通过意图分流模块实现多通道联合决策,根据任务类型与数据需求精准识别用户意图。

在RAG实践中,给大模型的信息应追求精准而非数量,理想情况是预先知道模型所需并直接提供。

“OPPO AI中心”

在检索增强生成(RAG)流程中,如何筛选高质量的上下文片段至关重要。OPPO建立了涵盖语义相关性、时间维度、空间与情绪标签的多维过滤体系。例如,当用户查询车位信息时,系统优先呈现最近拍摄的照片;查询“我在朝阳公园拍的照片”时,会结合用户地理位置准确定位目标地点。 在提示工程方面,团队创新性地采用分层设计原则,将提示结构解耦为角色设定、任务引导、上下文注入、约束条件与输出格式五个层次。这种模块化设计既保证了提示的灵活性,又便于在不同场景中复用通用组件。动态上下文构建则根据查询类型、用户画像与召回内容进行差异化适配,确保上下文与当前场景高度相关。

隐私安全是OPPO记忆系统建设中不可逾越的红线。在内容安全层面,系统实施覆盖查询、召回内容与生成输出的三级审查机制。在用户隐私保护方面,采用保形脱敏策略:端侧数据先进行脱敏处理,再加密传输至云端进行无损计算,最终在端侧还原原始数据。端侧计算本地化是隐私安全的天然屏障,云端则通过隐私计算协作技术与数据加密传输确保安全。

隐私安全与效果评测体系

效果评测是落地优化的关键环节。OPPO建立了覆盖三个阶段的评测体系:效果调优阶段采用分级评测,涵盖向量化、混合检索、重排序等环节,使用召回率、NDCG、F1分数等指标定位效果衰减节点;上线准出阶段结合客观指标与人工评测综合评估;版本迭代阶段则主要依赖核心客观指标进行快速评测。测试集的构建结合了内部用例设计、实际用户查询脱敏处理与专业标注团队参与。

如有侵权,请联系删除。

Related Articles

联系我们 预约演示
小墨 AI