OPPO 小布记忆：全模态碎片化内容的理解与智能整理实践

问题背景：为什么需要全模态记忆整理？

用户每天产生大量碎片化内容——截图、语音、视频、文档、多图……如何让 AI 理解这些异构多模态数据，并自动整理成有价值的"记忆"？

采集能力：

端侧算法（AIUnit）：

存储记忆数据

对输入图文信息进行分析，生成分类标签；根据分类标签进行任务规划。

简单场景（流量占比 80%）：

复杂场景（流量占比 20%）：

端侧抽取结果传到云端后处理 → 云端合成最终结果 → 返回端侧 AIUnit → 流体云服务下游分发

多规则融合召回（标题/实体/标签匹配）+ Rerank + LLM 精排

用户手动创建、A 标签推荐、洞察推荐三链路统一 → Reranker + Verify 两阶段聚合

分类 LLM 识别知识/旅行/健康合集 → 自适应摘要模板

Model Selection → Prompt Eng（人工 + APE）→ Business Benchmark

LLM-as-a-Judge 的多维度质量保障，badcase 反馈闭环

端云任务分流设计方法：如何定义简单/复杂场景边界，如何通过分类标签生成动态 Prompt，如何在保证效果的同时最大化端侧推理占比（80% 流量端侧化）
全模态理解的技术挑战与解决方案：如何基于自研 AndesVL 多模态大模型构建端侧推理能力，端侧 AIUnit 支持的任务类型，以及端侧推理优化策略
内容聚合的双路方案：关联记忆的多规则融合召回 + Rerank + LLM 精排架构，合集归纳的三链路统一 + Reranker/Verify 两阶段聚合方案
合集分类与自适应总结的实现方法：分类 LLM 如何识别知识/旅行/健康合集，不同垂类如何切换摘要模板，以及如何避免模型幻觉
LLM 应用的工程化实践：流程化算法开发工作流、自动化评测体系（LLM-as-a-Judge）、badcase 反馈闭环等可直接复用的方法论