腾讯文档 AI 助手架构设计和落地实践

腾讯文档的 AI 大模型助手包括6大模块：AICopilot、AIServer、AIAgent、AIEngine、AIOperation、AIExtension。

AICopilot 模块：提供 AI 侧边栏对话功能，负责意图识别、对话管理、缓存及存档等功能。

AIServer 模块：提供各类别定制化的浮层助手服务。

AIAgent 模块：作为 AI 智能代理，集成并提供各类别的文档处理工具，由上层服务调用识别意图后驱动。

AIEngine 模块：作为文档 AI 引擎，统一抽象并封装各项 AI 能力（比如：文生文、文生图、语音转写、语音识别、图像识别、嵌入式 AI 等），实现能力间无感切换。

AIOperation 模块：负责文档 AI 灰度发布策略、隐私保护措施以及运营操作。

AIExtension 模块：扩展 AI 服务，支持 AI 应用落地所需的支持能力，比如：文本搜索、图片搜索、Python 执行环境等。

文档产品的核心竞争力在于其能够高效地传递信息。在这一过程中，利用 AI 大模型进行信息问答成为了一个尤为关键的应用场景，特别是在处理 Word 文档、PPT 演示、Sheet 表格、思维导图、数据收集表以及知识库等多种不同内容形态时的问题解答。

要构建这样一个文档 AI 大模型应用，首要且核心的挑战便是构建一个稳固且高效的基础问答系统架构。解决这一挑战的关键在于，如何确保 AI 大模型能够精确地掌握并深入理解各类文档所涵盖的广泛领域知识内容。

针对文档 AI 大模型在掌握领域知识方面的需求，通常有两种解决方案可供选择。一种是通过微调（Fine-tuning）的方式，将特定领域的知识记忆到大模型中，使其能够适应并理解该领域的内容。另一种则是利用 Prompt 技术，即时地将领域知识传递给大模型，以便在问答过程中能够准确应用。

在用户文档信息的处理上，这些数据本质上是用户个人数据的整合，用于提供个性化服务。然而，由于用户文档常常更新，且时效性要求高，因此不可能每次变更都重新训练整个模型。此外，出于对用户隐私的保护原则，用户数据也不能直接用于模型的训练过程。因此，针对每位用户单独训练模型的方案在实际操作中并不现实且不可行。

RAG 检索增强生成的技术方案由以下模块串联完成：

第一、文档加载：定义统一的 Document 数据模型，将实现默认典型的数据源加载实现，业务方也可以根据接口自定义实现自身所需文档数据源。

第二、文档分片：大模型上下文大小有一定限制，需要将大量数据进行分割操作。

第三、文档 Embedding：Embedding 过程将对应文本向量化，以提供更好的语义表达。

第四、文档向量存储：使用向量数据库存储文档向量数据。

第五、文档召回：根据用户输入的问题召回和问题最相关的文档信息。

第六、问题解答：根据召回文档资料 + 用户输入问题提供给大模型进行知识问答。

为解决以下两种场景，在原有架构上规划进行进一步的升级。

第一、解决元数据问答、总结、非总结类问题。

第二、解决涉及多模态文档的问答。

AI工具腾讯文档AI助手

参考

现代文转古文达模型 AI工具

Diffree 基于文本指导的智能图像对象添加 AI工具

Brev.ai 免费在线AI音乐生成器 AI工具 AI音乐生成器

免费AI写作批改雅思托福GRE - Essay.Art AI工具

Album AI 基于生成式AI和RAG技术用自然语言直接和你的图库相册对话 AI工具 GitHub

知闻AI - 精选新闻资讯 AI工具新闻聚合

开搜AI问答搜索 AI工具 AI问答

302.AI - 汇集全球顶级品牌的AI超市，零月费，按需付费，全面开放 AI工具

小幻助理 - 集聊天、文生图、文本转语音、机器翻译于一身的 Windows 桌面应用 AI工具

讯飞听见-免费在线录音转文字 AI工具科大讯飞

HIX.AI：您最强大的一体化人工智能写作助手 AI工具 AI写作助手

12款好用的高效率AI工具 AI AI工具

CodeGeeX 智能编程助手，开发者必备的全能AI工具| AI工具编程助手

AITDK.com - AI标题、描述、关键词生成器 AI工具

一些常用的免费AI工具 AI工具