日度归档:2024年11月9日

我对超大型文本多Agent的编排设计思路

软件工程师罗小东,拥有多年架构和平台产品设计经验,以下为开源项目AIP集成超大文本的设计思路。

术语

  • 超大型文本:指的是超过100多页、超10万字的文档,比如解决方案、技术方案、招投标书
  • Agent编排:这里的编排不是工作流,而是针对业务场景的编排,类似于团队人员工作的安排
  • 多Agent技能:每个有自己的技能和擅长部分,每个Agent解决自己的擅长的点

概述

下面处理出来的一般是初稿,然后再进一步的调整,目前的Agent定位为辅助

常会接触过超大型文本,如解决方案、技术方案、招投标书等,通常超过100多页、10万字。处理这类文档时。多Agent系统提供了一种新的解决方案,通过多个智能体(Agent)的协同工作,可以高效地处理复杂任务。

一般超大型文本具有以下特点:

  • 信息量大:包含大量的技术细节、业务流程、管理计划等内容。
  • 专业性强:涉及多个领域的专业知识,需要高度的专业性和准确性。
  • 一致性要求高:文档各部分需要保持一致性和连贯性。

处理超大型文本时面临的主要问题:

  • 效率低下:人工编写和审核耗时长,容易出错。
  • 一致性难保证:多人协作时,容易出现
  • 质量难以控制:文档质量依赖于个人能力和经验,难以标准化。

为了更好的表达,下面以招投标场景为示例来进行阐述。

设计思路

多Agent系统是由多个智能体(Agent)组成的协作系统。每个Agent具有独立的技能和专长,能够处理特定的任务,从过去的项目中抽取成功案例和技术文档,形成一个结构化的知识库。将这些知识库分别导入给单个Agent,使其在编写文档时能够参考和借鉴。

协作机制

通过合理的编排,这些Agent可以高效地协同工作,完成复杂的任务。

任务分配:根据任务的性质和复杂度,将任务分配给最合适的Agent。例如,在招投标场景中,大纲编写Agent负责整体框架,技术方案编写Agent负责技术细节。
责任矩阵:建立责任矩阵,明确每个Agent的职责和任务边界。这有助于避免任务重叠和遗漏。
通信共享:Agent之间需要有效的通信机制,确保信息的及时传递和共享。
动态调整:系统应具备动态调整能力,根据任务进展和环境变化调整Agent的工作状态。

设计多Agent系统的协作机制需要综合考虑任务分配、通信机制和动态调整等多个方面。

场景设计

会有不同的大文本场景,不同的大文本场景可以非常丰富多样,涵盖各种领域和用途。

比如是每个场景都适用于不同的用途:

  1. 解决方案 – 提供针对特定问题的综合解决方案,包括技术、管理、市场等方面。
  2. 技术方案 – 设计详细的技术实施方案,如系统架构设计、软件开发计划、硬件配置方案。
  3. 论文编写 – 学术论文、研究报告、文献综述、实验结果分析。
  4. 项目管理 – 项目计划书、进度报告、风险管理报告、项目总结报告。
  5. 市场分析 – 市场调研报告、竞争分析、消费者行为分析、市场趋势预测。
  6. 产品手册 – 产品介绍、使用说明、技术参数、维护保养指南。
    ….

这里尽量针对于每个场景设计出不同的Agent,以进行更精细化,更贴近的效果,因为每个输出在与团队路径最短的,只有团队自己或者此场景下最熟悉的人了解。

Agent设计

以招投标场景为示例。

大概会设计下面的Agent,细化可以更精准化,还有知识库更符合团队本地场景,每个场景有自己的知识库,同时每个Agent又有自己的知识库。

  • 负责大纲编写的Agent:会有多个角色编写大纲,然后将大纲合成一份。
  • 负责编写技术方案部分的Agent:注于技术实现方案的撰写,确保技术方案的准确性和创新性。
  • 负责编写概要部分的Agent:编写文档的概要部分,确保整体连贯性。
  • 负责编写项目管理的Agent:负责项目实施计划的制定,确保项目的可执行性。
  • 负责编写商务服务的Agent:关注商务条款和服务承诺,提升客户满意度。
  • 负责编写安装部署的Agent:负责安装部署方案的编制,确保方案的实用性。
  • 负责编写售后服务的Agent:编写售后支持策略,提供全面的售后服务方案,增强客户的信任感。
  • ….

上面的Agent可以理解成一个团队,然后针对这个团队的人员安排,我们这里暂时称这种为场景编排。合理的协作机制可以确保各个Agent高效地协同工作,提高系统的整体性能和可靠性。

过程中每个Agent可以替换和重新更换更好更合适的Agent,比如张三设计的更出,在实践中体验较佳,便可以切换。

集成效果

以下是一个简单的多Agent系统界面设计设计演示,首先选择和分配Agent角色,进行大纲编写,可以选择多个Agent。

编写出大纲之后,如果不符合,针对大纲进行调整或者可调整微调目录结构及符合的场景。进行内容人员编写人员选择。

内容编写界面和文档导出,167页,近10万字文本导出。

当然,也可以添加在这个场景下的特定的文档知识库,然后给各个Agent共享使用。

总结

通过合理的设计和编排,各个Agent可以高效地协同工作,提高文档的质量和一致性。特别是通过历史知识库的利用,可以有效控制文档质量,减少对个人能力和经验的依赖。