分类目录归档:生活

我对Agent分步任务的设计思路

软件架构师罗小东,多年架构和平台产品设计经验,目前在Agent场景落地结合中。

概述

这里主要实现的是AIP在多步任务的能力设计,后续还会继续加强Agent专业程度,深度场景能力结合,这里的AI设计依然定位在辅助人的角色。

Agent分布任务会在很多地方有用到,比如Agentic AI、ReAct推理、深度搜索、CodeAct等都有使用到,类似于Manus、扣子空间交付结果型的场景都会有用到。

过程主要覆盖智能体任务拆解、状态记录、流信息、上下文处理、文件处理、长文本上传、内置工具、MCP工具等结合,还有异常处理策略等。这里是前期在用户使用还有项目比赛、实际场景中使用经验总结,大概内容如下:

  • 专家Agent交互形态的设计
  • Agent流程和自主多步角色的能力设计
  • 多步推理的提示词设计
  • 动态知识库和静态知识库的处理
  • 上下文及异常的处理
  • 并发能力和模型的选择处理
  • 专家Agent的定制化和提示词设计
  • 结果输出和可二次调整处理

场景是针对于和聚焦在垂直领域场景能力的设计,这里并不含使用CodeAct,当前主要以输出GC为主,通用Agent暂时并不考虑,可以针对不同领域建设专业型Agent(特定领域知识库)然后放置到不同的多步任务场景中。每个架构师有不同的设计,我有我思。

整体设计

这里的整体设计主要是部分主要能力的设计,涵盖的部分较多,给出一些设计参考。

专家Agent交互形态的设计

专家形态的交互主要有四个形态,分别是聊天窗口形态、深入搜索形态、长文本形态、Agent群组,以下为AIP界面状态:

这三种形态上切入不同的专家Agent来切入不同的场景:

  • 聊天窗口形态: 即时聊天,简单的聊天窗,展示形态会类似于AgenticAI的形式;
  • 深入搜索形态:大概几分钟的任务,任务的规划到分布任务的处理,针对于问题更深入的输出,同时整理成稿,而且可以二次编辑;
  • 长文本形态:执行十几分钟或者1个小时的任务,超长文本的状态,场景主要是标书类型,可以整理成搞,而且每部分都可二次编辑。
  • Agent群组:每个专家Agent完成每个角色,如果在过多专家Agent的情况下,可以拉入到同一个群组(在平台上叫频道),方便管理。

以下为是长文本形态:

在这几种形态下面,进行专家Agent的切换,以满足不同形态的输出结果,同时每个场景会有可以定制的模板能力设计、场景能力设计等,形态多种场景能力结合。为了达到更灵活的,每个专家Agent包含有自己的静态知识库、动态知识库、MCP工具、提示词等场景设定。

同时还会提供专业Agent指定的数据资产查询能力,能切入到实际的业务系统中,融合Agent到实际业务场景中。

Agent流程和自主多步角色的能力设计

多步能力的设计提供包括Workflow工作流的设计还有自动规划能力的设计,这里能力设计如下:

  • Workflow多步执行:常见的工作流设计,偏向于稳定型的业务流程设计,界面展示会以卡片形式输出;
  • 规划-执行设计:由Agent先规划,再执行设计,反思调用由ReAct来处理;
  • Agentic执行设计:由Agent系统主动思考、规划和执行任务的能力,进行多步推理执行结果。

在大的多步执行框架里面,会包含有很多小的设计技巧,但是整个设计思路不变,不管是哪一步,都会以按预期的结果进行输出为目标。

这个过程的设计流程大体定的情况下,会尽量的缩小与预期结果的距离,除了上面的工程能力以外,我们会还在数据质量上进一步的加强集成,以提高Agent的专业性和业务能力,这里暂时不涉及数据的说明。

多步推理的提示词设计

针对于提示词的设计,结合的是静态和动态的方式,还有过程中不断的嵌入场景提示词,以达到更好与大模型交互。

  • 静态提示词:通过设置初始的角色提示词,与工具方向大的结合,可能会有一些提示词工程技巧,比如COT、示例演示等,这也是为什么专业Agent与通用Agent不一样的地方。
  • 动态提示词:在过程中不断的设计提示词,结合输出结果与过程的问题等,进一步的整理成提示词;
  • 知识库结合:三方文档和知识库的结合整理的提示词,这也是动态处理的一部分,但是这部分数据是动态生成和动态结合的,包括不仅是向量、还有数据库、文档、API等。
  • 场景模板库:针对于不同的场景,在选择不同的模板输入与输出,会定向的指定结果的输出还有内容的形成,比如方案指定的输出结构。

比如下面的场景提示词模型,会形成不同的模板库:

这里的设计基本上会满足很多内容输出的场景,同时结合内部的业务实际情况,输出不同的结果。

动态知识库和静态知识库的处理

知识库是当前Agent最常见的处理方式,RAG也是常见的Agent能力体现之一,这里知识库有RAG应用,也有记忆能力的应用,我们分了静态和动态的区别:

  • 静态知识库:最常见的文本向量化、或者直接文本形态,这类型我们处理成静态的知识库,同时记忆在后期的处理之后,也会转变成静态的一部分;
  • 动态知识库:针对的是对外获取、实时更新的信息来源;

静态知识库的处理,可能是用户文件上传、或者知识库又或者是前端外挂的知识库等。我们主要关注的是动态知识库,因为这部分主要是跟垂直业务场景很直接的关联,包括数据的准确性,输出结果的准确性等。

动态知识库主要是由数据治理部分处理,使用数据湖技术和数据计算框架技术来实现,主要是解决中小型团队海量数据使用的问题。

会经过网络采集、业务数据采集、文档采集等,过程ETL等处理,确保数据质量。

同时形成湖仓一体的结构,提供到数据资产平台,提供对外的API接口,提供全文检索能力、数据查询能力等,这部分是专家Agent能力的核心重点。

上下文及异常的处理

智能体运行过程中的稳定性问题是一个大的卡点,由于模型能力的不同、过程中数据加载数据量的不一等,往往在循环多次之后,就会因为超时、请求内容过长、请求次数过多等出现异常,从而导致任务过程中断情况。这里处理的策略有几种:

  • Rag策略: 内容过长的文本会处理成RAG或者做截取处理(策略可在Agent配置),结合内置的RagTool来进行内容检索;
  • 上下文工程: 定制上下文策略,长度策略,消息超时策略等,确保每一次对话的消息长度;
  • 异常收集:异常动态结合到提示词中,异常的问题不会也不能丢失,多步执行过程中需要异常的收集规避下一步的问题;
  • 汇总处理: 在过程中不同模型的输入输出,也很难说可以按指定的结果输出,或者说按结果判断,最后在收集不到答案时,会做一次汇总处理,以接近用户答案。

这些做成了可配置化,以符合不同的场景,比如下面是上下文的工程的配置界面:

通过上下文和异常的处理,很大程度上会规避掉Agent过程处理到半跑不下去的问题,但是这里只是技巧,更多的我们会将精力放在业务数据治理上,以确保Agent以最少的执行获取到最优的答案。

并发能力和模型的选择处理

这里暂时不提多账号的情况,这里是SaaS化的配置。

分步任务很多部分是在后台任务运行的,在交互上为了体验最好,这里做了SSE流的输出,但这必然也会带来一些性能和并发的问题,还有后台资源的问题等。在并发的处理上,这里主要处理的策略是:

  • 请求限流:这个是针对于不同的用户或者组织进行的限流设计,每个对话或者任务针对于不同的用户或者组织配置限制,规避无限任务的情况;
  • 线程池:单独运行或者长时间运行的配置单独的线程池,同时也提高数据库连接的线程池能力;
  • 线程链: 过程中使用了较多的CompletableFuture编程,以提高异步编程的能力,规避阻塞主线程;
  • 状态管理:主要是针对工作流和过程中的状态执行久化处理,过程状态进行过程节点;
  • 模型选择:在不同的场景,结合不同的模型,并不是一个模型处理完整一个链路,小模型快,会适合处理简单部分,大模型能力强,适合推理增强部分;
  • 分布式:微服务分布式的设计结合,这个是Java带有的成熟的并发处理策略,以规避单机带来的问题,在这里主要是使用k8s部分。

比如下面的工作流部署配置:

些策略主要是提高性能、可靠性及可扩展,更重要的是提高基础平台的稳定性,同时也会提高

结果输出和可二次调整处理

在完成结果输出之后,一般情况来说并不是说马上就可以使用,大部分的情况下需要做二次的调整,同时可进一步的编辑,在这里的结果做了AI编辑的集成配置和导出策略。

  • 内容导出Word或者复制,然后进一步的二次编辑,这个是比较常见的;
  • 针对于长文本和深度搜索场景,结合AI编辑器的能力,可以在针对的结果上进行二次AI编辑和修改,同样也可以导出word;

如下图:

形成AI生成、即时预览、AI智能编辑、格式调整、Word导出 的闭环流程。

总结

上面主要是Agent分步任务的设计思路设计,整个设计体现了几个关键理念:

  • 专业性与场景化:不同于通用Agent的广泛覆盖,我们聚焦于垂直领域,通过专家Agent的深度定制、专业知识库的建设以及场景模板的设计,确保AI输出结果具备实际业务价值。
  • 工程化思维:从交互形态设计到并发处理,从异常管理到结果输出,每个环节都融入了软件工程的严谨思维,确保系统在真实业务环境中的稳定性、可靠性和可扩展性。
  • AI辅助人定位:始终将AI定位为辅助角色,通过可二次调整的结果输出、AI编辑器集成等设计,强调人类专家的最终决策权,实现人机优势互补。
  • 数据治理结合:认识到高质量数据是Agent专业能力的基石,特别设计了动态知识库治理体系,将数据资产真正转化为AI可理解、可利用的业务知识。

这里的设计,给下一步的演进预留了足够的扩展空间,随着基础模型能力的不断提升,可以平滑地集成更好的输出和专业领域落地的能力。以上是在AIP上的产品设计,也期望给其它同学一些参考,有兴趣的同学也可以一起交流。

我对专业级Agent能力的提升规划

软件工程师罗小东,拥有多年架构和平台设计经验,目前专注于平台与新技术的融合研究。

概述

此为针对于AIP在项目团队上在Agent上的研究成果参考,临时手稿,会有一些口语化。

此次的升级,通过工具、数据、私有模型的结合,高质量的输出结果和场景结合,将为下一步形成自动化触发的做基础能力,比如根据环境感触自动执行任务输出结果(如环境感知→任务触发→结果输出闭环)。

针对的是AIP智能体平台的三四季度的规划,主要针对于落地和专业级Agent的能力提升,这里对专业级能力的理解是高级水平、高级能力,比如我要一份十几页Word技术方案,应该出来的就是一份高级水平的技术方案。

提升的基础在于在二三季度智能体和业务场景的落地经验,还有研究升级、探索经验上面,包括MCP平台、数据治理平台的可行性结合进行的规划。

这里提升主要基于三个部分:

  • 数据资产化
  • 私有模型专业化
  • 工具链深度集成

前期聊过类似于Manus、扣子空间这样形态会后面持续一段时间,包括目前的天工智能体形态也类似,在进一步的研究提升上面,我们觉得思路是对的,但是过程和体现形式上,需要做一些流程上的优化能力,同时要足够聚焦,我们需要更聚焦的场景来体现Agent输出能力。

将结合数据、专业数据一起,以结果为主的交付,随着大模型生态发展和应用结合上的不断成熟,结果会越来越专业。每个架构师思想不一,我有我思,期望可以给一些同学更多的参考。

提升准备

前期的AIP平台的形成的基础能力,主要是基于这一层上面做的AI大模型原生应用:

  • 智能体管理平台(全生命周期管理)
  • 轻量级数据治理平台(数据资产化)
  • 智能体应用客户端(多形态交互)

现有智能体输出形态已覆盖主流范式,集成的智能体输出形态,这里的形态指的是Agent设计思路,还有交互和输出模式,主要是智能体能力输出的体现:

  • 单智能体输出形态
  • 多智能体群形态
  • 多智能体结合场景形态
  • DeepSearch形态
  • 规划与执行形态
  • ReAct推理形态
  • MCP工具集成形态
  • Agentic智能体和RAG形态

对比开源或者市面上的智能体体现形态上来说,基本上大差不差,而可以使用更深入的方法论和理论,当前在集成过程中,需要更加的聚焦在业务能力和场景上,需要对Agent进一步的提升和落地能力,体现Agent价值。

提升方向

我们并没有使用AI工作流,而是使用”目标->推理->总结->判断是否符合->推理->符合->结束”这样的ReAct架构去完成任务。其实在这个模式下,结合MCP工具,结合出来的效果也不错的,但是需要更专业的智能体角色。

以下为数据资产化集成:

这里主要提升会针对于几个方面来着手,大模型聚焦在指定场景下,数据越专业、越实时,效果会越好,而在于工具都完善的情况下,提升的主要方向便是从数据上着手。

主要提升点:

  • 数据资产化:每个Agent的知识库,从数据采集、清洗、再到资产化,形成近实时的状态,做好资产归纳分类
  • 私有模型微调:规划每个场景下的私有大模型,并且私有部署,建立模型微调平台;
  • 工具针对化:每个MCP工具针对性要强,与资产化,数据化的能力结合适当;

以下为MCP工具集成:

为了上面的落地更加顺利,我们会将业务场景固化,不是每个场景都需要通用,需要固化的场景来固化效果,重在输出结果,还有体现这个场景的价值。

产品形态

以下为我们过程中一些产品形态和体现,这里我们将Agent归纳为几种形态,当然,可以通过这几种形态变换不同的场景,其它新的形态,我们会使用新的应用开发AI原生应用,以下为常见的形态展示,列出几部分:

  1. 单智能体输出形态,这里以数据分析智能体和AIGC为示例:
  1. 多智能体群形态,这里以群聊为示例,这个需要做升级,但是大体已经集成一版本:
  1. 多智能体结合场景形态,这里演示文档审核和企业智能库场景:
  1. DeepSearch形态,主要是基于类似于Manus一样的功能,这里做了删减,不涉及太多的功能,专注于分析、查询、研究类,生成报告和总结结果输出:
  1. 规划与执行形态,这个比较常见,数据分析和方案协作上:
  1. MCP工具集成形态,这里更为常见,主要是集成工具,主要使用ReAct来执行:

产品形态的体现和输出,这意味着这块的有一定的成熟度,其实很多项目都可能达到,但是最终还是会回归到数据上,不管是网络搜索还是爬虫,还是Agent自动打开浏览器都是为了数据,基于上面的多种形态,我们会统一的智能体管理平台,还有可以切换不同的智能体在不同的形态下处理问题,比如同样的写文章,推理和带有MCP、还有工作流的智能体是不一样结果的,所以我们提供了任意场景切换智能体的方式:

以下为智能体管理平台:

发布不同的场景还客户端应用商店和指定的场景:

这个过程中我们发现还是不能满足很多场景,或者说要探索很多场景,但是这些并不是我们想做的,目前更需要做的是聚焦在可落地场景上。

总结

这个是我们从通用能力转向专业、深度能力的一些探索,虽然说很多方向明确,规划通过”数据精准化、模型专业化、工具深度化”的三维提升策略,结合场景固化和流程优化,实现智能体从通用能力到专业级输出的质变。当前已完成技术路径验证,后续将聚焦高价值场景实现能力突破。

我对Agentic工作流的集成设计思路

软件工程师罗小东,拥有多年架构和平台设计经验,目前专注于平台与新技术的融合研究。

背景

此为针对于AIP在项目团队上在Agent上的研究成果参考

随着大模型越发的能力增强,而由原来的AI Workflow模式,出现了比较大的弊端,传统的AI工作流方式:

  • 思维的限制,不是AI限制,工作流排版是个人能力的限制
  • 现在的大模型比绝大部分人更专业(或者说”聪明”)

AI 工作流程(非 Agentic)虽使用 AI,但只做一次推理,没有反复调整能力。而Agentic 工作流程整合 LLM、工具与记忆,可进行规划、执行、反思,是最具智慧与弹性的流程。

这个能力会更加强悍,会更加能体现出Agent的能力。

下面是集成的几个场景,主要是做输出型的场景:

  • 单Agent智能体问答:不同场景下的单智能体的问答能力。
  • DeepSearch深度检索:不同领域级别的智能体自定义DeepSearch深度检索
  • 通用智能体场景:不同专业级别智能体组成的专业团队,可切换的场景

上面三种场景的使用,主要集成的Agentic工作流方式。当然,在集成Agentic的同时,并不代表会放弃到传统的AI工作流,而是可以有多种Agent的配置能力。

以上为AIP在技术团队管理场景上的一些探索,每个设计师有不一样的设计,我有我思。

集成场景分析

这里主要是目前在AIP能力上集成的场景分析,这里的MCP指的是并不是MCP协议,而是类似于MCP架构,基于AIP自己实现的类似于MCP的能力,需要自定义的扩展接口。

单智能体问答

这里是最常见的,调用MCP远程工具能力,集成推理能力,根据目标,调用工具来集成,过程不断的反思,总结,经过一次或者多次的思考,得到结果,而且往往得出的结果会更加符合要求。

以下为校园场景为示例,推理出学生班级的学生分析情况:

以下为分析出来的结果,会显示出每个班级的情况:

这里也会类似于纳米AI的MCP工具集,其实思路都差不多,只是结果并没有做一定的二次制作,比如网页、Word等,这个倒是可以考虑进一步加进去,这里可以集成更多的执行工具调用,包括一些执行型的结果。

DeepSearch深度检索

这里的深度检索集成,通过规划-推理-执行-总结几个步骤,但是会更加的深入场景分析,规划能力更强一些,同时对结果做了一步的格式化,是针对于单智能体上的一个提升点,你会发现,这个跟Manus有些类似,其实原理是一样的,只是缺少工作的,这也是下一步集成MCP服务服务的需要,在智能体框架初定的情况下,进一步的集成MCP能力。

智能体会规划和分析,还有进一步的去搜索,调用对应的工具去实现目标。

在这里我们做了输出的总结和优化,进行了结果的二次总结输出:

包括各类型的Word、Excel、PDF、网页等,这个时候会发现,这些规划能力总结起来确实效果不错。

针对于不同的专家类型,不同的场景,会有不同的知识库,不同的工作,接入不同的场景,这些相对来说,纳米AI做得更为平民化,这里考虑到适配不同的场景,可以定义多种不同的DeepSearch智能体,以下是配置界面:

这个是针对于不同领域专家输出的结果。

通用智能体场景

总的来说,上面是还是单智能体的交互情况,配置起来的效果可能还会有一些场景局限,然后增加了自定义多智能体结合起来的场景,这里我们定义为通用智能体,做为输出结果,我们需要更为专业的智能体来做专业的事情。

定义两个协同的智能体来配合完成一个事情,这里流程上我们配置引用不同的智能体来完成一个任务,下面是智能体的场景选择:

形成团队的能力来实现这个,更为灵活的控制每个环节实现这个目标,比如形成分析形结果输出,也以校园场景为示例:

团队能力的补充会在某个任务安排上更专业,效果更为突出,通过每个角色的能力来完成他需要完成的事情。

总结

通过智能体与工具的深度协同,实现从单一问答到复杂任务处理的全面覆盖。单智能体问答提供基础交互能力,DeepSearch 深度检索深化专业领域应用,通用智能体场景则突破个体能力局限,构建高效协作体系。
在保留传统 AI 工作流的同时,方案强调多 Agent 配置的灵活性,满足不同用户、不同场景的差异化需求。未来,可进一步探索智能体间的动态协作机制,优化工具集成与数据交互效率,推动 AI 工作流向更智能、更高效的方向发展,为各行业提供更具价值的 AI 解决方案。

以上为Agentic 工作流上的一些探索,也期望有兴趣的同学可以互相交流。

我使用AIP做团队代码能力情况分析

软件工程师罗小东,拥有多年架构和平台设计经验,目前专注于平台与新技术的融合研究。

概述

此为针对于AIP在项目团队上在Agent多项目团队上的研究成果参考,所有名称已做脱敏处理

团队管理是工程师在上一层提升需要的主要能力,团队管理不好会使工程师面临工作效率低下、职业发展受限、工作氛围压抑、人际关系紧张、工作压力过大等一系列不良影响,阻碍其个人成长与价值实现。

此主要为团队研发人员的能力情况,成长建议,个人能力,团队梯度等,更加有助于工程师团队的成长和管理,以图文形式做展示分析。因为是技术人员,这里主要接入的是Git的项目代码能力分析结果,当然,如果你用的是禅道,获取分析的结果会更加详细,但是可能偏重于项目管理上,主要使用的AIP多Agent能力在两个方面:

  • Agent问数:直接Agent问出结果,为通用型场景,为单Agent问答层面
  • Agent报告分析:更加为详细的成员报告分析情况,为多Agent协作层面

我需要具体获取到团队的整体能力分析情况,还有个人的能力分析,同时具体人员还有每周每月的工作量情况等,形成更详细的情况报告,以下为几个维度来做团队能力情况的展示:

  • 整体团队代码编写情况分析
  • 低产出成员个人能力分析及建议
  • 整体团队报告分析及概述情况

单Agent主要是ChatBot上的问答,整体分析报告是代码质量、沟通协作、个人发展、团队平衡等整体分析报告情况,分析更全面、结论更具指导性。

以上为AIP在技术团队管理场景上的一些探索,每个设计师有不一样的设计,我有我思。

团队情况分析

能力分析主要为团队提供更全面的能力画像,还能基于数据驱动制定针对性改进方案,推动技术团队向高效、可持续的方向发展,获取的提问如下:

  • “所有团队成员的能力情况及代码提交量情况分析”
  • “个人能力情况分析,更详细的找出个人问题的短处还有提升建议,给出详细图文报告”
  • “最近开发的功能是什么,列出最近一个月的工作情况,还有分析出这个段时间工作内容的饼图”
  • “请设计一份针对C/D级成员的技术培训计划,明确培训内容和考核标准。”

我们会以黄涛(为虚名)为示例做为分析,更好的进行数据展示。

整体团队代码编写情况

我需要了解到团队成的整体能力还有提交情况,以找出团队问题,以下为获取到的整体分析报告:

本评估基于代码提交量维度,完整能力评估需结合代码审查得分、缺陷率、架构设计贡献等综合指标。

低产出成员个人能力分析及建议

我们很明确了解获取到E级的成员,这里以暂时标注为低产出,我们需要了解到【黄涛】的最近工作情况分析,会特别关注到,以下为产出的分析报告:

很快我们便获取到技术深度不足、架构参与度低、代码质量缺陷的问题,这个分析是正确的。我们再继续找出黄涛最近一个月的工作内部情况分析,然后做为获取到最近工作情况及分析。

在这块上确实是工作参与上,编码上涉及到主要模块的偏少一些。

针对于部分成员的能力提升建议

团队的大体情况分析已了解,我们需要了解和获取到一些分析建议,提升团队成员能力。我们问Agent,设计一份针对C/D级成员的技术培训计划,明确培训内容和考核标准。

这里的提升建议是根据团队本身的实际情况来做的考核标准分析及提升建议,以符合团队实际情况为主。

整体情况分析

其实我们需要了解团队的实际情况还比较多,整体分析报告是代码质量、沟通协作、个人发展、团队平衡等整体分析报告情况,能为团队提供更全面的能力画像,还能基于数据驱动制定针对性改进方案,推动技术团队向高效、可持续的方向发展。

以下为整体情况分析的目录情况:

此为长文本的团队情况报告参考,会给出更为细致的报告分析,这里分析情况。

包括现状、技术、领导力、管理、平衡、激励、知识共享等多个维度的分析报告,会更加明确的给团队管理和成长更好的建议,更好的协作团队、个人的成长。

总结

此次探索多 Agent 技术在技术团队管理场景中的独特价值:其高效的数据处理与智能分析能力,打破了传统管理依赖经验判断的局限,推动团队管理向精细化、数据化、智能化转型。后续可进一步拓展分析维度,整合代码审查、缺陷修复时效等更多数据,完善评估模型。

以上为Agent在团队管理上的一些探索,也期望有兴趣的同学可以互相交流。

我在通用智能体上的探索设计初稿

软件工程师罗小东,拥有多年架构和平台设计经验,目前专注于平台与新技术的融合研究。

前言

通用智能体是开源AIP项目上进行的探索,这里是近段时间输出1.0初版本设计,另外所谓通用的意思不会约束在某一个场景上面。

概述

单智能体的限制还有chatbot的限制,这里主要参考扣子空间,OpenManus等设计。

原则依然是针对于业务深入,针对的是中小团队场景,私有数据和大模型结合,设计思路如下:

  • 结果型交付,需要结合业务有真实可用的输出
  • 结合内部真实场景,不要娱乐型AI,结果可用
  • 中小团队都能内部部署,低成本运作
  • 可以切换不同场景,多Agent通用场景和业务型场景
  • 过程还可以修改,可控还有进一步调整

执行过程通过规划-推理-执行-总结-结果这个流程,推理主要是使用ReAct设计,每个设计是思路不一,我有我思,也期望有兴趣的同学可以交流。

输出效果

我们可以来看看输出的规划文档输出效果,这里以一份短视频营销输出文档为示例(非内部数据):

这里是数据分析输出的效果,结合内部数据直接导入分析的(内部数据库):

还有网页版本的数据分析结果,这里会有比较直观的图形分析:

网页版本的分析展示在一定程度上效果较好,但是内容结构相对于Word版本来说,展示还需要进一步的提升。

产品设计

以下为产品设计思路。

交付型结果

出来的结果需要达到可用或是结合业务的,这里直接链接的内部数据资产平台,直接提供查询和全文检索:

以下为输出的电商数据分析例子:

整体效果内容较为丰满,如果有不同的要求,输出的内容方向,也会有不同的结果,这里是AI默认生成。

低成本部署和落地

考虑到低成本,中小团队可以内部私有化,去掉了虚拟机或是其它不一定需要的工具,在一些场景上可能无法实现,比如浏览器RPA操作。

考虑到稳定性,这里数据检索,我们通过数据资产套件来处理,另外结合搜索引擎网络数据检索来实现。

下面是数据抽取的简单流程:

实时部分我们通过Chatbot来做显示进度还有运行情况,如下图:

这样也可以显示效果,我们发现也是可以满足场景需求。

多Agent多业务场景

我们之前研究看到的,类似Manus,它的Agent协作是固定的,这些在输出结果精度,幻觉,检索等方面需要较高技术难度,内容可能不够聚焦。

在这里我们设计场景Agent可以自定义选择,每个场景,有专门的Agent有自己行业的知识库等,使得Agent还有结果聚焦在这个业务场景上面。

通过多种Agent的选择和自定义,我们可以灵活的选择和搭配不同的智能体能力。

结果可控可修改

我们需要规划的结果可以修改,每个规划阶段过程也可以修改,以下为整体的设计界面:

左边的规划结果是可以调整修改还有重新生成结果的,内容也可以编辑,达到更优的结果。

以下为输出的指定Agent来做报表输出,也可以不同场景切换不同的Agent来做输出:

报表输出的结果显示也是由AI生成,每个显示结果和报表都做了二次设计和定义不同的指令。

总结

以上为在通用场景上的研究情况,有一定惊艳的效果,主要是让我们的AI设计往交付行结果走了一步,前期跟客户进一步沟通的情况,假如说大家的设计架构是一样的,其它的就是Agent数据资产的优劣程度,数据质量的高低,行业数据资产和AI这部分将是我们下一步深入探索的部分。有兴趣的同学也可以交流。