我在AI工业场景与斯蓝科技落地场景技术分享

软件架构师罗小东,多年架构和平台产品设计经验,目前在Agent场景落地结合中。

概述

此为针对于AIP在垂直领域场景,结合开发组、专家组能力进行的场景设计。

这个是一个AIP比较典型的行业垂直领域场景。

工业场景领域很多块,这里主要是针对于工作能源上AI场景的应用探索,与广西斯蓝科技在工业领域上的AI智能体探索与落地,考虑各方,这里做具体场景的规避脱敏,只做技术讨论,不涉及具体厂家及数据。

整个从合同鉴定到当前差不多半年左右,属于一期,中间涉及几方,主要包括专家侧、客户侧、开发侧、平台侧,这里属于平台侧,针对于场景提供技术解决方案和针对性做的开发和调整。前期主要遇到比较明显的问题和需求,这里主要列出以下几点:

  1. 数据问题:能源型的数据量大,数据复杂,而且各方来源数据格式不一;
  2. 政策问题:行业领域要求政策或者相关标准会变动,各方面数据需要及时更新;
  3. 开发问题:特定行业的展示需要比较清细的数据,过程计算需要准确,而且计算过程结果要准确;
  4. 模型问题:幻觉始终会存在,计算报告产出需要可以了解到整个上下文计算过程;
    ….

这里解决的方式有两个方面针对的是智能体上下文处理、知识库处理、数据的清洗处理、还有推理工具集成,另一个是行业算法模型、AI场景自定义等,主要的目的是尽量和接近于专家场景和能力,达到一定的实用价值。这里处理过程涉及,我们从下往上阐述:

  1. 行业领域政策和相关标准数据采集清洗,结合行业领域数据清理和更新的处理
  2. 能源数据的数据治理和清洗、还有数据的转换处理,同时提供出给上层AI智能体使用
  3. AI与算法计算过程的显示记录和最终结果展示处理,反馈给专家侧

这里有一定很重要的考虑是”轻”还有快,以进一步的中小型企业的AI落地和场景结合,以上为当前与工业场景能源域的一些处理过程 ,同时过程也与行业专家进行交流,每个设计师有自己的解决方案,我有我思。

建设内容

以下涉及图片不涉及真实场景数据

基本的建设过程,主要针对于工业能源领域多源数据,包括能源消耗、政策执行、产品排放等数据结合,同时与AI结合,整理出对应的动态监测、监查报告、场景知识库等AI能力。

数据处理

针对于AI的数据处理,这里并不单纯是以RAG为基础,在这里的设计主要包括文档材料、网络材料、行业数据、政策数据、还有各类型的算法公式,来源数据场景分析。

多源数据处理更偏向于数据治理层面,但是数据中台偏重,成本过高,技术及维护难度大,并不适合中小型项目及AI的轻量化,在这里处理的方案是:元数据管理+数据仓库+数据资产 的设计方向,技术为湖仓一体化 iceberg + spark + minio的轻量型技术,针对于解决TB级数据,做到成本可控、中小规模、低成本、快速落地的湖仓一体化。大致的划分如下:

  1. 元数据管理:这里主要是做所有过程的元数据、分类、空间、还有表等进行的统一管理
  2. 数据仓库:使用分层计算流程,基于pyspark能力,最终输出使用层数据
  3. 数据资产:针对于数据的使用与管理,包括分类分级、安全接口、提供API或者接口能力等

除了上面的,还有抽数据、采集等控件,周边功能这里不做阐述,最终AI会与资产层数据进行交互,形成AI能力的动态知识库。

以下为元数据的非结构化管理及分类:

用于管理非结构化数据,在AI场景下会有大量文档类材料,为了更好的管理与维护。

非结构和半结构化的管理主要是针对于一些业务数据上传或者文件类上传,这里做了分类规划。在这个基本上,进行AI结合数据计算,并使用数据仓库分层治理,下面是分层仓库及对应的层级关系:

下面是整个计算过程,这里是开发最新的AI任务编排平台(主要考虑到中小型场景及轻量化)进行任务的管理与编排,类似于DolphinScheduler,但是这里集成了AI的能力和排队的能力,就是数据在处理过程中,同样可以结合AI一起,而不再是单纯的SQL处理。

这里就是基本上的湖仓结合的处理,最终数据的流向会写入数据库中,数据资产平台进行标签化、在处理后的数据资源列表上进行分类分级、并提供出服务接口。

补充数据资产图

通过上面的方式,主要解决掉的是非结构化、结构化、大数据量问题、行业领域政策和相关标准数据更新问题,主要为AI能力建设做准备,同时也是AIP下一步可信数据飞轮做好基础。

业务场景与AI结合

数据与AI结合的方式及表现形式会有多种,AI场景化比较丰富,除了基本的知识库、工作流、AgenticAI以外,还有搜索场景(类似于DeepSearch),结合的方式有MCP方式、向量化、全文检索、上下文工程、还有数据库方式。

上面的处理方式只是偏向于一种AI智能体的技巧,最终的目的是为了得到符合要求的输出结果。

这个在有了初步数据能力情况下,AI智能体流程自然而然走下来。

工业数据计算场景很多,一份报告的产出需要大量的过程计算还有明确参数化,专家需要精细的数据计算和验证,还有确保每个阶段是否正确,同时做好审核验证,计算过程和公式和所带参赛是否满足,是确保最终的报告数据是否可用的主要条件之一。

总的来说,需要看到完整的计算过程,AI过程不要是白盒,同时满足卡片现实,友好界面要求,还需要可以导出word版本。

这个主要是调整工作流和流程的显示优化处理,如下:

另外其它知识库和同步添加引用查看来源,标记内容反馈等。

出了本身大模型的能力和上下文技巧,这里结合高质量的数据,尽量可以最短的最有效的上下文获取到一个流程节点的去幻觉化,主要达到每个过程可查,可找,可看,有问题的地方清楚,明确,目前AI大模型已经有非常高的推理和理解能力,流程走下来,这个基本是可以达到的预期的目标。

总结

本阶段AIP在工业能源领域的AI落地探索,通过“湖仓一体化架构+AI任务编排平台”的轻量级技术方案,解决垂直场景相关问题。后续进一步深化AI与工业场景的适配性,例如拓展更多能源细分场景,优化智能体的交互效率,以更贴合专家工作流的方式,高效率地实现AI价值落地。
以上为AI智能体的一些落地建设参考,有兴趣同学可交流沟通。

我在AI出题阅卷与中医药大学的落地场景

软件架构师罗小东,多年架构和平台产品设计经验,目前在Agent场景落地结合中。

背景

这个是前期智能体场景在教育场景的探索,主要场景结合方是在广西中医药大学信管专业的场景探索。

概述

此为针对于AIP在学校场景上在Agent多项目团队上的研究落地场景探索。

这里大概是25年后的切入,整个AI智能体场景建设搭建2-3个月,与专业老师共同设定的场景是AI阅卷与AI考试,针对和提升平时测试和随堂练习。

主要能力如下:

  • 可以根据要求出题目,包括老师课件,PPT还有相关的课程教材等;
  • 出题之后可以设置相关题目和安排在线考试,AI阅卷即时评分给出考试情况分析;
  • 另外还有每个题目详解评分评语等,在线下载试题。

AI出题、考试与阅卷是AI能力结合教育场景的探索和落地,同时也是一个理想的入门场景,这步AI场景的落地,也是为教学场景数据分析结合(目前进行中)做好一个基础。

每个设计师有不一样的设计,我有我思。

建设内容

这里主要是介绍AI的智能体的能力和效果,主要是:

  • AI出题:搭建学科智能体和设计学科知识库还有上传解析docx/ppt文件等;
  • AI阅卷评分:学生老师在线即时评分评语,给出题目解析和结果分析,薄弱点解析和建议;
  • AI出报告:评分和出完评语,整理成报告分析结果,导出pdf文件。

此外,还包括其他系统性功能,作为AI能力的过程管理和辅助。

AI出题

出题需要结合课程和课堂内容,这里主要包括教案和课件ppt,还有教学大纲等,这些一部分作为知识库导入给AI,另一部分作为附件上传解析。

以下为出题界面,可以选出单选、多选、填空、主观、图片等类型题目,还有题目难度等:

以下为题目二次调整界面和在线考试发布界面:

在这个过程中可以调整相关内容,二次配置试卷,也可以导出带有评语和答案的word文件。

AI阅卷

提交考试,可以在线或是手机扫码阅卷,在学生考试完成之后,提交答案AI阅卷专员会自动的进行即时阅卷,整个过程大约需30秒。目前针对约50人的班级进行阅卷,流程顺畅,效果良好。

以下为AI在自动阅卷过程:

在初步完成阅卷之后,会产出报告分析,以下为报告界面:

另外还有题目评语,老师可以在相应界面查阅AI的阅卷分析及详细内容,以下为老师阅卷查阅界面:

老师可以针对于试卷进行二次评分确认,包括调整评语,再进行导出。

总结

这个是25年3月份左右的场景建设,整体建设和落地场景符合预期,同时也是AI切入场景典型能力体现,一些建设过程,也期望给一些参考。同时目前在建设AI与教学数据结合场景会更深入的结合教育场景和业务,有兴趣的同学亦可交流。

我在AI写文档与优腾科技的落地实践

软件架构师罗小东,多年架构和平台产品设计经验,目前在Agent场景落地结合中。

概述

此为针对于AIP智能体在企业长文档上的落地成果参考,在广州优腾科技内部落地实践

概述

这个场景落地的情况有一段时间(将近一年左右),主要解决的是外包和中小型团队的交付及项目过程、还有内部管理的文档问题。

优腾本在文档上常常会遇到项目文档、功能文档、标书编写等问题,遇到的情况是:

  • 产出问题:交付过程型文档编写需要高级工程师才能出稿,原模板文档需要对新人做培训,出版周期比较长;
  • 时间问题:每一份文档周期大概是半天或者到2周左右甚至1个月左右,比如周报、项目标书、解决方案;
  • 周期问题:项目前期(比如投标或者方案)情况不定,要求很紧,有些情况客户要求马上出东西或者看到东西,熬夜加班写稿会有常态;
  • 交付问题:交付过程需要有的时候非常多,不能调动新人参与或者交付内容有些文不对题;
  • 质量问题:内容前期都是通过经验或者前期的项目文档参考,这些有些新旧不接,各种错别字或者标点等;
  • ……

这些应该在很多项目里面都会有遇到,前期的管理流程大都会有评审环节,另外偏向于技术型团队,开发部分占了很大比例,写文档往往成本加班的活。这里主要是前期探索和引入AI能力来解决类似的问题,有一定的效果,过程人员也对AI有一定的粘性,这里主要是做了两方面:

  • AI智能体的构建: 针对于不同知识库,构建不同的智能体,比如标书与方案的知识库不一样的;
  • 配置多级别写文档场景: 针对于一般写文档场景和高级写文档的场景,对标的标书和一般的概要性文档,还有方案文档;

面对的内部人员有销售、商务、开发、管理几类型的角色,AI处理的流程是根据上传材料或者要求先出版本,然后产出的内容二次AI编辑,再导出合稿,以下为AIP团队在AI写文档上的一些落地探索。

AI写文档过程

这里为了更好的演示,我们以长文本为示例说明(即上百页的文档)

这里为了更好的理解,我们以一个管理的角色示例来进行阐述,以写方案的场景为示例。现在收到几个客户或者友商要一起针对于某个场景出方案,需要输出整体方案部分,这个时候,可能需要出多份。

AI整理初稿

这里我们选择高级的方案编写场景,如下图:

简单整理一下需求或者整理成文件上传,提要求,同时选择行业的固定模板,这里选择[数据分析项目方案]和[标书技术方案]部分,确定之后由AI进行编写。

进行二次编辑

AI输出的版本周期比较长,大概是半个小时或者1个小时左右,目前遇到很多情况下是商务会吃饭前执行,或者晚上执行。当然,也可以进入再次看他的执行情况,不过一般没有必要,可以在AI出来一版本之后再查看。

下面是出来的一份技术标书示例,已经按招标需求整理了需要的目录章节,然后再过一下内容点,基本上会环绕需求内容来进行描述,如果发现某个章节不符合或者偏离较大,或者重新生成或者进行小范围的二次修改,如下重新生成:

下面是进行小范围二次修改。

做过很多次对比,目前AI生成的情况还是可以有很大的优化空间,内容可以再进一步的贴近需求,这也是下一步提升的地方。

同时也对比前期人工方面的,专业性还有周期时间上是人工很难对比的,甚至有些没想到的,AI都会补充上去,效果其实是超过前期人员编写的情况。

其它的就是导出成Word,这里是按整理文档导出,大概是135页。

总结

这个是AIP智能体在AI写文档落地实践解决了项目文档编写过程的场景。面对以往交付文档需要高级工程师耗时半天到一个月编写、新人难以快速上手、经常熬夜加班、内容质量参差不齐等问题,

这里建立了”AI整理初稿+人工二次编辑”的高效工作流程,以提高效率,将编写周期缩短,体现AI的能力及实用价值,也是团队在AI落地场景上的一些落地实践。

以上为AI在团队管理上的一些实践,也期望有兴趣的同学可以互相交流。

我对Agent分步任务的设计思路

软件架构师罗小东,多年架构和平台产品设计经验,目前在Agent场景落地结合中。

概述

这里主要实现的是AIP在多步任务的能力设计,后续还会继续加强Agent专业程度,深度场景能力结合,这里的AI设计依然定位在辅助人的角色。

Agent分布任务会在很多地方有用到,比如Agentic AI、ReAct推理、深度搜索、CodeAct等都有使用到,类似于Manus、扣子空间交付结果型的场景都会有用到。

过程主要覆盖智能体任务拆解、状态记录、流信息、上下文处理、文件处理、长文本上传、内置工具、MCP工具等结合,还有异常处理策略等。这里是前期在用户使用还有项目比赛、实际场景中使用经验总结,大概内容如下:

  • 专家Agent交互形态的设计
  • Agent流程和自主多步角色的能力设计
  • 多步推理的提示词设计
  • 动态知识库和静态知识库的处理
  • 上下文及异常的处理
  • 并发能力和模型的选择处理
  • 专家Agent的定制化和提示词设计
  • 结果输出和可二次调整处理

场景是针对于和聚焦在垂直领域场景能力的设计,这里并不含使用CodeAct,当前主要以输出GC为主,通用Agent暂时并不考虑,可以针对不同领域建设专业型Agent(特定领域知识库)然后放置到不同的多步任务场景中。每个架构师有不同的设计,我有我思。

整体设计

这里的整体设计主要是部分主要能力的设计,涵盖的部分较多,给出一些设计参考。

专家Agent交互形态的设计

专家形态的交互主要有四个形态,分别是聊天窗口形态、深入搜索形态、长文本形态、Agent群组,以下为AIP界面状态:

这三种形态上切入不同的专家Agent来切入不同的场景:

  • 聊天窗口形态: 即时聊天,简单的聊天窗,展示形态会类似于AgenticAI的形式;
  • 深入搜索形态:大概几分钟的任务,任务的规划到分布任务的处理,针对于问题更深入的输出,同时整理成稿,而且可以二次编辑;
  • 长文本形态:执行十几分钟或者1个小时的任务,超长文本的状态,场景主要是标书类型,可以整理成搞,而且每部分都可二次编辑。
  • Agent群组:每个专家Agent完成每个角色,如果在过多专家Agent的情况下,可以拉入到同一个群组(在平台上叫频道),方便管理。

以下为是长文本形态:

在这几种形态下面,进行专家Agent的切换,以满足不同形态的输出结果,同时每个场景会有可以定制的模板能力设计、场景能力设计等,形态多种场景能力结合。为了达到更灵活的,每个专家Agent包含有自己的静态知识库、动态知识库、MCP工具、提示词等场景设定。

同时还会提供专业Agent指定的数据资产查询能力,能切入到实际的业务系统中,融合Agent到实际业务场景中。

Agent流程和自主多步角色的能力设计

多步能力的设计提供包括Workflow工作流的设计还有自动规划能力的设计,这里能力设计如下:

  • Workflow多步执行:常见的工作流设计,偏向于稳定型的业务流程设计,界面展示会以卡片形式输出;
  • 规划-执行设计:由Agent先规划,再执行设计,反思调用由ReAct来处理;
  • Agentic执行设计:由Agent系统主动思考、规划和执行任务的能力,进行多步推理执行结果。

在大的多步执行框架里面,会包含有很多小的设计技巧,但是整个设计思路不变,不管是哪一步,都会以按预期的结果进行输出为目标。

这个过程的设计流程大体定的情况下,会尽量的缩小与预期结果的距离,除了上面的工程能力以外,我们会还在数据质量上进一步的加强集成,以提高Agent的专业性和业务能力,这里暂时不涉及数据的说明。

多步推理的提示词设计

针对于提示词的设计,结合的是静态和动态的方式,还有过程中不断的嵌入场景提示词,以达到更好与大模型交互。

  • 静态提示词:通过设置初始的角色提示词,与工具方向大的结合,可能会有一些提示词工程技巧,比如COT、示例演示等,这也是为什么专业Agent与通用Agent不一样的地方。
  • 动态提示词:在过程中不断的设计提示词,结合输出结果与过程的问题等,进一步的整理成提示词;
  • 知识库结合:三方文档和知识库的结合整理的提示词,这也是动态处理的一部分,但是这部分数据是动态生成和动态结合的,包括不仅是向量、还有数据库、文档、API等。
  • 场景模板库:针对于不同的场景,在选择不同的模板输入与输出,会定向的指定结果的输出还有内容的形成,比如方案指定的输出结构。

比如下面的场景提示词模型,会形成不同的模板库:

这里的设计基本上会满足很多内容输出的场景,同时结合内部的业务实际情况,输出不同的结果。

动态知识库和静态知识库的处理

知识库是当前Agent最常见的处理方式,RAG也是常见的Agent能力体现之一,这里知识库有RAG应用,也有记忆能力的应用,我们分了静态和动态的区别:

  • 静态知识库:最常见的文本向量化、或者直接文本形态,这类型我们处理成静态的知识库,同时记忆在后期的处理之后,也会转变成静态的一部分;
  • 动态知识库:针对的是对外获取、实时更新的信息来源;

静态知识库的处理,可能是用户文件上传、或者知识库又或者是前端外挂的知识库等。我们主要关注的是动态知识库,因为这部分主要是跟垂直业务场景很直接的关联,包括数据的准确性,输出结果的准确性等。

动态知识库主要是由数据治理部分处理,使用数据湖技术和数据计算框架技术来实现,主要是解决中小型团队海量数据使用的问题。

会经过网络采集、业务数据采集、文档采集等,过程ETL等处理,确保数据质量。

同时形成湖仓一体的结构,提供到数据资产平台,提供对外的API接口,提供全文检索能力、数据查询能力等,这部分是专家Agent能力的核心重点。

上下文及异常的处理

智能体运行过程中的稳定性问题是一个大的卡点,由于模型能力的不同、过程中数据加载数据量的不一等,往往在循环多次之后,就会因为超时、请求内容过长、请求次数过多等出现异常,从而导致任务过程中断情况。这里处理的策略有几种:

  • Rag策略: 内容过长的文本会处理成RAG或者做截取处理(策略可在Agent配置),结合内置的RagTool来进行内容检索;
  • 上下文工程: 定制上下文策略,长度策略,消息超时策略等,确保每一次对话的消息长度;
  • 异常收集:异常动态结合到提示词中,异常的问题不会也不能丢失,多步执行过程中需要异常的收集规避下一步的问题;
  • 汇总处理: 在过程中不同模型的输入输出,也很难说可以按指定的结果输出,或者说按结果判断,最后在收集不到答案时,会做一次汇总处理,以接近用户答案。

这些做成了可配置化,以符合不同的场景,比如下面是上下文的工程的配置界面:

通过上下文和异常的处理,很大程度上会规避掉Agent过程处理到半跑不下去的问题,但是这里只是技巧,更多的我们会将精力放在业务数据治理上,以确保Agent以最少的执行获取到最优的答案。

并发能力和模型的选择处理

这里暂时不提多账号的情况,这里是SaaS化的配置。

分步任务很多部分是在后台任务运行的,在交互上为了体验最好,这里做了SSE流的输出,但这必然也会带来一些性能和并发的问题,还有后台资源的问题等。在并发的处理上,这里主要处理的策略是:

  • 请求限流:这个是针对于不同的用户或者组织进行的限流设计,每个对话或者任务针对于不同的用户或者组织配置限制,规避无限任务的情况;
  • 线程池:单独运行或者长时间运行的配置单独的线程池,同时也提高数据库连接的线程池能力;
  • 线程链: 过程中使用了较多的CompletableFuture编程,以提高异步编程的能力,规避阻塞主线程;
  • 状态管理:主要是针对工作流和过程中的状态执行久化处理,过程状态进行过程节点;
  • 模型选择:在不同的场景,结合不同的模型,并不是一个模型处理完整一个链路,小模型快,会适合处理简单部分,大模型能力强,适合推理增强部分;
  • 分布式:微服务分布式的设计结合,这个是Java带有的成熟的并发处理策略,以规避单机带来的问题,在这里主要是使用k8s部分。

比如下面的工作流部署配置:

些策略主要是提高性能、可靠性及可扩展,更重要的是提高基础平台的稳定性,同时也会提高

结果输出和可二次调整处理

在完成结果输出之后,一般情况来说并不是说马上就可以使用,大部分的情况下需要做二次的调整,同时可进一步的编辑,在这里的结果做了AI编辑的集成配置和导出策略。

  • 内容导出Word或者复制,然后进一步的二次编辑,这个是比较常见的;
  • 针对于长文本和深度搜索场景,结合AI编辑器的能力,可以在针对的结果上进行二次AI编辑和修改,同样也可以导出word;

如下图:

形成AI生成、即时预览、AI智能编辑、格式调整、Word导出 的闭环流程。

总结

上面主要是Agent分步任务的设计思路设计,整个设计体现了几个关键理念:

  • 专业性与场景化:不同于通用Agent的广泛覆盖,我们聚焦于垂直领域,通过专家Agent的深度定制、专业知识库的建设以及场景模板的设计,确保AI输出结果具备实际业务价值。
  • 工程化思维:从交互形态设计到并发处理,从异常管理到结果输出,每个环节都融入了软件工程的严谨思维,确保系统在真实业务环境中的稳定性、可靠性和可扩展性。
  • AI辅助人定位:始终将AI定位为辅助角色,通过可二次调整的结果输出、AI编辑器集成等设计,强调人类专家的最终决策权,实现人机优势互补。
  • 数据治理结合:认识到高质量数据是Agent专业能力的基石,特别设计了动态知识库治理体系,将数据资产真正转化为AI可理解、可利用的业务知识。

这里的设计,给下一步的演进预留了足够的扩展空间,随着基础模型能力的不断提升,可以平滑地集成更好的输出和专业领域落地的能力。以上是在AIP上的产品设计,也期望给其它同学一些参考,有兴趣的同学也可以一起交流。

我对专业级Agent能力的提升规划

软件工程师罗小东,拥有多年架构和平台设计经验,目前专注于平台与新技术的融合研究。

概述

此为针对于AIP在项目团队上在Agent上的研究成果参考,临时手稿,会有一些口语化。

此次的升级,通过工具、数据、私有模型的结合,高质量的输出结果和场景结合,将为下一步形成自动化触发的做基础能力,比如根据环境感触自动执行任务输出结果(如环境感知→任务触发→结果输出闭环)。

针对的是AIP智能体平台的三四季度的规划,主要针对于落地和专业级Agent的能力提升,这里对专业级能力的理解是高级水平、高级能力,比如我要一份十几页Word技术方案,应该出来的就是一份高级水平的技术方案。

提升的基础在于在二三季度智能体和业务场景的落地经验,还有研究升级、探索经验上面,包括MCP平台、数据治理平台的可行性结合进行的规划。

这里提升主要基于三个部分:

  • 数据资产化
  • 私有模型专业化
  • 工具链深度集成

前期聊过类似于Manus、扣子空间这样形态会后面持续一段时间,包括目前的天工智能体形态也类似,在进一步的研究提升上面,我们觉得思路是对的,但是过程和体现形式上,需要做一些流程上的优化能力,同时要足够聚焦,我们需要更聚焦的场景来体现Agent输出能力。

将结合数据、专业数据一起,以结果为主的交付,随着大模型生态发展和应用结合上的不断成熟,结果会越来越专业。每个架构师思想不一,我有我思,期望可以给一些同学更多的参考。

提升准备

前期的AIP平台的形成的基础能力,主要是基于这一层上面做的AI大模型原生应用:

  • 智能体管理平台(全生命周期管理)
  • 轻量级数据治理平台(数据资产化)
  • 智能体应用客户端(多形态交互)

现有智能体输出形态已覆盖主流范式,集成的智能体输出形态,这里的形态指的是Agent设计思路,还有交互和输出模式,主要是智能体能力输出的体现:

  • 单智能体输出形态
  • 多智能体群形态
  • 多智能体结合场景形态
  • DeepSearch形态
  • 规划与执行形态
  • ReAct推理形态
  • MCP工具集成形态
  • Agentic智能体和RAG形态

对比开源或者市面上的智能体体现形态上来说,基本上大差不差,而可以使用更深入的方法论和理论,当前在集成过程中,需要更加的聚焦在业务能力和场景上,需要对Agent进一步的提升和落地能力,体现Agent价值。

提升方向

我们并没有使用AI工作流,而是使用”目标->推理->总结->判断是否符合->推理->符合->结束”这样的ReAct架构去完成任务。其实在这个模式下,结合MCP工具,结合出来的效果也不错的,但是需要更专业的智能体角色。

以下为数据资产化集成:

这里主要提升会针对于几个方面来着手,大模型聚焦在指定场景下,数据越专业、越实时,效果会越好,而在于工具都完善的情况下,提升的主要方向便是从数据上着手。

主要提升点:

  • 数据资产化:每个Agent的知识库,从数据采集、清洗、再到资产化,形成近实时的状态,做好资产归纳分类
  • 私有模型微调:规划每个场景下的私有大模型,并且私有部署,建立模型微调平台;
  • 工具针对化:每个MCP工具针对性要强,与资产化,数据化的能力结合适当;

以下为MCP工具集成:

为了上面的落地更加顺利,我们会将业务场景固化,不是每个场景都需要通用,需要固化的场景来固化效果,重在输出结果,还有体现这个场景的价值。

产品形态

以下为我们过程中一些产品形态和体现,这里我们将Agent归纳为几种形态,当然,可以通过这几种形态变换不同的场景,其它新的形态,我们会使用新的应用开发AI原生应用,以下为常见的形态展示,列出几部分:

  1. 单智能体输出形态,这里以数据分析智能体和AIGC为示例:
  1. 多智能体群形态,这里以群聊为示例,这个需要做升级,但是大体已经集成一版本:
  1. 多智能体结合场景形态,这里演示文档审核和企业智能库场景:
  1. DeepSearch形态,主要是基于类似于Manus一样的功能,这里做了删减,不涉及太多的功能,专注于分析、查询、研究类,生成报告和总结结果输出:
  1. 规划与执行形态,这个比较常见,数据分析和方案协作上:
  1. MCP工具集成形态,这里更为常见,主要是集成工具,主要使用ReAct来执行:

产品形态的体现和输出,这意味着这块的有一定的成熟度,其实很多项目都可能达到,但是最终还是会回归到数据上,不管是网络搜索还是爬虫,还是Agent自动打开浏览器都是为了数据,基于上面的多种形态,我们会统一的智能体管理平台,还有可以切换不同的智能体在不同的形态下处理问题,比如同样的写文章,推理和带有MCP、还有工作流的智能体是不一样结果的,所以我们提供了任意场景切换智能体的方式:

以下为智能体管理平台:

发布不同的场景还客户端应用商店和指定的场景:

这个过程中我们发现还是不能满足很多场景,或者说要探索很多场景,但是这些并不是我们想做的,目前更需要做的是聚焦在可落地场景上。

总结

这个是我们从通用能力转向专业、深度能力的一些探索,虽然说很多方向明确,规划通过”数据精准化、模型专业化、工具深度化”的三维提升策略,结合场景固化和流程优化,实现智能体从通用能力到专业级输出的质变。当前已完成技术路径验证,后续将聚焦高价值场景实现能力突破。