行业资讯

加入亿拓客·流量大师 撬动财富之门!!!

大模型多智能体系统赋能券商高质量发展

wang 2026-06-28 行业资讯
大模型多智能体系统赋能券商高质量发展

编者按

本文系统阐述了大模型多智能体系统在证券行业的应用架构与实践路径,提出了从协作机制建模到三层架构设计的完整技术方案,并结合国泰海通证券的实际案例展开说明。该大模型多智能体架构,通过任务图分解、角色编组、批注评审等原语构建了高效的协作机制,依托三层复合映射架构与微服务容器调度,实现了稳定可靠的工程韧性。实践证明,该架构显著缩短了业务流转时延,提升了服务精度,具有较强的行业参考意义。

文/国泰海通证券股份有限公司首席信息官   俞枫

国泰海通证券股份有限公司技术研发部总经理   黄韦

国泰海通证券股份有限公司技术研发部总经理助理   詹婷婷

国泰海通证券股份有限公司技术研发部   周玉勰   谢一凡

大语言模型为证券行业智能化转型带来了全新机遇,但当前证券公司在大模型智能体落地过程中,仍面临核心发展瓶颈。传统单智能体堆叠模式,无法从根本上解决证券业务应用规模庞大、交互链路复杂、响应延迟高等痛点,而金融行业强监管要求与高专业壁垒,也让单一模型极易暴露内容幻觉、垂直领域深度不足、合规风险突出等固有缺陷。

构建多智能体协作体系是突破上述瓶颈的有效路径,通过多智能体分工协作解耦复杂金融业务,可充分发挥大模型的任务规划与逻辑推理优势,借助多主体相互校验降低出错率,显著提升系统智能水平与运行可靠性。目前,国泰海通证券已推出业界首个全AI证券App“国泰海通灵犀”,实现了智能投顾、风控等八大业务场景的AI化突破。基于这一行业前沿实践,本文将从协作机制与系统架构两个维度切入,深入探讨适用于证券业务的大模型多智能体协作系统架构设计。

相关研究

大模型与多智能体技术的融合(LLM-MAS)已成为行业研究热点,大语言模型为智能体赋予了强大的自然语言理解与逻辑推理能力,推动智能体在知识获取、泛化能力、交互模式上实现代际跃升。

当前LLM-MAS研究聚焦于Agent角色定义、记忆机制、任务规划与工具调用能力构建,核心是探索多智能体协作模式,已形成集中控制、去中心化交互、混合架构三类主流协作范式。期间涌现出MetaGPT、MegaAgent等代表性系统框架,前者以集中控制+专业角色分工提升复杂任务完成质量,后者凭借分层分治架构实现了Agent的动态生成与灵活调整。

整体来看,相关研究正沿着丰富协作模式、完善底层架构两大方向快速推进,为证券行业构建大模型多智能体协作架构提供了核心理论参考。

协作机制建模

为了使多个大模型Agent能够高效、无缝且符合金融强监管标准地协作完成,诸如投研报告生成、合规审核、高频量化回测等复杂的证券业务任务,我们提出并构建了一套统一的多智能体协作机制模型。该机制模型深入解构协作的基础原语,涵盖任务图结构化分解、智能体角色编组、批注式评审、全局语义上下文共享,以及辩论式生成等核心模块,并最终将其统一于一个多智能体马尔可夫决策过程的严密数学框架之下。

复杂证券业务任务往往由多步骤组成,可以用有向图对任务进行表示。图中节点表示子任务(如“获取市场数据”“生成研报摘要”“合规检查”等),边表示依赖或顺序关系。通过引入任务图生成器,系统可智能地将用户请求映射为任务图,维护各子任务的逻辑依赖。任务图为Agent协作提供了清晰的结构,可进一步支持异步并行执行。本文用有向无环图(DAG)对任务进行表示,将一个业务请求建模为任务图

G=(V,E)

其中,V={v1,…,v|v|}为子任务集合,每个节点v∈V对应一个原子子任务,例如“获取市场数据”“生成研报摘要”“合规检查”等。

为有向边集合,表示子任务vj依赖于vi的输出。

通过引入任务图生成器Fplan,将用户自然语言请求x映射为任务图

其中为基于大模型(或结构化提示)的规划参数。实际实现中,Fplan通过“思维链+工具调用模板”引导LLM逐步产出节点集合和依赖关系,再规整为DAG。

为刻画任务执行过程,引入任务状态,其中为时刻t已完成的节点集合。可执行的子任务集合为

即所有前置依赖已完成的节点。这样,任务分解与执行天然对应一类多阶段决策过程。

根据任务图划分任务,可以将Agent组织为若干功能小组,每组负责特定子任务或任务阶段。这种角色编组类似专业团队分工,如资讯组处理信息收集加工,投研组负责策略生成,合规组负责审核把关等。组内Agent可以采用去中心化方式直接通信合作,而组与组之间通过更高层次的Agent或调度模块协调。编组的好处在于高内聚、低耦合。组内Agent紧密协作完成共同任务,组间通过消息总线松耦合交互。这提高了系统扩展性,新增业务只需添加对应Agent组而不会影响其他部分。同时,层级化的组结构有助于在复杂协作中引入监管与反馈机制。

为提高多Agent系统输出结果的准确性和可靠性,通过引入批注式评审机制,即由特定评审Agent对其他Agent的中间产出进行审阅和批注,提出修改意见或标注问题点。例如,在研究报告自动生成场景中,一个评审Agent可以对撰写Agent生成的报告草稿添加批注,然后将批注反馈给撰写Agent进行修正。这样的审校循环类似于人类写作中的编辑过程,利用Agent自身的语言理解能力发现逻辑错误、不一致或违规内容并纠正。批注式评审在金融场景尤为重要,可用于合规审核、风险评估等环节,确保最终输出经过多轮把关,更加可信。

设系统中存在Agent集合

第i个Agent具有策略、工具能力集合和角色标签(如“资讯解析”“投顾决策”“合规审核”等)。为体现“高内聚、低耦合”的编组思想,可定义从任务节点到Agent组的映射

其中g(v)为承担子任务v的Agent组。例如,资讯类节点vnews映射到“资讯加工组”

g(vnews)={采集Agent,解析Agent,摘要Agent}

任务执行时,由调度器从中选择一个待执行节点vt,并从g(vt)中选择一个具体Agent it执行,从而形成联合动作

多Agent协作需要一个共享的知识与上下文视图,以避免各Agent各自为战、信息不一致。通过引入语义上下文管理系统来实现Agent间的高效信息共享。具体而言,可采用一个共享内存或知识库存储所有Agent可访问的关键上下文,包括用户提供的信息、各阶段中间结果、外部检索到的知识等。每个Agent在执行任务时,先从共享上下文中获取目前任务相关的数据。例如,当资讯解析Agent完成市场要闻摘要后,将结果写入共享上下文,供投资策略Agent后续查阅调用。语义上下文管理需要解决信息筛选和权限控制问题:可设计语义标签机制,仅推送相关内容给需要的Agent,并确保敏感信息只让合规Agent访问。这种共享上下文机制既可减少冗余查询,也可保证协同一致性。

整个多Agent协作可建模为一个集中式训练、分布式执行的多智能体马尔可夫决策过程

其中,状态空间:包括当前任务图执行进度、已生成的中间文档质量评估、系统负载等,记为

ct为质量信号(如BLEU/ROUGE或人工评分预测),为当前资源/延迟指标。

动作空间:调度器在时刻t选择的动作

状态转移核:由选定Agent执行子任务后产生的新状态。

回报函数:兼顾业务质量、延迟、算力成本等因素。

为折扣因子。

我们引入集中式调度策略,其目标是最大化整体业务效用:

其中单步回报定义为

qt:当前关键产出的质量评分(如答案正确率、研报摘要打分、合规评分)。

dt:当前步骤带来的额外响应时延。

cost:当前调用LLM、工具的Token消耗或算力成本。

为超参数,用于在质量、时延与成本之间权衡。

下图为多智能体任务调度的层次化强化学习的伪代码框架:

辩论式生成:借鉴人类辩论中的真理发现过程,我们在多Agent协作中融入辩论式生成机制。即让两个或多个Agent就某个问题或决策展开对话辩论,通过相互提出论据和反驳,最终由系统或第三方评判Agent择优输出答案。这一机制有助于暴露谬误并提升结论可靠性。在证券领域,这种辩论Agent可以用于多个场景,例如投资决策支持场景,让多名“虚拟投顾”分别给出策略并辩论,可揭示不同策略的优缺点,供人类参考决策。在实现上,可设定辩论流程的轮次数N,以及最终评价标准。通过多Agent辩论,系统能以类人团队讨论的方式迭代优化答案,提高可信度和稳健性。

综上,我们构建的协作机制模型(见图1)。根据用户任务生成任务图,划分出子任务节点;为每类子任务指派一组专职Agent处理,并通过共享上下文交换信息;各组内部先后执行,过程中对关键结果由评审Agent批注把关。

图1 统一协作机制

针对需要综合决策的问题,触发多Agent辩论,借助交叉检验产出高质量答案。

该模型旨在统一多智能体协作的各要素原语,为下文的架构设计奠定机制基础。

系统架构设计

我们提出一个面向证券业务的大模型多Agent协作架构设计,包括基础模型与工具层、Agent容器与编排层、业务适配层。在原有工程描述基础上,引入一个统一的数学抽象,刻画各层之间的映射关系与整体优化目标。平台可抽象为一个三层复合映射:

其中,:基础模型与工具层,实现从“文本/结构化输入+工具调用”到“语义输出”的映射。

:Agent容器与编排层,实现从“任务状态”到“调度决策与多Agent协作轨迹”的映射。

:业务适配层,实现从“协作轨迹”到“业务可消费的结果与指标”的映射。

我们的目标是针对给定业务分布下,最大化整体业务效用函数U:

其中为调度与协作策略参数,为基础模型与工具选择参数,为业务侧策略和模板参数。U(·)可以由多指标加权构成,例如用户满意度、合规得分、平均响应时间的负值等。

1. 基础模型与工具层

底层是基础模型与工具层,提供智能的核心能力来源,包括预训练大语言模型、专业微调模型以及各种工具插件接口。首先是大模型基座,可采用“一大N小”的1+N模型体系,即一个通用基础金融大模型作为核心,配合N个针对细分业务场景微调的子模型。1+N架构能融合开源和闭源模型优势,以通用大模型为底座,加上经场景语料微调的子模型群,共同支撑各种业务的灵活应用。这些模型通过统一的模型服务对外提供文本生成、问答推理等能力。

其次是工具插件,包括金融数据检索、行情查询、计算引擎、邮件/短信发送等接口。通过与LangChain类似的工具调用机制,将如搜索引擎、数据库查询、计算器、API调用等功能封装为工具,使Agent能够调用。

2. Agent容器与编排层

中间层是架构的核心,即Agent容器与编排层。这一层负责运行和管理多智能体,处理它们之间以及与下层基础能力的交互协调。首先,我们采用容器化技术封装每个Agent,赋予其独立的运行环境和资源控制,类似微服务架构下的服务实例。所有Agent容器注册到调度与通信框架下,由以下组件支持。

消息总线:采用消息驱动架构,通过一个高吞吐的消息队列系统作为总线来传递Agent之间的消息和事件。消息总线承担Agent通信的中枢神经,当某Agent需要将结果发送给另一Agent或发布事件时,统一经由总线投递。这样的设计确保组件间解耦,Agent彼此无需直接调用,只需订阅/发布相关主题消息。同时,总线方便实现广播和多播,支持一条信息被多个订阅Agent获取,实现上下文共享。消息总线也会记录消息流用于追踪审计。

Agent调度与追踪:由Agent调度器统一管理Agent的生命周期和任务编排。当任务图生成后,调度器依据任务节点分配或启动相应类型的Agent容器,并通过消息总线指派任务上下文。调度器负责Agent的创建、销毁、负载均衡等,以充分利用算力资源。同时一个追踪子系统实时监控各Agent执行链路,记录每个任务的Agent调用链和耗时,帮助定位性能瓶颈或异常Agent行为。调度器也维护Agent状态机,跟踪Agent是否空闲、执行中或出错,并在必要时重启或替换Agent实例以保证任务顺利完成。

会话与上下文管理:在编排层还实现了多Agent会话管理,维护不同用户会话或任务上下文的隔离。每个会话可以视为一个逻辑工作流,包含该次用户请求涉及的所有Agent及消息轨迹。系统利用唯一的会话ID将消息总线中的通信归集,使同一会话内的信息不泄露到他处。上下文管理模块对接下层共享知识库,在每轮Agent处理前注入当前会话的知识上下文,并在处理后更新知识库,从而实现上一节讨论的上下文共享功能。

Agent容器与编排层通过抽象出统一的运行环境和通信机制,让上层无需关心具体Agent部署,实现“编排驱动协作”,开发者定义好Agent类型和交互逻辑,其余如通信、调度、扩展都由该层自动完成。

3. 业务适配层

顶层是业务适配层,负责将能力与具体证券业务场景结合,提供面向终端用户的应用服务接口。证券行业应用众多且各有特点,需要在这一层进行灵活的定制与封装。

一方面,将中间层的通用多Agent协作流程,封装为业务模块API,供各业务系统调用。这套流程对上暴露为一个服务接口,供手机App或Web调用,实现与现有业务系统集成。不同业务会定义各自的Agent编排流程,但都运行在统一架构上。

另一方面,业务适配层需根据实际业务需求,对Agent行为进行策略配置和模板定制。例如,在智能问答场景中,可为问答Agent定制证券领域的系统提示,限定其回复风格和合规用语;在合规审查场景中,可配置审核Agent遵循监管规则列表,对涉及禁止内容时采取特殊流程(如升级人工复核)。这些业务规则和提示词在适配层维护,确保每个Agent在不同业务上下文中行为符合预期。

通过三层架构划分,达成了分工明确、层次清晰、易于扩展的设计:底层专注提供智能和工具能力,中间层负责多Agent协作的普适机制,上层实现面向业务的定制组合。各层通过明确接口衔接,在保证灵活性的同时降低了系统复杂度。特别是中间Agent编排层,通过消息总线、调度器等实现了解耦和标准化,可方便地增加新的Agent类型或调整协作流程,而无需对整体架构做出大的改动。

国泰海通多Agent架构实践与应用

国泰海通证券2017年起前瞻性全面布局AI,在大模型技术爆发后第一时间展开相关技术研究与应用,2023年行业首家创新提出并构建了“1+N”大模型应用架构,以系统性应对大模型在金融领域应用时面临的专业性、可信性与经济性等多维挑战。在2024年,全面升级“ALL in AI”的人工智能应用策略,将大模型为代表的AI作为组织变革的驱动力,进一步打造“科技引领”行业示范创新,深入推进集团的全面数智化转型(见图2)。

图2   “1+N”架构理念

目前多智能体协作已初步落地于多个业务模块,成为驱动业务创新的关键引擎。下面选取几个典型的Agent模块,介绍其功能和协作方式。

资讯加工智能体流水线:面对海量财经资讯和研报,传统处理方式难以及时筛选价值信息。通过构建AIGC内容工厂流水线,实现资讯的自动加工和个性化分发。其背后是一组协作的Agent集群,资讯处理Agent处理内外部渠道的新闻、公告、研报等不同格式文本;内容解析Agent利用LLM对原始文本进行关键信息提取、情感分析和标签化处理;摘要生成Agent据此产出要点解读和短评;质量评审Agent对摘要进行批注审核,确保准确客观;最后推送调度Agent根据用户持仓和关注偏好,从加工后的资讯中生成个性化的信息流。整个过程类似一条流水线,各Agent各司其职又紧密衔接,实现了资讯的实时化、场景化、精准化支持。用户从过去被动浏览海量资讯,转变为系统主动推送定制信息流,大大降低了信息过载。

智能问答Agent:针对券商海量业务咨询和个性化需求,以多智能体架构提供对话问答能力,打造对话式智能服务前端。用户可通过自然语言或语音输入投资问题,经由“规划子Agent”解析意图并拆解任务,由“执行子Agent”进行工具调用并获取各类结果,再由“总结子Agent”整合工具调用结果生成结构化回答。同时支持指令交易,实现从问答、分析到交易执行的一体化流程。整个过程依托工具插件生态动态调度行情接口、交易系统、金融数据库等内部工具和数据,确保响应内容准确、合规、可追溯。

盯盘Agent:先由用户诊断Agent让用户了解自己的MBTI与投资风格,再由大盘研判Agent感知外部信息、分析市场风向,自动监控并提炼重要宏观及行业信息,由策略生成Agent调用底层算法,提供覆盖基本面、技术面、消息面、资金面的十余种智投策略。对于客户的自选或持仓资产,则实时触发异动监测Agent并进行全天候盯盘,标的出现价格变化、资金流向异常或重大舆情时,会迅速综合上述策略Agent的分析结论,生成明确的辅助决策建议,并以最快速度推送给用户。

公司的大模型架构体系已经在资讯、投顾、风控、投研等关键业务环节部署了多Agent协作模块,形成了“AI中枢驱动”的业务支持体系。1+N架构为各Agent提供了统一强大的大模型底座和专用子模型支持,而多Agent编排让AI能力渗透到每个业务流程,将专家经验固化为可复用的智能体。这些智能体模块之间也并非孤立存在,而是可以通过消息总线联动。这种Agent集群协同构成了券商数字化转型的新型基础设施,在提高效率的同时也赋能了千人千面的个性化服务(见图3)。

图3   全栈技术路线

评估方法与策略

构建一个大模型多Agent协作架构体系后,如何科学评估其性能和效果,是确保系统实用性的重要环节。我们建议从以下几个维度对架构体系进行评估,并制定相应的量化指标与策略。

协作效率:衡量多智能体协作是否真正提高了任务完成的效率和质量。可选取若干典型业务任务,比较多Agent协作与单Agent或传统流程在用时、准确率方面的差异。例如,统计完成同一组咨询问答所需的平均响应时间、答案正确率。如果协作带来准确率提升即为正向效果。同时需留意边际效益,增加Agent数量带来的效率提升是否递减,以确定协作规模的适宜范围。

通信开销与成本:多Agent协作引入了消息交换和多次模型调用,可能带来额外的通信和算力开销。需要评估在效率提升的同时,这种开销是否在可接受范围之内。具体指标如,单任务平均Token消耗、消息往返次数、额外延迟时间。Agent目前在深度协作下单次任务可能动辄十万级Token消耗,相比直接问答要高出数倍,需要通过提升结果质量来权衡。目标是在保证质量提升的前提下,将协作带来的额外Token和时延控制在合理比例,从而实现性价比最优。

用户体验与业务指标:最终的价值需体现在业务层面的提升上。这部分评估应结合具体应用场景,通过用户反馈和业务KPI来验证。如客户对于智能问答的满意度评分、使用频率变化;投资顾问模块上线后客户转化率或资产提升率的变化;因引入AI导致的人力节省数量等。业务指标的改进将是对架构体系有效性的直接证明。

通过以上多维度评估,可全面了解架构在技术性能和业务价值两方面的表现。在实施评估时,要注意建立完善的数据收集和分析机制,保证指标测量的客观准确。同时,评估应是持续的过程,随着版本迭代定期进行,以驱动系统不断优化。只有在迭代中不断以数据指导改进,才可真正成熟并最大化地发挥多智能体协作的作用。

总结与展望

本文深度解构了面向证券业务的大模型多智能体架构:通过任务图分解、角色编组、批注评审等原语,构建了强大的协作机制;借助三层复合映射架构与微服务容器调度,实现了坚如磐石的工程韧性。实践证明,该架构大幅压缩了业务流转时延并提升了服务精度。

展望未来,多智能体体系将朝着三大方向演进:一是打破模型垄断,实现异构模型的全域支持与跨模态深度协同;二是走向AutoMaAS的生态自治,依托强化学习在实战中自主演化协作拓扑并实施宏观弹性算力调度;三是原生内嵌自监督反馈闭环与信息流控制防火墙,并在全行业推出统一的标准协议底座。我们期待在不久的将来,证券从业者和客户都能从这样一个强大的AI协作网络中获益,赋能开启金融服务的新篇章。

参考文献

[1] 王强.大型语言模型在金融信息处理中的应用研究[D].北京:北京大学,2024.

[2]Consultancy.eu.The EU AI Act:The impact on financial services institutions[EB/OL].https://www.consultancy.eu/news/11237/the-eu-ai-act-the-impact-on-financial-services-institutions,2025-01.

[3] Bahoo Saeed,Cucculelli Marco,Goga Xheni,et al.Artificial intelligence in finance: a comprehensive review through bibliometric and content analysis[J].SN Business & Economics,2024,4(2):23.

(此文刊发于《金融电子化》2026年4月下半月刊)

金科焦点 • 推荐阅读

重磅:中国国际金融展解码低空经济“数字金融”盘点

技术:量子鼎新大模型数据

指引:高层政策行业学术专访

猜你喜欢

发表评论

发表评论: