本文来源于:金融电子化,作者:东吴证券关键词:人工智能,数字化转型,算力

东吴证券:智算平台赋能券商数智化转型

2025-09-05 2093

东吴证券在数字化转型浪潮中积极探索“智算平台”的应用和落地,采用多种机器学习、大数据及智能网络管理技术,智能选取SGLang和vLLM等模型推理框架及算力调度,为证券业务ToC和ToB领域的创新发展提供了强大支撑,推动了金融服务的智能化升级。在提升业务效率、优化客户体验及加强风险管控等方面都取得了显著成效,也为金融行业的智能算力应用提供了有益的参考和借鉴。


一、算力资源的落地部署及智能调度


首先需要对多源异构算力进行统一纳管及性能测试,构建东吴大模型矩阵。东吴证券近年来年度平均算力投入上千万元,通过采购、租赁、测试等形式储备了大量算力资源,包括H800、RTX4090等算力资源,并且测试验证了华为昇腾等信创算力。我们对国内外多类算力进行性能实测,并以此为基础构建东吴大模型矩阵,包括接入了DeepSeek全尺寸版、阿里Qwen系列、自研秀财大模型、同花顺多模态大模型、安全大模型、Embedding模型等,构建训推一体的算力集群。其中DeepSeek全尺寸版模型需要不低于16张H800显卡,Qwen2 7B模型需要RTX4090同等算力显卡,公司自研秀财大模型也在昇腾上完成信创显卡推理的适配。此外,为减少各类算力资源的迁移适配、运行维护成本,信创算力也需兼容CUDA或MindSpore生态,且具有单卡不低于RTX4090水平的推理算力。建立异构算力资源池,选用符合信创标准或通用协议的硬件设备,实现算力的统一纳管,成为阶段性的工作重点。


在技术侧,一是应用多种GPU虚拟化技术,如NVIDIA的MIG技术,通过硬件虚拟化的方式,实现多任务并行,同时保证每个虚拟GPU的性能和稳定性。MIG技术在NVIDIA  A100和H800等高端GPU上引入,可将一个GPU芯片虚拟出7个实例,提供给不同的虚拟机或容器使用,并为每个实例分配指定的GPU算力和显存,实现了硬件级别的故障隔离,避免了因1个任务故障导致整个算力资源不可用的情况。


二是采用一系列深度学习及大数据技术,实现算力的无损调度。比如采用深度强化学习的AI调度算法,能够根据业务负载、任务优先级、资源利用率等多维度因素,实时对算力资源进行动态调度。例如,通过对历史业务数据的分析和学习,预测业务高峰期和低谷期的算力需求,提前进行资源的预分配和调整,确保在高负载场景下也能满足业务的响应要求。


三是构建高速、低延迟的网络基础设施,优化系统网络环境。采用万兆网络进行高速传输,提高AI算力之间的通信效率及可靠性。同时,对网络流量进行合理的规划和管理,避免网络拥塞导致算力调度延迟。


在模型训练侧,智能算力调度还是优化大模型训练效率与节约算力成本的关键。东吴证券在2023年使用40台H800训练13B与108B的秀财大模型,2024年通过先进的算力调度策略,结合模型压缩与蒸馏技术,仅需10台H800就高效完成了35B大模型的训练任务。这不仅显著降低了硬件投入,更在更高参数规模的模型上实现了迭代优化。同时,高效的算力调度也为金融语料清洗与合成等工作节约了时间,支撑了垂类大模型性能的持续提升。体现了算力调度在最大化硬件效能、控制成本、加速模型研发周期等方面的价值。


随着以DeepSeek R1为代表的推理模型和GPT-4o为代表的多模态模型能力的不断进步,金融机构未来的重心转向垂域大模型微调和模型推理加速。这意味着金融机构将更加注重如何结合业务的实际场景,高效利用现有的先进模型进行推理,以满足实际业务需求。如何高效进行算力调度、优化模型推理能力将直接影响金融机构在数据分析、风险评估、客户服务等领域的效率和准确性,从而影响整体运营效能。


在业务侧,结合证券业务的实际场景,实现高负载场景下的资源动态分配。


一是根据东吴证券各项业务的重要性和紧急程度,对业务进行优先级的动态划分。在高负载场景下,优先保障高价值业务如智能投顾、智能营销、智能客服、风险控制的算力需求,确保关键业务的稳定运行,同时兼顾实时性要求不高的ToB业务如报告审核、尽职调查报告生成、数据统计等,确保高价值场景落地的优先性。


二是建立资源的弹性伸缩机制,根据业务负载的实时变化,自动增加或减少算力资源的分配。例如,当投顾业务在市场波动或者开盘前后出现负载急剧上升的情况,系统会自动检测并迅速分配更多的GPU算力资源给到AI投顾系统,满足高并发请求。当负载下降时,又会自动释放多余资源,避免算力浪费。


三是引入先进的容器集群管理系统,智能化管理协调AI服务。比如引入Kubernetes等容器编排系统,对容器化后的应用进行统一管理。该平台可以自动发现和管理不同架构的算力资源所支撑的容器环境,根据实际应用需求灵活进行应用的部署、扩展及资源的适配调度,实现AI资源的合理利用和高效运营。


四是根据不同业务的算力诉求,智能选取不同的大模型推理框架。我们把DeepSeek R1-671B分别部署在不同的H800设备,对vLLM和SGLang框架的吞吐效果进行对比测试。调度软件实时监控算力资源的并发请求数,在默认情况下将请求平均分配给vLLM和SGLang。一旦检测到并发增大,立即将SGLang的并发请求数限制在32个以内,其余流量均分配给vLLM。当负载量过大时,比如超过了并发处理能力极限,调度软件会拉起新的vLLM实例,用于承载新的流量。


如表中数据显示,vLLM在满载吞吐量、首字响应时间和并发处理能力等方面均优于SGLang,表明在高并发场景下vLLM有更好的性能表现,能够更高效地处理大规模的自然语言处理任务,但是小并发场景下的表现不如SGLang,这为东吴证券的推理框架选型提供了参照。


表   vLLM和SGLang框架下的吞吐能力对比


12.png



东吴证券还根据不同业务场景的特点和算力需求,制定了算力资源的动态分配策略。例如,在智能报告生成场景中,当模型需要对一个任务进行快速的数据分析和图表渲染时,系统会根据任务的复杂程度和紧急程度,优先分配给SGLang,满足研究人员对高性能计算的需求;而在大规模对客服务的智能客服场景中,自动调整CPU、GPU和内存资源的分配,在保证单任务响应速度的前提下适当多分配给vLLM。


二、“智算平台”赋能重点业务场景


一是智能投顾业务。金融市场信息日益庞杂,投资者在筛选与自身投资相关信息时困难重重,如何快速洞察市场机会已成为迫切需求。东吴证券依托智能算力打造“东吴之声”投顾服务产品,助力投顾展业转型,升级存量用户服务体验,同时有效吸引增量用户。调度自有算力实现市场情绪量化分析,建立起30~70度风险区间预警机制;调度DeepSeek等模型挖掘关联数据,自动化扫描投资框架,每周生成潜在投资线索超200条;调度AI算力,建立AI归因模型,从财务数据、政策利好、行业趋势、研报动向、投资者互动五大方向,实现涨停事件全面解析。


近年来,东吴证券利用智能算力基座支撑AI应用,提供市场温度计、赢波段、诊财务、说涨停、盈组合、盘中宝、避雷针、智百科等20余项AI投顾组件,为投顾、个人投资者提供及时准确的投资分析与决策支持。


二是智能客服业务。客户经理需要处理大量的客户咨询请求,对客户问题的响应速度和并发处理能力要求很高。为了帮助客户经理高效生成话术初稿,东吴证券为智能客服系统分配了充足的GPU和内存资源,并采用了分布式架构和负载均衡技术,确保系统的稳定运行和高效响应。同时,根据不同时段的客户咨询量和业务复杂度,动态调整算力的分配比例。例如,在交易日的早上和中午等客户咨询高峰期,增加算力资源分配,动态利用公有云端SaaS服务,提高系统的并发处理能力;在非交易时段,适当减少资源分配,节约成本。


智能客服系统利用大模型的语义识别能力和自然语言处理技术,实现了对客户意图的精准识别、智能调度和及时解答。通过对大量历史客户咨询数据的学习和分析,不断优化问答模型,提高问题解答的准确性和客户满意度。目前,智能客服系统日均处理客户1万条实时问询,问答准确率达到96%以上,能够一键智能回复开户引导、持仓诊断、产品咨询、业务办理、操作指导等20多个业务领域近3万个客户问题,在600名投顾中实现80%覆盖率,极大提高了客户服务效率和质量。


三是智能投资业务。该业务对算力资源的需求主要集中在数据智能获取、清洗及预处理、组合构建和模型优化等方面。东吴证券为智能投资业务分配了专用的GPU算力服务器集群,并根据投研团队的研究项目和任务进度,动态调整GPU资源的分配数量和类型。例如,研发AI量化投资组合,会优先分配高性能的算力用于海量历史数据回测和模型的训练优化,保证结果的准确性;对于其中涉及的宏观经济分析和行业研究,则会分配适量的算力资源用于研报数据的挖掘和文本分析。


通过智能算力资源的弹性调取,东吴证券的智能投资系统能够快速处理海量的金融市场数据,包括股票、债券、期货等多种资产类别的市场行情数据、基本面数据、技术面数据、新闻舆情数据等。利用K-MEANS聚类算法、XGBoost、SVM等深度学习算法和自然语言处理技术,对数据进行深入分析和挖掘,为投研人员提供有价值的投资信息和决策支持。例如,通过对公司公告数据实时监测和技术指标分析,及时发现市场热点和潜在投资标的,为投资组合的调整提供依据,组合在模拟盘上近8个月累计收益33.32%,对比沪深300指数,超额收益40多个点。同时,智能投资系统还能自动构建和优化投资模型,提高策略的准确性和有效性,提升投资收益水平。


四是智能报告业务。在证券行业业务中涉及大量报告,包括行业分析报告、企业背调报告、研究所各板块日报/周报、营业部发展情况报告、合规性报告等。传统人工撰写1份报告需要数小时,探索并实施更高效、智能的报告制作方案是提高工作质效、赋能业务发展的有效举措。


东吴证券采用智能算力调度和MCP协议打造智能报告平台。首先智能识别用户的撰写意图,快速生成报告大纲。然后根据不同段落拆分为多项MCP服务,该服务会根据内容的复杂度和所需模型动态分配合适的算力资源,比如大批量行业数据对比采用千问3-235B,总结话术生成采用千问2.5-72B,实现复杂任务的高效分配和协同。基于公司算力支撑,构建企业内私域MCP Server广场,把100余个公司模板封装为特定的Agent组件,统一数据集成,高效处理不同的业务场景。同时采用SM算法加强安全性设计,限制敏感数据访问,为平台提供安全可靠的数据支撑。


通过智能算力调度的支持,报告生成时间由原先人工撰写的4小时缩短至最快10秒,极大地缩短了报告制作时间。当前,智能文档的撰写功能已经成为金融机构的AI赋能重点。


三、行业应用趋势


通过对比“智算平台”应用前后的各项业务指标,如投资组合收益、客户满意度、客户响应速度、风险控制水平等,可直观感知到智能算力投入带来的价值提升。例如,智能客服业务的应用使客户问题的响应速度达到最快1s,实现80%以上的投顾赋能,机构尽调报告的生成效率提升了99%等。


未来,随着人工智能技术的不断发展和数据资源的深入挖掘,ToC端的智能化辅助客户投资决策将成为证券行业的重要发展趋势。东吴证券将继续加大在智能算力方面的投入,构建更加精准、高效的投资决策模型,实现投资组合的智能化构建和动态优化。通过深度挖掘市场数据和另类数据中的投资信息,结合投资者的风险偏好和投资目标,提供千人千面的投资方案和建议,提高投资决策的精准性和客户满意度。


在数字化时代,客户对金融服务的便捷性、个性化和智能化要求越来越高。东吴证券将借助智算资源,进一步提升数字化客户服务体验。通过智能客服、智能投顾等应用,实现客户服务的自动化、智能化和个性化。同时,利用虚拟现实、增强现实、数字人等新兴技术,为客户打造沉浸式的金融产品体验场景,增强客户与公司之间的互动和黏性,提升客户参与感和体验感。


智算资源的应用将为东吴证券ToB端的金融创新业务拓展提供有力支持。例如,在金融衍生品定价、结构化产品设计、智能报告审核和生成等领域,需要复杂的数学模型和强大的算力支持。东吴证券可以利用智能算力进行创新业务的研发和探索,开发出更加多样化、个性化的金融产品和服务,满足客户日益增长的多元化投资需求,提升公司在机构服务领域的竞争力。


综上所述,东吴证券在智能算力场景的应用落地方面取得了显著的成果,为公司的业务发展和创新提供了有力支撑。未来,随着技术的不断进步和业务的持续拓展,东吴证券将继续深化智能算力的应用,探索更多的业务场景和应用模式,打造证券业务智能化转型的标杆。


作者:


东吴证券股份有限公司首席信息官   华仁杰


东吴证券股份有限公司信息技术总部副总经理   任川


东吴证券股份有限公司人工智能技术中心   王锋   臧延秋   徐李豪


本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】

推荐阅读

更多

工商银行发布 | 《商业银行人工智能应用实践及趋势展望》

银行业人工智能应用路在何方?近日,工商银行金融科技研究院发布《商业银行人工智能应用实践及趋势展望》,从五大方面对人工智能应用进行了深度剖析。

轻金融 中国工商银行金融科技研究院 2025-09-05

商业银行内控合规管理数字化转型路径探析

商业银行内控合规管理数字化转型可以有效提高商业银行全面风险管理水平。商业银行应基于现有风控系统,通过优化模型规则,提升数据质量,配套对接内部业务系统,充分发掘数据潜能,强化系统刚性管控等,加快构建更加全面、精准、开放、前瞻的数字化智能内控合规管理体系。

中国银行业杂志 刘振宇 2025-09-05

国外银行人工智能创新案例研究与启示

近年来,以人工智能为代表的金融科技在整个金融业得到广泛应用,正在驱动整个银行业进入新一轮的竞争与合作,重塑数字化发展的新格局。自2022年以来,以ChatGPT为代表的人工智能大模型在全球掀起新一轮人工智能发展浪潮。随着市场竞争的加剧,很多银行采用人工智能和机器学习技术开展了多种创新,笔者研究国外商业银行创新的案例,并对我国银行的创新实践提供借鉴。

金融数字化转型 2025-09-05

农业银行数据中心总经理佟梅:依云而生,农业银行构建提质增效IT新底座

云原生概念从2013年诞生到现在已经整整十年,其内涵技术和创新应用仍在不断迭代发展,并逐步成为IT基础设施领域的技术基石。农业银行数据中心积极推动基础设施云原生转型,构建了以分布式云平台为基础的云原生技术底座,助力全行系统向分布式架构演进,在保障****业务连续性的前提下,兼顾基础设施的敏捷和效能,实现了提质与增效的有机统一。

中国金融电脑 佟梅 2025-09-05

南京银行:AI应用探索与创新实践

近年来,伴随AI技术的快速发展,智能化为推动银行业务变革与数字化转型提供了全新动力,尤其在优化业务流程、提高运营效率、提升客户体验、强化风险防控等方面发挥着重要作用。例如,基于智能化的算法设计、AI技术广泛应用于电话银行、网上银行、手机银行等渠道,甚至在某些特定场景中,智能客服机器人已基本可实现对答如流。顺应这一趋势,南京银行在全方位强化AI布局的基础上,深入开展了数字员工营业厅建设实践,并终取得了良好成效。

中国金融电脑+ 张银川 王桂庆 2025-09-05

北京银行:场景金融建设项目

北京银行以数字化转型、场景金融及生态圈建设为目标,以公司客户收付款高频结算业务为切入点,着力打造场景金融平台,启动场景金融项目建设。 北京银行坚持以构建基础设施、提升收付管能力、强化精细化管理、嵌入智能风控、挖掘产品价值为五大导向,形成1个平台、3个标准产品、N个应用场景的“1+3+N”综合服务解决方案,为企业提供收付款一站式、大小额全渠道、本外币一体化、境内外全覆盖的综合应用,赋能企业数字化转型,助力实体经济发展。

2024年度城市金融服务优秀案例征集活动 北京银行 2025-09-05

观点

  • 数字化转型
  • 人工智能
  • 算力