本文来源于:鑫智奖·2025第六届金融机构数智化转型优秀案例评选,作者:微众银行

微众银行:全栈自主可控的金融级智算AI网络建设与实践

2025-06-10 关键词:基础设施,数字化转型,金融服务2127

一、项目背景及目标


随着人工智能技术的迅猛发展,AI大模型正深刻重塑金融行业的技术格局。从智能风控到精准营销,从自动化运营到实时决策支持,AI已成为驱动金融行业变革的核心引擎。微众银行作为国内首家数字银行,积极响应国家“关键技术自主可控”战略,始终致力于通过科技创新推动金融服务升级,率先启动金融级AI智算网络建设,旨在打造全栈自主可控、高性能、低成本的智能算力底座,能够支撑大规模AI智算分布式训练与推理业务。


本项目旨在通过全栈自主可控的方式构建一套适用于金融行业的AI智算网络,不仅需要满足金融行业AI大模型训练与推理的网络需求,更要实现从硬件到软件的全栈自主可控,为行业提供可复制的技术升级路径。基于此,本项目确立了三大核心战略目标:


(1)交换机硬件:基于国产交换芯片及CPU打造面向金融智算AI网络场景的白盒交换机,规避国际局势变化带来的供应链风险;适配国内外主流GPU/NPU算力卡的接入,为金融行业异构算力池的构建奠定基础。


(2)操作系统:基于开源网络操作系统SONiC进行二次开发,自研网络操作系统,针对AI分布式训练和推理场景面临的网络拥塞问题,通过研发链路级负载均衡组件予以解决。


(3)管控系统:面向金融级AI智算场景,研发支持秒级指标采集、拥塞感知及自动调度的智能网络管控系统。


项目采用"白盒硬件+开源系统+自研管控"三位一体技术路径,实现从芯片级到系统级的全栈自研:硬件核心部件100%国产化,软件基于开源SONiC深度定制WeNOS操作系统,构建自主可控的软硬件协同生态,较传统方案显著降低成本。


二、创新点


微众银行始终专注于金融科技能力积累与沉淀,网络团队也在近年探索与实践金融级智算AI网络软硬一体化解决方案,方案包括具备高性能网络控制器功能的管控应用以及搭载国产芯片、自研网络操作系统的白盒交换机。该项目通过软硬件解耦,打破传统网络设备厂商壁垒,为金融级数据中心网络垂直自主可控提供了新思路。在AI热潮引导的实际生产应用中,项目整体完全满足金融业对AI智算网络的高可用与高性能需求,我们也将部分成果回馈开源社区,成为全球首家参与SONiC社区的金融机构。


总结项目有以下关键技术点:


硬件核心部件全国产化:


微众银行首款面向AI智算场景的“WB3000”型号的交换机基于国产先进的12.8T交换芯片及国产CPU打造。经过不断迭代优化,成功适配了国内外多款主流GPU/NPU算力卡,提供了单端口最高400G无损以太网接入能力。其中核心部件实现了全国产化,非核心部件可国产化替代,大幅削减了复杂供应链的潜在隐患,为金融服务的稳定安全提供了基础保障。


基于开源SONiC的自研网络操作系统


开源SONiC网络操作系统旨在为数据中心网络提供开放、灵活且具有高扩展性的解决方案,基于Linux内核,为用户提供BGP、OSPF等多种网络协议支持,提供交换机抽象接口(Switch Abstraction Interface,SAI)以满足二次开发用户的各种定制化需求。基于SONiC社区版本的开放性,微众银行从自身需求出发,布局AI智算场景,设计并实现适用于高性能智算网络的网络操作系统,支持细颗粒度指标采集、转发时延采集以及确定性哈希路径规划算法等高级功能。


适用于AI智算场景的管控应用


由于白盒交换机搭载自研网络操作系统,交换机的各项性能指标、拥塞指标、设备日志等运营数据通过标准化接口采集和灵活应用,方案将采集数据与分析数据集中在高性能管控应用,提供设备全维度监控,其中包括秒级拥塞指标监控,能够实现秒级拥塞感知,自动化调度的响应机制。


三、项目技术方案


本项目自下向上采用"白盒硬件+开源系统+自研智能管控”三位一体"的全栈自主可控的技术路线:


imageimage1_1749519014.1581714.png


(1) 硬件层:基于国产12.8T交换芯片和国产CPU打造金融行业首款自研白盒交换机,提供32个400G端口接入能力,标准1U数据中心部署,适配国内外主流算力卡接入。


imageimage2_1749519014.2015529.png


(2) 系统层:自研网络操作系统基于开源项目SONiC二次开发,延续基于Linux内核,通过抽象出交换机抽象接口(Switch Abstraction Interface,SAI)的统一概念连接用户态与内核态的数据同步,基础网络协议以及扩展功能模块在SONiC应用层实现,扩展功能包括但不限于ARP优化、无损网络支持、命令行等适配高性能网络场景的功能。在其上创新开发的链路级负载均衡组件,解决了AI训练场景下的网络拥塞难题。


imageimage3_1749519026.0813115.png


(3) 管控层:自研智能网络管控系统以搭载自主研发网络操作系统的白盒交换机为核心管控对象,通过应用自有专利技术,围绕网络设备指标采集、状态监控、告警分级及数据存储等关键维度开展深度研发,构建了由基础数据采集层、分布式存储层和智能应用平台组成的三级架构体系。该系统实现了全网可视化运维、拥塞自动调度和故障快速定位,构建完整的AI网络智能运维体系。


imageimage4_1749519026.1474192.png




项目整体通过分层解耦的设计不仅实现了技术自主可控,还提供了极大的灵活性和扩展性,可根据业务需求快速迭代升级。


四、项目过程管理


该项目由微众银行科技及智能事业群牵头组织,基础科技产品部负责具体实施,主要经历了以下几阶段:


(1) 市场方案调研


2022年4-5月,调研高性能HPC网络方案及采用商用交换机快速部署高性能HPC网络。


(2) 需求分析及系统架构设计


2022年6-7月,完成了项目一期的需求分析、可行性评估,完成系统功能以及架构设计,输出需求文档和系统设计文档。


(3) 系统编码、测试和上线准备


2022年8-10月,技术栈选型,划分功能模块与交互方式,制定容灾和扩展方案。


2022年11-12月,完成网络管控平台一期公共模块、数据管理模块、运维自动化以及网络可视化等模块的开发,输出开发手册、API文档。


系统试点上线阶段


2023年5月-2023年7月,网络管控平台上线微众银行私有数据中心并纳管6个数据中心3000多台网络设备。


2023年5月-2023年11月,在一期基础上进行版本迭代,新功能持续开发、模块重构和标准化改造,陆续上线智能辅助巡检、低阶设计、网络控制器等模块,辅助完成日常网络运维工作,支持微众银行数据中心模块建设与改造。


(5) 硬件及操作系统深度开发阶段


2023年7月-2024年5月,基于开源交换机操作系统SONiC进行深度自研二次开发。


2024年1月-2024年7月,基于国产交换芯片和白盒交换机硬件完成芯片feature开发和操作系统功能的开发,输出自研交换机系统WeNOS。网络管控平台完成纳管适配,实现拥塞调度、无损网络路径计算、负载均衡等功能。


2024年7月-2024年8月,向SONiC社区贡献部分代码。


(6) 生产应用投产阶段


2024年11月-2024年12月,微众银行自研400G智算交换机下线并组网部署。


五、运营情况


微众银行全栈自主可控的金融级智算AI网络已实现千卡级异构算力无损接入的以太网架构突破,成功构建了支持多元算力调度的智能基础设施底座。该网络平台目前已在微众银行内部核心业务和智能办公等多个场景实现赋能。


(1) 核心业务场景:


企业智能风控模型:基于智能AI网络产品,企金风险大模型的训练时长缩短40%,模型训练及迭代效率大幅提升;


智能客服助手:基于智能AI网络产品,智能坐席辅助系统提供了多模态交互能力,客户问题首次解决率大幅提高;


(2) 智能办公场景:


智能编程助手:基于智算AI网络,微众银行内部开发编程系统快速上线,继承了代码生成与漏洞检测,部分场景开发周期可缩短30%以上,实现了研发效能的大幅优化;


智能知识库:基于智算AI网络,微众银行在内部构建了个人/团队智能知识中枢,通过对内部资料的学习整理,对内部数据进行智能识别和分析,保证了银行数据安全性的同时极大提高了内部工作效率。


对外,微众银行网络团队积极参与并反哺开源社区,不断提高微众银行智算网络产品的知名度,推动金融行业智算AI网络的生态共建。目前已有部分银行及券商机构对微众银行智算AI网络产品表现出浓厚兴趣,有意为金融行业AI智算网络生态共建而共同努力。


六、项目成效


随着微众银行全栈自主可控的金融级智算AI网络的正式投产,微众银行已构建起支持千卡级AI分布式训练与推理的高速网络基础设施,取得了诸多显著成效:


(1) 经济效益方面:


a.自研AI网络,降低基础网络设施成本


基于自研交换机操作系统WeNOS、国产芯片和国产交换机硬件,完成自研AI智算网络方案的落地实施。通过整机硬件、光模块和线材自采压低建网成本,较商用解决方案节约70%的成本。自研白盒操作系统按需开发交换机功能,实现拥塞自愈、无损网络等功能,无需购买商用系统进行功能授权及售后支持等付费项目。


b. 管控平台开发,提升效率,降低人力成本


通过自研管控平台+开源组件,实现从设计、部署、交付,到运维、变更、监控、巡检等流程的全周期管控覆盖。平台通过智能化架构生成、零配置部署,大幅降低了低阶设计方案的成本,降低了配置错误率以及人工成本,提高了部署效率,平均单台交换机部署成本节约70%,开局和验收时间下降90%。同时,平台提供了数据管理、网络可观测、自动化运维、周期性巡检、智能化管控的能力,支持数据中心上千台设备的运维和管理,大幅降低网络管控的资源需求和人力成本,经济效益显著提升。


(2) 社会效益方面:    a. 开源贡献提升国内金融机构影响力:微众银行在开发网络操作系统的过程中,积极将成果开源回馈SONiC社区,向社区贡献了自主研发的ARP保活特性代码。因此成为全球首家上榜SONiC社区贡献组织名单的金融机构,不仅进一步推动了开源社区的发展和技术创新,也让国内金融行业在全球化开源平台上发出了自己的声音。


b. 促进金融科技发展:微众银行通过软硬件全栈自研的方式,不仅满足了AI智算场景下对于高性能网络的高要求,而且通过开发链路负载均衡组件,智能化拥塞调度等方式解决了AI智算场景下网络拥塞的问题,为金融机构提供了借鉴和创新的新思路。


c. 保证金融服务的安全稳定:微众银行自研交换机核心部件全国产化,非核心部件建立国产化替代清单,极大削减了复杂供应链的潜在隐患,为金融服务的稳定域安全提供了保障。


d. 降低行业门槛:微众银行全栈自研的智算AI网络建网成本降低70%,有助于金融机构在保持技术领先和金融服务稳定的同时,大幅减少投入成本,使得中小银行建设和应用AI智算网络的门槛大幅降低,加速了金融行业使用AI对金融服务的赋能。


七、经验总结


微众银行"全栈自主可控的金融级智算AI网络建设与实践"项目聚焦金融领域AI智算网络的技术突破与自主可控体系建设。随着AI大模型在金融场景的深化应用,传统以太网络在跨节点通信中面临低熵流量导致的ECMP哈希冲突、链路拥塞等核心挑战,同时外部技术依赖带来的供应链隐患日益凸显。在此背景下,项目通过构建"白盒硬件+开源网络操作系统+智能管控系统"的全栈自主创新技术体系,为微众银行迈向AI原生提供重要基础设施支撑。


该项目以自主可控为核心,硬件层面基于国产12.8T交换芯片和国产CPU打造的首款白盒交换机支持单端口最高400G GPU/NPU算力卡的无损组网,建网成本较传统方案降低70%。在软件创新领域,基于开源SONiC网络操作系统深度定制,开发了Link-SLB链路级负载均衡组件,通过确定性哈希路径预配置与分层策略,解决AI智算分布式训练和推理场景因低熵大流量引发的网络拥塞问题,实测集合通信带宽提升近40%。在此基础上,创新性构建智能网络管控系统,实现了细粒度的秒级监控以及智能化拥塞调度能力。


该项目的生态价值与社会效益十分显著。通过向SONiC社区贡献ARP保活特性等核心代码,微众银行成为全球首家上榜SONiC贡献组织的金融机构,推动开源技术生态发展。这一实践不仅验证了国产化技术在关键领域的应用潜力,更为金融机构平衡技术创新、成本控制与供应链安全提供了可复制的实施范本。


本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】

推荐阅读

更多

安徽农信:基于人工智能的滨湖数据中心基础设施能效优化

数据中心基础设施能耗巨大,数据中心节能能够带来显著的经济和社会效益。而在数据中心基础设施中,空调能耗又占到全部能耗的70%,本项目通过将人工智能应用到数据中心基础设施空调系统运行控制中,为安徽省联社乃至金融行业数据中心基础设施节能降耗探索一条智能化创新的道路。

2018第二届农村中小金融机构科技创新优秀案例评选 安徽农信 2025-06-10

胡震:构建数字金融服务生态,探索数字化转型新路径

为贯彻落实《国务院关于全面推进乡村振兴加快农业农村现代化的意见》总体部署,全面推进乡村振兴,进一步加大支农惠农力度,有效支持当地畜牧业发展,切实解决畜牧经营主体融资难、融资贵及担保难问题。

金融电子化 胡震 2025-06-10

广东农信:自动化测试平台建设项目

随着广东农信的业务快速增长,软件产品的广泛使用,使客户对软件产品质量的要求不断提高,作为软件质量的重要保证,软件测试越来越显示出它的巨大优势。

2019第三届农村中小金融机构科技创新优秀案例评选 广东农信 2025-06-10

贵阳银行:写好“数字金融”大文章,赋能高质量发展新活力——“超级APP”体系打造

在全国大力发展数字经济,中央对数字金融高质量发展提出新要求,银行业全力推动数字化转型的背景下,贵阳银行聚焦零售线上渠道服务能力的全面升级,围绕“方便、快捷、吸引、依赖、获得”五大核心要求,整合零售条线流量,构建统一获客、统一营销工具,着手打造“线上场景+客户权益+金融服务”的“超级APP”体系,为客户提供触手可及的智能化、一站式综合金融服务。 “超级APP”作为贵州省内首批实现鸿蒙原生应用上架的城市商业银行应用,用户无论在安卓、iOS还是鸿蒙版手机银行上,都能享受到规则一致、体验一致的金融服务。

2024年度城市金融服务优秀案例征集活动 贵阳银行 2025-06-10

北银金科:金融操作系统智能化软件测试体系建设

智能化软件测试基于金融操作系统"五个统一"原则的系统设计,深度整合测试资源,构建全链路测试流程与资产复用体系,在保障系统稳定性的同时显著降低测试成本,形成可插拔的智能测试组件生态。

鑫智奖·2025第七届金融数据智能优秀解决方案评选 北银金科 2025-06-10

深圳农商行:智能柜台

为积极贯彻落实金融产品创新及普惠金融理念,给客户提供更加便捷高效的金融服务,全面提升客户体验,综合上述因素,我行在优化运营业务流程、深化网点转型的基础上,着手开发创新型智能柜台系统。

2025-06-10

案例库

金融行业全面的数字金融创新案例,涵盖历届“鑫智奖·金融机构数智化转型优秀案例评选”、“农村金融机构科技创新优秀案例评选”、“城市金融服务同业案例征集活动”等科技创新参评案例

  • 数字化转型
  • 基础设施
  • 金融服务

微信
咨询

微信咨询

扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构