本文来源于:鑫智奖·2025第六届金融机构数智化转型优秀案例评选,作者:湖北农信

湖北农信:智能运维平台

2025-05-30 关键词:数字化转型,智能运维,金融服务4154

一、项目背景及目标


在当今数字化高速发展的时代,湖北农信面临着越来越复杂的业务环境和技术挑战。随着银行业务的不断扩展和创新,信息技术系统的规模和复杂性也在迅速增长。银行的核心业务系统、渠道系统和风险管理系统等关键应用需要保持稳定运行,以确保客户能够随时进行金融交易。


湖北农信的网络架构越来越庞大,涵盖多个数据中心、分支机构和外部机构的连接,且部分业务实现了云化部署,大大增加了监控和管理的难度。传统的运维监控方式已经无法满足现代银行的需求。人工监控效率低下,容易出现疏漏和误判。面对大量的监控数据,依靠人力进行分析和处理几乎是不可能的任务。随着金融科技的迅速发展,银行需要更智能化的手段来预测和防范潜在的风险,提前发现系统性能瓶颈,以便及时优化和调整。


为了解决这些挑战,建设智能运维平台成为必然选择。这个平台将整合银行各类监控资源,实现对云上云下硬件设备、软件系统和网络环境的全面监控。通过智能算法,能够自动分析监控数据,快速准确地识别故障和异常情况,并提供预警和解决方案建议。这将显著提高银行的运维效率和服务质量,降低运营风险,为银行的可持续发展提供有力的技术支持。


二、创新点


随着金融行业的数字化转型,银行面临着IT基础设施日益复杂化和多样化的业务需求。银行业的竞争日趋激烈,服务的稳定性和连续性成为银行吸引和留住客户的关键。传统的运维管理方式已经无法适应现代银行的复杂运维场景,存在着较高的故障率和较长的故障恢复时间,这直接影响到银行的业务连续性和客户体验。在新一代IT架构下充分利用可观测性以达到业务高可用、满足SLA等要求,亟需构建统一的智能运维管理平台。


1.全局可观测


统一智能运维管理平台通过采集客户端、应用端和数据库请求的数据,构建全局调用拓扑。可以监控关键渠道路径上的业务系统应用和组件,如手机银行、柜面系统等。通过客户端监控产品和服务端监控工具数据的联动分析,可以针对特定的用户、特定业务和特定接口进行关联分析,从客户端的角度分析用户功能瓶颈,提升用户服务。




imageimage1_1748585577.2699394.png


2.实时动态监测


通过实时监测和动态可视化,平台能够快速识别性能问题和故障,减少检测和修复时间,提高银行服务的可用性和响应速度。


imageimage2_1748585577.3169992.png


3.可视化


系统提供报表、仪表盘、可视化大屏等功能,通过全面数据可视化工具,展示系统各项关键指标的实时动态,包含交易量、响应时间、错误率等信息。帮助管理层和运维人员更直观地了解系统运行状态,让不同的用户角色可以根据自身需求查看相关数据,优化决策过程。


imageimage3_1748585577.3569527.png


4.指标异常检测


平台可支持基于实时数据和业务需求的指标动态调整。运维人员可以根据不同的业务优先级和季节性需求,灵活地调整监控指标阈值,确保运维策略的有效性。此外,平台还能够检测业务黄金指标的异常变化,从而感知业务异常并及时报警。基于异常检测结果的智能告警,有别于传统的固定阈值告警方法,智能告警不需要用户再设置阈值及各种条件,从而减少了对人员经验及人工的依赖,大幅提升了问题发现效率。


imageimage4_1748585577.3999982.png


5.指标智能预测


本平台利用机器学习算法,根据不同策略,进行指标智能预测。结合客户实际业务,基于算法中心的资源容量分析和预测,提前识别潜在的业务故障风险,保证资源配置合理,平衡资源与成本,利用动态缩扩容技术,快速满足突发业务需求。利用智能运维中的解决方案,通过分析业务量、业务性能以及资源的占用情况的历史数据,并结合业务量预测数据来建立容量规划模型,从而在保证业务性能最优的同时帮助用户节省运营成本。


imageimage5_1748585577.4404244.png

6.日志异常检测


日志异常检测可实现发现系统异常行为,即时的异常检测使运维人员能够迅速定位故障,提高问题解决效率,减少宕机时间。基于日志的异常检测,能够提供较为丰富的系统运行或业务信息,辅助运维人员进行分析。


imageimage6_1748585577.4829228.png


7.智能告警


系统利用先进的人工智能和机器学习算法,包括告警智能降噪、单指标预测等,对海量的运维数据进行分析,生成预测性告警。帮助运维团队及时发现问题并采取预防措施,降低系统故障率,提高系统稳定性。


三、项目技术方案


1.系统架构


imageimage7_1748585577.5272357.png


系统的总体架构融合了智能算法中心、事件中心、智能监控中心、报表中心、可视化中心等全栈的运维产品模块,是一款面向业务价值与IT运维规划的全链路可观测的追踪分析和智能故障排查平台,以业务场景、业务系统、应用服务、基础设施为主要观测切入口,以算法为赋能,依托于指标、日志、调用链,为数字化转型提供强有力的解决方案。


①数据采集


整个数据流转经过数据采集,数据处理,数据存储,全链路数据应用。支持针对多种运维监控数据采集,可进行实时数据采集和定时任务数据采集。采集的整体技术方案架构如下:


imageimage8_1748585577.5782547.png


系统内置丰富的脚本,用于深度发现属性采集和指标采集。深度发现任务在安装好采集插件后,会自动探测目标节点上所具有的服务,之后自动执行深度发现脚本,深度采集设备或服务属性相关指标信息。


②数据清洗


支持针对运维数据进行上层的数据加工管理,实现对采集的数据进行数据处理解析,实现数据的消费服务,并实现内外部运维平台进行交互。同时,实现数据指标的重要程度定义、健康度配置等。


imageimage9_1748585577.6263504.png


③数据分析及应用


对全资源提供综合、立体、可视化的实时监控分析,面向企业业务价值与IT运维的顶层规划,以关系串联指标、日志、告警、属性、变更、trace等数据,结合算法,对业务、应用、服务、基础设施进行全资源统一监控、统一分析,统一智能故障分析定位,帮助快速发现、分析并定位故障。


imageimage10_1748585577.6645539.png




imageimage11_1748585577.6957884.png




imageimage12_1748585577.762468.png


④智能化


支持通过算法及专家经验实现根因的推荐,根因定位过程可视化,具备可解释性;算法定位功能包括但不限于调用链故障定位算法、指标异常定位方法及多维异常定位。可观测产品-告警中心提供具有强大算力的MeTow、MeREx和Noran算法,基于配置中心维护的关系,提取关联的指标序列,从时间的维度对指标相关性进行计算分析,以计算出可能的根因,同时算法可对用户的反馈进行方向学习,以保证下次计算的结果的可靠性。在左侧导航栏单击事件处置,进入事件处置页面。在页面中的事件列表单击目标事件名称,进入事件详情页,默认显示警报列表页签。单击智能根因,进入智能根因页签。


imageimage13_1748585577.8266284.png


页签展示根据算法得出的故障原因,展示信息包括可信度、模型、根因资源、根因指标、维度、根因指标趋势和关联事件数量。单击目标根因资源,可跳转至资源监控查看资源详情。单击根因指标趋势,弹出指标详情对话框。在对话框中可对指标序列和相应的日志进行分析。


imageimage14_1748585577.8705268.png


⑤可视化


系统提供报表、仪表盘、可视化大屏等功能,通过全面数据可视化工具,展示系统各项关键指标的实时动态,包含交易量、响应时间、错误率等信息。帮助管理层和运维人员更直观地了解系统运行状态。


imageimage15_1748585577.910463.png


imageimage16_1748585577.9421685.png




四、项目过程管理


湖北农信于2024年3月启动智能运维平台项目,7月完成系统编码、测试和上线,2025年2月完成项目验收。


五、运营情况


自智能运维平台在湖北农信试运营以来,取得了显著成效。


在系统稳定性方面,该系统表现出色,有效保障了银行业务的连续运行。通过实时监控各项关键指标,能够及时发现并解决潜在问题,大大降低了系统故障的发生率。在效率提升方面,运维可观测及流程化管理,缩短了故障处理时间。同时,统一的智能运维管理平台使得运维人员能够更加便捷地掌握系统整体情况,提高了工作效率。


系统的稳定运行确保了业务办理的顺畅,减少了客户等待时间和因系统问题导致的业务中断情况,提升了客户体验。


六、项目成效


通过智能运维平台实施及智能算法场景的建设,取得了显著的成果。平台结合大数据分析及人工智能等功能,监控范围覆盖网络设备、服务器、应用系统、虚拟化、存储、动力环境、安全设备等,通过收集业务日志、监测指标以及业务链路关系等相关数据进行融合,构建业务拓扑链路。快速对故障进行分析、定位、快速恢复业务,保障业务的稳定性、安全性。项目通过全方位的系统监控和智能分析,优化了银行运维流程,提高了故障处理效率,降低了运营成本,并增强了客户服务质量。


具体体现为:


实现业务系统全链路可观测,全栈监控统一的监控平台,实现从基础设施、网络性能、应用性能、用户体验体验监控全覆盖,实现对资产运行状态可知;


终端用户体验明显提升,被动运维变为主动运维,降本增效,体现运维价值;


构建统一的运维集中事件处理平台,整合各个监控工具的告警事件,进行集中化的管理与处理,提高运维处理问题的效率,以及系统工具间的关联影响分析等场景功能;


基于数据的运维,构建统一监控中心,将采集的性能数据、配置数据、告警数据与业务关系数据进行互联互通,依托数据指标为基础,打造业务的运维体系。能够对故障实时预警,故障实时分析,故障及时处置。


以下是项目实施成效:


1.故障检测与处理效率


故障检测缩短至1分钟以内,处理耗时减少至15分钟以内。


2.监控覆盖率


覆盖云上云下资源,覆盖率提升至95%以上。


3.告警准确率


告警准确率提升至95%以上,有效降低误报率。


七、经验总结


智能运维平台,是采用数据驱动的运维模式,最终促使银行不断提升自身的技术水平和管理能力,以适应快速变化的金融市场环境。


首先它通过打通“竖井式”的数据壁垒,建立运维数据统一标准,集中数据采集、数据清洗、特征加工、规则模型、顶层场景的设计,把云上云下的运维对象所涉及的监控、日志、性能、配置、流程、应用运维等数据系统化、层级化关联,构建业务数字化“地图”的能力。


然后通过运维数据的深入挖掘及智能分析,不仅可以实时监测系统的运行状态,提前发现潜在的风险因素,实现高效的风险预警与故障排除,还可以结合数据分析报告,管理层全面了解到运维工作的成效和系统运行的健康状况,有助于优化银行的资源分配并推动持续的性能改进。


本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】

推荐阅读

更多

胡震:构建数字金融服务生态,探索数字化转型新路径

为贯彻落实《国务院关于全面推进乡村振兴加快农业农村现代化的意见》总体部署,全面推进乡村振兴,进一步加大支农惠农力度,有效支持当地畜牧业发展,切实解决畜牧经营主体融资难、融资贵及担保难问题。

金融电子化 胡震 2025-05-30

中信建投证券:基于AI大模型的多智能体技术在投顾领域的应用案例

该案例以大语言模型为核心,融合 RAG、Agent技术,构建“主 Agent+子Agent”架构,覆盖投顾全场景,包含个股分析助手、策略分析助手、产品分析助手。亮点包括:技术上实现知识可溯源与复杂任务规划;业务上赋能B端投顾效率、C端个性化服务;实施上分阶段落地,配套三级评测与合规体系;商业模式探索C端增值服务与B端技术输出。重点打造可信可控的智能投顾平台,推动证券投顾AI智能化转型,该平台服务于总部投资顾问,为行业首批实现案例。

鑫智奖·2025第六届金融机构数智化转型优秀案例评选 中信建投证券 2025-05-30

贵阳银行:写好“数字金融”大文章,赋能高质量发展新活力——“超级APP”体系打造

在全国大力发展数字经济,中央对数字金融高质量发展提出新要求,银行业全力推动数字化转型的背景下,贵阳银行聚焦零售线上渠道服务能力的全面升级,围绕“方便、快捷、吸引、依赖、获得”五大核心要求,整合零售条线流量,构建统一获客、统一营销工具,着手打造“线上场景+客户权益+金融服务”的“超级APP”体系,为客户提供触手可及的智能化、一站式综合金融服务。 “超级APP”作为贵州省内首批实现鸿蒙原生应用上架的城市商业银行应用,用户无论在安卓、iOS还是鸿蒙版手机银行上,都能享受到规则一致、体验一致的金融服务。

2024年度城市金融服务优秀案例征集活动 贵阳银行 2025-05-30

北银金科:金融操作系统智能化软件测试体系建设

智能化软件测试基于金融操作系统"五个统一"原则的系统设计,深度整合测试资源,构建全链路测试流程与资产复用体系,在保障系统稳定性的同时显著降低测试成本,形成可插拔的智能测试组件生态。

鑫智奖·2025第七届金融数据智能优秀解决方案评选 北银金科 2025-05-30

南京银行:AI应用探索与创新实践

近年来,伴随AI技术的快速发展,智能化为推动银行业务变革与数字化转型提供了全新动力,尤其在优化业务流程、提高运营效率、提升客户体验、强化风险防控等方面发挥着重要作用。例如,基于智能化的算法设计、AI技术广泛应用于电话银行、网上银行、手机银行等渠道,甚至在某些特定场景中,智能客服机器人已基本可实现对答如流。顺应这一趋势,南京银行在全方位强化AI布局的基础上,深入开展了数字员工营业厅建设实践,并终取得了良好成效。

中国金融电脑+ 张银川 王桂庆 2025-05-30

国元证券:企业综合金融服务协同系统建设项目

国元证券通过建设企业综合金融服务协同系统,构建“场景+数据”营销服务体系,实现数据驱动->场景应用->业务一线的数字化支撑。实现对销售人员从拓客、展业到业务协同一站式支持,助力管理层进行有效的经营决策。 本项目在信创化、数字化、智能化等几大维度创新实践。在业务上,实现智能化的企业全生命周期管理与多端协作模式实现业务场景化适配。在技术上,融合低代码技术快速开发与微服务技术深度治理,并顺应国产化的创新实践。

鑫智奖·2025第六届金融机构数智化转型优秀案例评选 国元证券 2025-05-30

案例库

金融行业全面的数字金融创新案例,涵盖历届“鑫智奖·金融机构数智化转型优秀案例评选”、“农村金融机构科技创新优秀案例评选”、“城市金融服务同业案例征集活动”等科技创新参评案例

  • 数字化转型
  • 智能运维
  • 金融服务

微信
咨询

微信咨询

扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构