本文来源于:中国金融电脑,作者:张硕关键词:运维管理,数据中心,数字化转型

人保数据中心副总经理张硕:保险业数据中心IT运营体系建设实践

2025-09-05 2845

数字化转型浪潮下,伴随信息系统规模的持续增长与新技术的不断引入,传统运维模式的固有缺陷和不足日益凸显,愈发难以适应流程标准化、服务智能化等发展趋势。在此背景下,面对运维流程不规范、缺乏统一服务目录、SLA指标与业务实际断层、运维自动化水平较低、各运维工具无法形成合力等现实挑战,人保信息科技有限公司数据中心(以下简称“人保数据中心”)通过完善运维管理制度、强化变更控制管理、打造运维工具体系,有效支撑了业务高质量发展。


一、智能化运维体系建设思路


以数字化转型为契机,人保数据中心锚定标准化、智能化的运维体系建设目标,遵循ITIL最佳实践,对标ISO20000标准与ITSS规范,深度融合自身丰富的服务经验,通过制度统筹、流程驱动、工具赋能,明确了构建规范化管理流程、保障变更效率与安全性、提升运维操作的自动化与智能化水平等具体目标,并系统规划了清晰的实施路径。人保数据中心IT运营体系建设思路如图1所示。


13.jpg

图1 人保数据中心IT运营体系建设思路示意


首先,遵循ISO高阶管理框架进行文档层次设计,结合各技术团队职责定位,系统梳理运维操作目录并优化相应的运维流程;其次,针对紧急变更、重大变更、常规变更以及标准变更等进行了分类管理;最后,引入自动化手段赋能有制度、有规范、有考核、有计量的IT运维管理体系落地,力求在保障生产稳定运行的同时,持续推动IT运维服务向智能化、价值化演进。


二、人保数据中心智能化运维探索与实践


1.完善运维管理制度


运维管理制度是智能化运维体系的实施基础,通过明确的规则和流程指导运维操作,可以有效减少人为错误并提高运维效率。为了规范运维工作,人保数据中心制定运维管理制度规范性文件,并将其架构分为四个层级。


第一级是公司层级的IT运维服务管理办法,明确了运维服务管理的方针和目标,清晰了组织的角色、职责和权限,用于系统地指导各项运维工作的开展。


第二级是IT服务管理体系的管理规范和流程文件,包括服务台管理规范、应急管理规范、运维质量管理规范、服务请求管理规范、变更发布管理规范等26个运维规范,用于规范和约束各项运维工作的开展。


第三级是与各流程相关的策略、实施细则、操作手册、文档模板,以及与流程相关的发文和总体性的服务管理计划、服务连续计划等。


第四级主要包括与服务体系相关的服务目录、服务要求、服务级别协议SLA、服务合同,各流程采用第三级模板生成的日常工作记录、报告和表单,以及流程运行所产生的其他记录等。


在上述运维管理制度的指导下,人保数据中心的事件流程和变更流程的各环节得到有效规范,对突发事件的处置能力和业务恢复时效也得到有效提升。


2.强化变更控制管理


变更控制的工作目标是将数据中心的变更操作按照运维制度要求进行全覆盖、全流程管理,确保变更的合理性、规范性、可行性,同时减少变更引发的生产事件风险,提高变更成功率。具体而言,变更控制重点遵循了分类控制、事前审批、事后回顾等三大原则。


在变更分类方面,人保数据中心根据紧迫程度将变更区分为紧急变更与计划性变更。其中,紧急变更一般由生产事件触发变更需求,是生产事件应急处置的主要环节;计划性变更一般由服务请求、问题、非紧急事件等触发变更需求,需在满足变更控制要求后方可进行变更实施。此外,根据变更的影响范围、实施的风险程度,计划性变更还可进一步划分为重大变更、常规变更和标准变更。具体而言,重大变更的影响范围较大、实施风险较大、实施过程较复杂,实施失败往往会带来重大后果;常规变更的影响范围较小、实施风险较小、实施过程较简单,但没有标准操作手册;标准变更通常影响范围小、有标准操作流程,且实施风险较小。在实际操作中,人保数据中心结合变更造成的影响、变更失败的概率、变更风险等级三个要素,计算出变更类别指数(CCI)作为主要划分依据。变更类别指数计算公式如下:


CCI=I×P×R


其中,I为变更造成的影响、P为变更失败的概率、R为变更风险等级,每一个要素分为低、中、高三个层级,每个层级均赋予不同的分数。在此基础上,人保数据中心根据实际情况自行定义变更类别指数的阈值a、b,用于划分变更类别。


变更分类规则为:


14.jpg


在变更审批方面,重大变更由变更流程经理初审,组织相关方开展技术评审和业务评审,并报部门领导审批后实施;常规变更经变更发起团队负责人同意后,由变更流程经理审批后实施;标准变更由变更发起团队审批后实施,并需严格按照经过预审批的标准化操作手册进行操作。


在变更回顾方面,人保数据中心建立变更操作分析指标,主要包括变更方案审核通过率、变更失败情况、超出变更窗口操作情况、变更窗口预估余量过长情况等,以进一步加强对异常情况的分析和披露,持续提升变更操作的规范性。


3.打造运维工具体系


首先,运维服务目录作为IT服务管理体系的核心工具,通过提供标准化服务流程以及明确权责边界,可在规范服务执行步骤与质量要求的基础上,尽可能减少执行偏差,提高服务响应速度与执行效率,以及基于统一的操作规范减少跨部门、跨团队协作摩擦。对此,人保数据中心通过对服务目录进行标准化设计,梳理并归纳了包括办公保障服务、信息安全防护服务、IT基础设施保障服务、基础设施保障服务等在内的七大服务类别(合计上百项服务目录),并向用户公布每项服务目录的服务水平协议(SLA),将服务目标以量化指标的形式呈现,明确了运维工作的服务标准。


其次,CMDB作为IT资源的“数字地图”,能够为ITSM的事件管理、变更管理等提供数据支撑。对此,人保数据中心构建了基础资源台账CMDB平台,设计主机、IT设备、应用系统等核心资源配置的标准化模型,将服务目录中的服务组件(如应用系统)与CMDB资源(如服务器、数据库等)建立映射关系,实现服务全链路的可视化,并引入运维自动化流程实时更新CMDB资源台账,实现资源配置关系、维护属性的动态化管理,不仅为运维工作提供了基础数据支撑,还推动整体运维能力不断向精细化、可持续化方向演进。此外,通过ITSM与CMDB的深度融合,人保数据中心以流程驱动数据治理、以数据反哺流程优化,实现了运维工作的高效管理和持续优化。


再次,堡垒机作为运维操作的门禁管理工具,能够按照运维人员的岗位和实际工作职责授予最小化的访问权限。在此基础上,为进一步强化运维安全,人保数据中心将堡垒机与ITSM系统联动,使运维人员均需通过ITSM系统校验后才能登录,并通过工单校验实现细粒度、动态化权限控制,确保其只能访问ITSM工单中授权的IT资产,从而有效降低了敏感数据泄露和误操作等风险,并为审计操作方案与实际操作的一致性创造了便利条件。


除此之外,人保数据中心针对自动化任务脚本的流转瓶颈,设计并实现了基于API深度整合的自动化任务脚本闭环管理引擎,将脚本的请求、下发、执行、结果反馈以及审计全流程纳入堡垒机与ITSM的统一管控,形成一个安全、高效、可回溯的自动化闭环,不仅有效规避了手动操作带来的安全风险,而且极大地简化了运维操作、提高了运维效率。


综上所述,人保数据中心通过构建较为完善的运维制度体系,实现运维工具集群的融合应用,切实提升了IT运维水平。未来,人保数据中心将持续推动IT运维体系向数据驱动与智能化深度融合的方向演进发展,并通过整合基础设施、应用及业务层的多维度数据,构建统一管理框架;同时,基于AI技术实现告警降噪、根因定位等场景的精准决策,推动运维从被动响应转向风险前置管理,如通过历史数据建模预测资源瓶颈,探索故障自愈与动态调度等,从而更好地为业务创新提供敏捷支持。


作者:


人保信息科技有限公司数据中心副总经理 张硕


人保信息科技有限公司数据中心 赵勐 曹朝阳


本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】

推荐阅读

更多

商业银行内控合规管理数字化转型路径探析

商业银行内控合规管理数字化转型可以有效提高商业银行全面风险管理水平。商业银行应基于现有风控系统,通过优化模型规则,提升数据质量,配套对接内部业务系统,充分发掘数据潜能,强化系统刚性管控等,加快构建更加全面、精准、开放、前瞻的数字化智能内控合规管理体系。

中国银行业杂志 刘振宇 2025-09-05

农业银行数据中心总经理佟梅:依云而生,农业银行构建提质增效IT新底座

云原生概念从2013年诞生到现在已经整整十年,其内涵技术和创新应用仍在不断迭代发展,并逐步成为IT基础设施领域的技术基石。农业银行数据中心积极推动基础设施云原生转型,构建了以分布式云平台为基础的云原生技术底座,助力全行系统向分布式架构演进,在保障****业务连续性的前提下,兼顾基础设施的敏捷和效能,实现了提质与增效的有机统一。

中国金融电脑 佟梅 2025-09-05

山东农信:集中运维监控平台项目

为保证日常运行维护工作的顺利开展,确保业务系统安全、稳定运行,山东省联社通过建设集中运维监控平台项目,完成了异构监控系统数据的集中,通过大数据技术对运维监控数据进行挖掘和分析,实现了对运维突发事件的监测、识别、评估与态势感知,有效提高了突发事件的处置能力,初步实现了由IT运维到主动运营服务的转变。

2018第二届农村中小金融机构科技创新优秀案例评选 山东农信 2025-09-05

福建农信:云平台“农信云”项目

随着福建省农村信用社联合社(下称 “福建农信”)规模不断扩大、业务不断增加,应用系统、设备、数据中心空间能耗都不断增加,IT运维各方面都面临种种挑战。

2017首届农村中小金融机构科技创新优秀案例评选 福建农信 2025-09-05

贵州农信:IT可视化运维管理体系建设方案

为切实满足业务连续性及监管部门要求,确保IT系统安全、高效、稳定运行,我社在观山湖数据中心建设过程中同步启动了IT可视化运维管理体系建设。

2019第三届农村中小金融机构科技创新优秀案例评选 贵州农信 2025-09-05

交通银行风险管理部副总经理吴仕旼:以高质量风险管理数字化转型,高水平支撑银行产品和服务体系建设

交通银行在“十四五”风险管理规划和数字金融行动方案(2024—2025年)中均明确提出,要加快推进风险管理数字化转型,以此进一步打造适应“多样化专业性的金融产品和服务体系”的数字化风险管理能力,织密风险内控“防护网”,支撑“风险类别+机构+产品”的“三维一体”全面风险管理体系落地。坚持企业级思维,通过“数据要素×”和“人工智能+”的方式,将风险管理系统延伸覆盖至全集团、全流程、全场景、全产品,推动风险管理从“人防”“技防”向“智控”转变。

金融电子化 吴仕旼 2025-09-05

观点

  • 数据中心
  • 数字化转型
  • 运维管理