本文来源于:2018第二届农村中小金融机构科技创新优秀案例评选,作者:北京农商银行
北京农商银行:统一及可视化监控体系建设项目
2018-11-01 关键词:农信/农商行,数据中心
4363
项目背景及目标
一、项目背景
随着北京农商银行数据中心IT建设规模的日渐庞大,各专业监控系统和基础设施环境建设不断丰富和完善。针对不同的监控工具,不同的监控厂商,不同的监控理念,需要整体规划和有序推进,同时需要进一步整合各类专业监控和基础设施的运维数据,以业务视角挖掘数据在IT运维管理领域的价值。因此启动统一及可视化监控体系建设,满足后续运维管理和建设的实际需要。
二、项目目标
通过统一及可视化监控体系建设,实现以可视化为龙头,统一监控为入口,专业监控和业务监控相协同,全面展现监控结果的一体化监控体系,做到“深化、整合、落地”三目标。具体包括:
1、建立统一的管理视图,实现统一可视化运维管理工作;
2、围绕全行信息系统整合基础架构管理信息,将不同区域、不同工具的IT管理数据进行统一整合,形成全局运维架构视图。
3、将架构与数据进行有效结合,实现数据中心涵盖从基础设施到应用层的端到端IT运维可视化管理,实时、直观、准确、全面的反映当前业务运行状态、应用系统运行状况,网络运行状态,提高业务影响分析和故障诊断处理效率,提升对运维态势的全局掌控能力,满足日常运维管理全方位、高效能的管理需求。
项目方案
统一及可视化监控体系建设,以可视化为龙头,在原有数据中心运行可视化平台基础上进行改造,将运维数据公开、透明,实现数据共享,并通过可视化让数据的理解得到一致化,进而发挥数据驱动运维。主要建设内容包括:
1、新增统一监控管理模块,事件统一汇聚,立体规则建设落地,并将规则可视化,提升故障处理效率。通过统一监控管理模块构建了统一的事件入口,满足现有事件源的接入,同时也能满足未来扩展的接入需求。其核心特色是“面向业务的、以故障处理为中心的集中事件管理平台”。通过可视化的“告警管理”,提升告警的有效性;通过智能“故障管理”提升故障处理效率,通过丰富的“事件运营”来提升故障处置效率,辅助增加监控覆盖率。统一监控管理功能涉及的各专业监控工具包括:系统监控、网络监控、环境监控、批量自动化、交易监控、日志监控、数据流量分析、互联网探测巡检自动化、互联网应用性能管理平台、OEM、UPS监控、设备监控和安全监控等;
2、新增视图管理模块,为用户提供统一的在线协同工作平台,实现管理对象的配置数据、视图数据、运维数据等多维度信息(应用、系统、网络和基础设施等)的综合呈现及管理,建立统一规范的信息系统全景视图,绘制应用墙,形成多层级的组织资产、协作分享,提升数据整合能力和关联能力,从而取得视图可视排障,缩短故障历时的目标。
3、集成配置管理系统、电子地图平台,实现配置数据的自动同步和可视化消费。在减少基础数据的维护复杂度及工作量同时,发挥配置数据的运维价值,并以可视化消费为驱动提升配置数据的准确性。
4、数据中心全方位可视化,包括基础设施可视化、应用系统可视化、网络可视化,交易可视化、配置可视化等,多维度、层次化的展示运维管理数据,全面展示监控结果,将运维数据公开、透明,实现数据共享,并通过可视化让数据的理解得到一致化,进而发挥数据驱动运维,提升我行数据中心的运维管理水平。
项目创新点
项目主要定位于建设面向业务的统一监控平台,系统将不同监控工具中的事件实现了汇聚,100%覆盖了数据中心现有监控源。在完善的数据基础上,运维人员设计并落地了一套完整的事件规则,在“事件整形”、“事件加工”和“事件派发”三个层面对数据中心的监控效率有效提升,告警噪声得到了有效下降,也提升了有效故障派单率。
在规则层面,系统创新的采用了数据可视化的手段,打破了以往规则设置是黑盒的问题。功能设计上借鉴了“敏捷开发”中的需求看板,在系统中实现了“事件规则看板”,对每条规则的“命中数”、“命中率”和“成功率”进行了直观的展示。通过这种方式,系统解决了以往规则定义后效果不可见,时间长了之后无人了解细节的问题,监控人员可根据规则生效后的情况调整,从而达到提升事件处理效率的效果。
在另一个方面,在本期项目中,通过对于业务架构图的梳理,系统实现了面向业务视角的运维转型。在系统中运维人员建立了从业务-应用-部署和网络的完整业务“全景”,在架构图中集成了配置、事件、性能和工单等数据,实现了自动化能力的集成。一旦业务出现故障之后,运维人员可以迅速的定位故障并排除故障,缩短业务MTTR。
技术实现特点
整个系统分为数据集成、数据存储和应用展现三个大的部分,细分为外围支撑业务系统、数据存储模块、数据接口模块、自定义模型、告警数据管理、系统配置管理、统一监控平台、应用架构可视化、应用和系统监控可视化、交易监控可视化、数据中心可视化等模块;其中数据存储模块为整个系统提供数据支持;数据接口模块提供与外围支撑业务系统的数据集成和交互;自定义模型提供了场景和模型的自定义功能;告警数据管理、业务拓扑图管理和系统配置管理对整个系统的运行提供基础配置和管理;应用架构可视化、应用和系统监控可视化、交易监控可视化、数据中心可视化模块是整个系统对外展示的一个平台;而统一监控平台是对行内众多监控平台进行统一管理。
系统主要使用基于源生JS的脚本进行开发和运行。系统采用了B/S架构,使用了Html+CSS+Js的前端技术进行应用展示,3D展示部分使用了Treasure3D插件和Uinnova3D引擎进行渲染和展示。考虑未来的扩展性,系统支持各种主流协议与外围系统集成,包括JDBC、RESTFUL、WebService、ActiveMQ、SNMP、TRAP等。同时处理海量运维数据的要求,整个系统可基于Spark Streaming/Spark/Hadoop等计算框架处理,支持分布式水平扩展。
项目过程管理
整个项目建设周期为12个月,共计1800人天,建设过程主要包括四个阶段:
分为项目需求调研与分析(历时2个月)
项目开发与实施(历时7个月)
项目试运行与培训(历时3个月)
项目验收。
在项目开发实施阶段,在原有数据中心可视化平台的基础上,新增统一监控模块和视图管理模块,并且需要与众多外围系统集成,主要包括十几个监控系统、配置管理系统、IT服务管理系统、电子地图系统、短信系统和邮件系统等,基本上包括了北京农商银行数据中心现有所有运维管理系统。考虑数据中心运维工作的特点,突发应急事情较多,各类运维工作较重,为保障项目工作顺利开展,按照工作的先后顺序和各类外围系统的优先级,并结合众多外围系统厂商的支持情况,安排系统集成顺序,做到统筹安排,提前规划,严控项目风险,狠抓项目质量,终在项目规划时间范围内,圆满的实现了与众多系统的集成,完成了项目交付。
项目运营情况
统一及可视化监控体系建设,已依托依托数据中心运行可视化平台完成建设,实现了对北京农商银行数据中心内部各类运维管理系统的集成建设,并对数据中心进行全方位可视化,多维度、层次化的展示运维管理数据,全面展示监控结果。
系统日常运行稳定,在日常数据中心运维管理中发挥重要作用,其满足相关人员运维日常使用,简化了其日常操作,并且运维人员能够通过统一的数据元素自由创建、分享各专业的IT架构图,有助于运维知识的规范和积累。通过平台有助于故障快速定位,提升故障诊断效率;并通过可视化消费配置项数据反向推动配置管理系统的建设,提升了我行数据中心的运维管理水平。
项目成效
统一及可视化监控体系建设将满足不同层次人员对系统的运维管理需求,提高整体的IT运维效率和水平,主要体现在以下几个方面:
1、统一监控管理功能的建设,将我行数据中心分散的、跨专业的告警事件进行集中管理,日常运维人员可以在一个窗口下查看各专业监控的结果;为跨技术领域的运维数据处理和关联分析奠定技术基础;
2、视图管理功能的实现,向运维人员提供了管理、维护IT架构图的工具,运维人员能够通过统一的数据元素自由创建、分享各专业的IT架构图,有助于运维知识的规范和积累;并且运维人员可以围绕运维场景建立管理模型,有助于故障快速定位,提升故障诊断效率;
3、与配置管理系统、电子地图平台的集成,可以降低运维人员在不同系统间同步维护配置数据的成本;并通过配置数据可视化消费,驱动配置管理系统的建设和完善;
4、基于运维数据的有效整合,深化建设应用、网络和基础设施可视化,有助于多维度、层次化的展示运维管理数据,提升我行数据中心的运维管理水平。
经验总结
通过本期可视化管理平台的建设,能够通过统一的管理视图对应用系统、主机设备、网络环境、机房环境进行集中展现和告警,实现统一可视化运维管理工作,围绕全行信息系统整合基础架构管理信息,将不同区域、不同工具的IT管理数据进行统一整合,形成全局运维架构视图。通过架构与数据的有效结合,实现数据中心涵盖从基础设施到应用层的端到端IT运维可视化管理,实时、直观、准确、全面的反映当前业务运行状态、应用系统运行状况,网络运行状态,提高业务影响分析和故障诊断处理效率,提升对运维态势的全局掌控能力,满足日常运维管理全方位、高效能的管理需求。
本文由2018年度农村金融科技创新优秀案例评选组委会授权发表,转载请注明出处和本文链接。
本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】。
推荐阅读
更多
河南农信:基于大数据平台的智能审计管理信息系统
随着河南省农村信用社各项业务的飞速发展及信息化建设的不断深入,创新性金融产品和金融服务不断涌现,业务数据和业务流程复杂程度不断提高,交易信息和管理信息不断膨胀。
2018第二届农村中小金融机构科技创新优秀案例评选
河南农信
2018-11-01
安徽农信:基于人工智能的滨湖数据中心基础设施能效优化
数据中心基础设施能耗巨大,数据中心节能能够带来显著的经济和社会效益。而在数据中心基础设施中,空调能耗又占到全部能耗的70%,本项目通过将人工智能应用到数据中心基础设施空调系统运行控制中,为安徽省联社乃至金融行业数据中心基础设施节能降耗探索一条智能化创新的道路。
2018第二届农村中小金融机构科技创新优秀案例评选
安徽农信
2018-11-01
湖北农信:智慧学习平台
智慧学习平台的建设广泛运用互联网新媒体技术,集教、学、练、考评等要素,通过数字化学习运营将其打造为兼容、开放、共享、规范的多元一体化学习载体,成为全省农商行系统的学习中心,考试中心、直播中心、制度图书中心、员工交流中心,有效地提高了员工学习的时效性、便捷性和覆盖面,成为全省农商行“智慧银行”的建设重要载体。
第五届农村中小金融机构科技创新优秀案例评选
湖北农信
2018-11-01
江西农信:“百福快贷”项目
网络信贷项目依托互联网技术,采用全流程“不落地”线上操作模式,以大数据应用为基础,实现贷款申请受理、审批、放款、回收和贷后管理全部在线完成,整个贷款审批流程无需人工参与,实现了系统几分钟内自动产生审批结果,真正意义上达到了可足不出户就可完成贷款申请和收到贷款的目标。
2018第二届农村中小金融机构科技创新优秀案例评选
江西农信
2018-11-01
江苏省联社:风险偏好与限额管理系统
本项目旨在建设统一风险数据集市,打通风险管理相关数据,建立风险偏好与限额管理系统,提高各类风险识别、计量、监测和数据分析的能力,并提供给农商行风险管理相关的数据支撑,以帮助农商行进行合理的业务拓展与风险管理决策。
第五届农村中小金融机构科技创新优秀案例评选
江苏省联社
2018-11-01
重庆农商行:基于数据决策的全线上零售信贷产品“渝快贷”
“渝快贷”是重庆农商行推出的基于数据决策的个人全线上信用消费贷款产品。
2018第二届农村中小金融机构科技创新优秀案例评选
重庆农商行
2018-11-01
微信
咨询
微信咨询
扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构