本文来源于:2024年“鑫智奖”第六届金融数据智能优秀解决方案评选,作者:擎创科技

擎创科技:擎创夏洛克一体化数智运维解决方案

2024-02-21 关键词:运维管理,智能运维,数据平台与数智应用 2331

一、解决方案简介


该解决方案从业务视角出发,以一体化数智运维平台为核心,进行多种企业级运维场景的建设。在不影响原有各专业领域运维工具的前提下,通过一体化数智平台桥接流程管理平台和安全运营中心,实现全局运维的统一运营管理。


通过建设一体化数智运维平台,打造企业级运维管理能力。首先形成运维数据治理体系,落地运维配置的闭环管理,进行运维工具的一体化转型,达到能够全面覆盖云上云下各类技术栈;进而建设安全可靠易用的工具平台,提升运维操作自动化覆盖,实现生产可视化展现以及工具建设的自主可控;后,不断升级优化推动运维场景向智能化演进,全面实现运维技能的转型升级,赋能企业运维运营管理能力。


22、.png


二、应用场景痛点简介


《金融科技发展规划(2022-2025年)》从宏观层面,对我国金融科技的发展提出了顶层设计和统筹部署的要求,明确了要建立健全金融数据中心智能化运维机制,加强多场景协同联动、多节点一体管控,提升节点感知、异常发现和故障预测能力,降低人工操作风险,推动运维管理模式转型升级。


当下金融行业大多数正经历分布式架构和云原生转型的快速变革,给现有运维能力带来了极大的挑战。在信创要求的前提下,企业亟需完成从专业工具运维向一体化运维平台阶段的转化,尽快脱离传统运维阶段,这便对现有的运维组织架构、运维标准规范、运维工具能力以及运维人员的技术手段提出了更高的要求。


痛点一:很多企业数据中心各领域的专业工具繁多,虽然能够全面覆盖业务场景,但无法统筹管理,应急处置、告警收敛等运维场景能力无法做到全领域支撑。另外,由于过渡依赖厂商产品,没有形成定制化产品能力,也无法进行快速迭代升级,因此企业虽大但能力却还无法与体量相匹配。加上云原生等新兴技术的崛起,运维工作受到了极大的压力。


痛点二:以基础监控工具为主,未建设自动化、可视化工具,因此导致监控覆盖不全,颗粒度不够细致,没有办法进行细致的数据分析,很难向智能化演进。另一方面,在运维层面因为没有高效的数据处理工具,也未制定统一的数据标准,导致运维标准不统一,运维经验不能沉淀和共享。


三、解决方案亮点介绍


项目从基础能力层、场景层、门户层分层建设,首先形成数据运营与智能算法、企业级CMDB、操作自动化三大基础服务能力,然后以业务需求为核心,建设各类运维场景,如应用监控、集中告警、灾备切换、应急处置、应用发布、批量操作等,后整合场景端能力,兼容展现终端,实现智能可观测的可视化展现,按照业务需求总览系统状态,达到全局服务的能力。


23.png


1.基础能力层


从物理层、逻辑层、应用层分别入手,纳管来自各中心、云上云下、流程操作等各类数据,类型涵盖CMDB以及日增大数据;同时,建立数据集市、制定数据治理规范和标准,对海量的数据进行高效处理、计算及存储管理,并对数据的质量进行全面监控,实现数据服务标准、敏捷。


2.场景层


以业务需求为起点,构建应用监控场景、集中告警、应急处置、灾备切换等。


其中应用监控场景构建总览业务视图,将现有不同领域、不同层次、不同类型的监控进行整合,集中管理总分行各项监控功能。依托大数据平台数据集市和CMDB,统一构建所有监控运维数据指标体系,实现跨技术领域数据关联分析。


打造集中告警和应急处置的联动能力,通过云上云上全技术栈一体化的应用系统观测视角,关联展现应用系统各领域、各维度、各技术栈的指标数据、动态阈值基线、云资源配额使用情况、异常告警信息和流程情况,并支持钻取。


同时,基于保证业务连续性、保护数据安全性以及应对操作自动化平台变更模块时可能产生的应急问题,建设灾备场景,包括灾备切换总览、规划管理、切换设计、切换管理、评估改进五个模块,为中心级全部场景灾备管理提供服务。


3.门户层


分为三个重点模块:服务共享中心、用户权限管理、统一门户。


①服务共享中心


通过对基础能力和外部系统的服务进行治理管控,想运维场景应用统一共享服务,实现标准化的运维能力输出:单节点服务QPS(每秒响应请求数)大于2万,服务路由延时小于1毫秒。


②用户权限管理


为基础能力和场景应用提供统一的用户、角色和权限管理体系,覆盖监控场景、告警场景、自动化场景等,支持5000用户同时在线,200用户并发操作。


③统一门户


作为统一运维平台的主入口,为用户提供一站式访问各个运维场景和各个子模块功能的快捷通道。同时,汇聚各个场景、模块的概览信息,形成个性化的个人工作台及总览视图。


4.实践效益


①实现全领域数据接入


接入涵盖指标、日志、告警、配置、流程5大领域数据。应用、系统、网络、服务器、存储、云六大块领域,实现日增数十亿的海量数据存储。


②智能化数据处理能力提升


依托运维大数据平台,搭建标准化、可视化、智能化的数据处理平台;通过统一数据集市+用户自主开发的方式向数据开发人员提供数据服务。将数据接入、处理、服务提供整体供数效率从T+7提升至T+2。


③大幅提高故障处理效率


应用监控、集中告警场景配合建设,实现应用故障20秒以内告警,20分钟召集处置。


④运维数据标准化


完成指标、日志、告警、配置、流程这些运维数据的建模,完成基础对象体系、指标体系、配置管理建模,落地运维数据治理,确保了数据的时效性,完整性,关联性,有效性,为应用监控场景、智能分析场景提供高质量的数据支撑。


四、金融行业客户名单


交通银行、人民银行清算总中心等。


五、客户评价


该方案通过不断的试错和试验,已初步实现平台主体成型,可以纳管云上云下运维对象并为之提供服务。目前,已完成正在各分行进行自动化能力试点推广,希望能够达到支撑总行80%以上、分行50%以上的场景自动化。


未来,将进一步推进运维数据标准化和源端数据质量的改造,持续优化、迭代平台整体能力,打造全面化的服务共享能力,嵌入运维大模型自我学习机制,助力客户完善信创及云原生环境下的全面自动化纳管,实现智慧化运维体系的早日建成。


本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】

推荐阅读

更多

甘肃农信:数据治理与数据管控平台

通过对我行内部数据的商业应用和技术管理的一系列政策和流程的梳理及设计,搭建一套涵盖元数据管理、数据标准、数据质量、数据资产管理等方面的数据治理及管控平台,赋能银行数字化转型。 通过实施数据治理和建立数据管控平台,满足人行、银保监会等监管机构的各类监管标准、安全分级标准、监督检查及其他各项要求,提高甘肃农信数据质量和业务数据的应用价值。

2022年第六届农村中小金融机构科技创新优秀案例评选 甘肃农信 2024-02-21

贵州农信:人员异常行为智能监督预警系统

《人员异常行为智能监督预警系统》是作为我社对人工智能——视觉分析和行为识别两大技术在真实场景应用效果的验证项目;是我社探索非结构化数据深度应用的实验项目;也是我社尝试管理智能化的转型项目。 系统在多个场景成功上线并稳定运行,运行的效果完全达到项目建设目标和初衷;充分验证人工智能技术可以辅助实现管理智能化;充分体现非结构化的视频流数据在监督、管理端的价值。

2022年第六届农村中小金融机构科技创新优秀案例评选 贵州农信 2024-02-21

山东农信:集中运维监控平台项目

为保证日常运行维护工作的顺利开展,确保业务系统安全、稳定运行,山东省联社通过建设集中运维监控平台项目,完成了异构监控系统数据的集中,通过大数据技术对运维监控数据进行挖掘和分析,实现了对运维突发事件的监测、识别、评估与态势感知,有效提高了突发事件的处置能力,初步实现了由IT运维到主动运营服务的转变。

2018第二届农村中小金融机构科技创新优秀案例评选 山东农信 2024-02-21

福建农信:云平台“农信云”项目

随着福建省农村信用社联合社(下称 “福建农信”)规模不断扩大、业务不断增加,应用系统、设备、数据中心空间能耗都不断增加,IT运维各方面都面临种种挑战。

2017首届农村中小金融机构科技创新优秀案例评选 福建农信 2024-02-21

贵州农信:IT可视化运维管理体系建设方案

为切实满足业务连续性及监管部门要求,确保IT系统安全、高效、稳定运行,我社在观山湖数据中心建设过程中同步启动了IT可视化运维管理体系建设。

2019第三届农村中小金融机构科技创新优秀案例评选 贵州农信 2024-02-21

浙江农信:运维一体化管理平台

一体化运维平台的总体构架包括资产管理、自动化运维模块、任务管理、系统管理、单点登录等核心模块

2017首届农村中小金融机构科技创新优秀案例评选 浙江农信 2024-02-21

案例库

金融行业全面的数字金融创新案例,涵盖历届“鑫智奖·金融机构数智化转型优秀案例评选”、“农村金融机构科技创新优秀案例评选”、“城市金融服务同业案例征集活动”等科技创新参评案例

  • 数据平台与数智应用
  • 智能运维
  • 运维管理

微信
咨询

微信咨询

扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构