本文来源于:2024年“鑫智奖”第六届金融数据智能优秀解决方案评选,作者:浪潮信息
浪潮信息:面向金融数据中心的智能统一存储管理平台InView
2024-03-01 关键词:运维管理,IT运维,智能运维
3485
一、解决方案简介
浪潮信息面向金融数据中心推出智能统一存储管理平台InView是通过AI技术实现存储自治,即自我管理、修复、调优,提高存储系统的性能、稳定性和易用性,降低存储使用的复杂性,简化运维,实现金融数据24小时在线。
近几年,伴随金融科技的深入发展,浪潮信息一直在致力于该方向研发和探索新特性,目前推出了面向金融数据中心的智能统一存储管理平台InView, 包含了4个预测和2个自动化智能运维功能特性。
四个预测分别为包括提前两周识别风险磁盘,降低数据丢失风险;智能预测性能增长需求,预知性能瓶颈;智能预测容量增长需求,给用户提供科学、准确的扩容建议;预测SSD使用寿命,精准到天。两个自动化分别为性能瓶颈分析,通过端到端诊断分析,快速发现存储性能瓶颈状态,并能定位根因;性能自动调优,结合金融行业应用场景和用户IO模型,自动挖掘优的客户端配置和存储端配置,并主动推荐配置给需要的存储系统和用户。
二、应用场景痛点简介
随着金融科技深入发展,金融大规模、新型数据中心迅速崛起,数据量呈指数级增长,同时各种新存储介质和技术的应用,使得存储系统变得越来越复杂。在运维管理上,完全依赖人工已经不能满足需求,企业将更多依靠人工智能进行自动化运维,Gartner认为AIOps的广泛应用将让IT基础设施管理变得更主动、更具预测性,减少管理和停机成本。
以金融数据中心的核心基础设施——存储系统为例,目前的存储系统中具有大量的可调参数,大规模分布式存储系统的软硬组件多,内、外部参数多达两千多个,且90%的参数为数值型和布尔型,参数的可调范围非常大,修改这些参数往往会对系统性能产生不同的影响。通常默认的参数配置由供应商提供,这些参数值的组合一般都不是优的参数集合。研究表明,即使调整一小部分的参数值,也可以将系统的能耗和性能效率提高数倍以上。
传统的参数调整是由系统管理员依据自身的专业知识和经验完成的,由于存储系统的复杂性不断提升,手动调参将较难适应大规模的存储系统,并且人工调参具有无法全天候的监控以及高额的人力成本等问题。如何结合具体应用场景,在存储默认配置和性能数据基础上,自动挖掘优的存储配置,并主动推荐配置给需要的存储系统,对存储系统的性能优化具有重要意义。

分布式存储AS13000参数分布
三、解决方案亮点介绍
浪潮信息面向金融数据中心推出的智能统一存储管理平台InView,将带宽提升41%、时延降低29%,实现金融数据中心的“自动驾驶”。具体如下:
首先,在自动调优中,强化学习是一个非常好的解决方案,强化学习(RL)是机器学习的一个分支,涉及代理(agent)如何在当前环境下采取行动(action)以大程度地获得回报(reward)。与监督学习和无监督学习不同,强化学习通过试错机制,与环境进行互动并获得奖励,从奖励中进行学习。

强化学习工作原理
关键算法采用的是2016年谷歌DeepMind提出的DDPG算法,算法包含Actor网络和Critic网络,其中Actor网络可根据环境当前运行状态输出连续动作,Critic网络可对当前环境运行状态和实施的动作进行评估打分,两者相结合,适用于高维连续动作场景。这是首次使用强化学习方法学习和推荐存储系统参数。

性能自动调优整体架构
其次,浪潮信息面向金融数据中心的智能统一存储管理平台InView通过强化学习进行存储系统参数调优,整体包含三个模块,分别是用户的应用、分布式存储系统AS13000以及调优模块。其中,参数推荐引擎可根据分布式存储AS13000的当前状态生成佳配置,负责将佳配置动态下发给AS13000,AS13000负责响应客户端的IO读写请求,性能指标采集器负责采集AS13000在新配置下的状态信息并计算在新配置下的性能提升效果,深度学习引擎根据AS13000的反馈迭代更新Actor和Critic网络。该过程迭代直到模型收敛,终将找到合适的参数设置。
再次,浪潮信息面向金融数据中心的智能统一存储管理平台InView的性能自动调优功能具备端到端参数自动调整、提升网络带宽同时降低网络时延、参数的调整不影响集群正常运行三大特点,具体实验效果如下:橙色框中的前360步,模型随机探索学习,红色框为360步之后,模型自动推荐参数,相比默认配置(黑色框中的点),平均带宽提升41%,时延降低29%,调优效果与性能专项组专家经验相当。

自动调优与默认配置效果对比
四、金融行业客户名单
国有银行、股份制银行、省级农信、城商行,以及大型保险央企等,均为浪潮信息智能运维解决方案的用户
五、客户评价
1.某金融用户:“浪潮信息的智能运维做得非常好,让我们的数据中心运维管理省力省心。而且浪潮信息的存储服务和产品一样好,可以为我们提供7 * 24的服务,这确实可以帮助我们维护存储设备。我们已经使用AS13000G5超过1年,它稳定且易于使用,明年我们将继续扩充容量。”
2.某金融用户:“浪潮信息的存储产品有三大优势,一是易用性好,智能统一存储管理平台InView操作方便;二是产品性能高,高峰时期使用顺畅;三是能够将本组织的全部数据将归入一个存储平台。”
本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】。
推荐阅读
更多
山东农信:集中运维监控平台项目
为保证日常运行维护工作的顺利开展,确保业务系统安全、稳定运行,山东省联社通过建设集中运维监控平台项目,完成了异构监控系统数据的集中,通过大数据技术对运维监控数据进行挖掘和分析,实现了对运维突发事件的监测、识别、评估与态势感知,有效提高了突发事件的处置能力,初步实现了由IT运维到主动运营服务的转变。
2018第二届农村中小金融机构科技创新优秀案例评选
山东农信
2024-03-01
福建农信:云平台“农信云”项目
随着福建省农村信用社联合社(下称 “福建农信”)规模不断扩大、业务不断增加,应用系统、设备、数据中心空间能耗都不断增加,IT运维各方面都面临种种挑战。
2017首届农村中小金融机构科技创新优秀案例评选
福建农信
2024-03-01
贵州农信:IT可视化运维管理体系建设方案
为切实满足业务连续性及监管部门要求,确保IT系统安全、高效、稳定运行,我社在观山湖数据中心建设过程中同步启动了IT可视化运维管理体系建设。
2019第三届农村中小金融机构科技创新优秀案例评选
贵州农信
2024-03-01
浙江农信:运维一体化管理平台
一体化运维平台的总体构架包括资产管理、自动化运维模块、任务管理、系统管理、单点登录等核心模块
2017首届农村中小金融机构科技创新优秀案例评选
浙江农信
2024-03-01
江西省农商银行:IT可视化统一运维监控平台
为满足“集中监控”管理工作要求,实现运维可视化的集中监控,江西农信将建立一套集中、规范、完整的可视化统一运维监控系统,依托IT可视化系统让一线人员清晰直观掌握IT系统的整体架构和各业务、网络和资源的运行状态。
2018第二届农村中小金融机构科技创新优秀案例评选
江西省农商银行
2024-03-01
光大证券:数智化数据中心多云管理平台
数智化数据中心多云管理平台实现多云的统一管理,跨云资源调度和编排,统一监控和统一运维,统一的成本分析和优化,实现统一交付。
网络整理
光大证券
2024-03-01
微信
咨询
微信咨询
扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构