本文来源于:鑫智奖·2024第五届金融机构数智化转型优秀案例评选,作者:招商基金

招商基金:FinOps运营分析平台建设与实践

2024-06-05 关键词:基金,数字化运营,场景金融3780

一、项目背景及目标



1.背景


近些年,FinOps的实践在国内外热度较高,开始从狭义上的只面对云的成本管理与实践发展为广义的公司对IT资源使用情况的数字化运营管理以及文化的实践,但是目前,大多企业还是从单一资源使用情况入手,展开相关工作,较少从管理者关注的业务系统视角出发,统计每个业务系统的相关IT资源容量使用情况,本项目正是基于此背景,以构建“数据+算法+场景”的高价值服务型数据资产为指引,落地了一套完整的以业务系统为中心的FinOps数字化IT容量运营分析平台。 


2.目标


①针对FinOps的场景,基于数据资产发掘、数据资产促活和数据资产变现的数据价值评估体系,输出相关从海量基础数据提炼出高价值服务型数据的经验,使得同业可以借鉴此做法建设符合自身需求的FinOps运营分析平台。


②通过我司以业务系统为中心的FinOps数字化IT容量运营分析平台的落地的众多场景化实践以及成果,为同业进行FinOps落地各种场景提供借鉴意义。


③一方面让多角色的平台使用者,从多维度观测到其关注的高价值数据,以结合公司的发展方向,判断资源投入是否合理;另一方面众多落地的场景化实践,能够让各个业务系统在IT资源使用方面更加合理,从而践行数字化IT运营管理的要求,降本增效。


二、创新点


1.基于可观测和无入侵的业务系统资源容量模型“加”评分机制与双态分析


①创新的可观测、无入侵的容量模型


我司每个业务系统下包含若干应用,每个应用下关联了该应用下包含的开发、测试和生产环境IT资源容量分配情况,包括:云主机的CPU、内存、数据库用户容量等,并可扩展其他资源,这就构成了业务系统的容量模型。同时,平台利用监控组件,采集到各类型资源(CPU、内存、数据库容量、数据库用户容量等)使用情况的指标数据,这些数据本质是对监控数据的深度挖掘与价值提炼,并不会对业务系统带来额外的资源消耗,即无入侵。平台将这些数据采集到的数据存储起来,并结合CMDB中已有的业务系统与应用,以及应用与各个环境的资源使用关联关系进行整合,从而构建出以业务系统为中心的可观测的数字化IT基础资源使用情况模型。


②可配置的数据采集与评分机制


我司FinOps数字化IT容量分析平台,可以根据实际需求配置数据采集的模式,当前版本有两种数据采集模式,一是主动触发随时按需采集,二是周期性的每两周进行一次数据采集,周期性数据采集涉及两方面内容,一是采集统计每个业务系统以及业务系统下应用配置的云主机资源分配情况(CPU总数和内存总数)二是针对云主机的CPU和内存以及数据库的使用情况进行动态采集。


平台基于业务系统对资源的使用情况进行评分,评分模型可以根据每个公司的具体情况调整优化。一般而言,满分为三颗星,不同的分数代表着后续需要进行的不同的资源优化工作,得分为三颗星,代表该业务系统下的所有应用以及应用下的所有主机都符合要求,无需调整;得分为两颗星,代表该业务系统下的应用都符合要求,但是应用下有主机不满足要求,后续需要优化;得分为一颗星,代表该业务系统下有应用不满足要求,后续需要优化。


③动静双态的业务容量数据分析


我司FinOps数字化IT容量分析平台对接了CMDB平台和监控平台,利用CMDB平台和监控平台的数据,实现了针对业务系统容量数据的双态分析。在静态数据分析方面,FinOps平台通过对接CMDB平台可以获取某个时间点业务系统以及业务系统下各个应用各个环境的资源分配情况,可以用于从横向的角度对比各个业务系统的资源占比情况;在动态数据分析方面,FinOps平台通过与监控平台对接,可以将每两周一次采集的各个业务系统资源使用情况,从纵向的角度构建出资源变化趋势图,从而可以让管理者更加动态直观的观测到每个业务系统资源使用情况的变化趋势,利于进一步评估业务发展与容量、成本之间的变化关系。


2.优化任务可跟踪,多维数据可分析


①优化任务可跟踪


平台会持续跟踪优化任务中记录了哪个业务系统需要对哪些资源进行的优化目标,并拉取ITSM工单系统的执行结果与最新采集到的资源使用情况进行比对,确认资源是否进行了实际调整,对于实际按照计划执行的,这条优化任务会被标记为已完成,对于没有执行或者没有按照计划执行的,这条优化任务的执行次数加1,代表此优化任务没有在本批次优化任务中完成,会在下一批次的优化任务中再次发起,直至完成优化,从而实现资源优化任务的持续跟踪。


②多维数据可分析


平台当前可统计每次优化任务的资源优化情况(计划回收多少资源,实际回收多少资源,资源回收百分比),统计优化任务累计的资源优化情况(计划回收多少资源,实际回收多少资源,资源回收百分比),统计各类资源(CPU、内存等)以及各个环境(开发、测试、生产)的资源优化情况。平台可以根据收集到的数据,制作各种报表、饼图、柱状图或者折线图,提供丰富的多维数据分析能力。例如,平台基于记录的每两周计划和实际回收资源数据,形成趋势图,更加直观的查看资源回收情况。同时,平台除了支持从业务系统的视角查看资源使用情况外,还可以统计每个团队的资源使用情况,从团队视角查看每个团队申请了多少资源,团队内的每个组员申请了多少资源,协助分析团队资源使用是否合理。


3.5个同业可复制的场景化实践


相比于未标准化资源优化场景的工作实践,我司FinOps数字化IT容量运营分析平台已落地5个场景,具体如下:(1)基于双态分析的业务系统资源趋势偏离度预警,发现业务系统资源使用情况与业务定级或者实际产出出现较大偏差的场景触发预警;(2)通用型业务场景资源优化,对满足优化条件的云主机进行资源优化,实现缩容降成本,扩容保稳定;(3)周期型业务场景资源优化,通过平台与自动化运维平台和云平台的联动,实现相关资源性能的保障;(4)“僵尸”资源发现与回收,结合我司实际情况定位疑似“僵尸”资源,并联系相关负责人确认资源情况进行处理;(5)资源升级改造数据支撑,统计每个业务系统各类资源占比,为基础资源改造升级提供数据支撑。


4.业务系统为中心的资源优化全生命周期管理


相比于需要人工跟踪资源优化工单的执行情况以及没有带动资源相关人员一起参与资源优化的实践方式,我司平台做了以下创新:


①降本增效闭环运转


平台会跟踪每个资源优化工单,并且周期性地对业务系统的资源使用情况进行动态分析,标记资源优化完成情况和产生新的资源优化工单,将降本增效有效的闭环运转起来。


②达共识,共参与,获收益


平台使得对业务系统FinOps容量管理关注不同角色的人员(业务负责人、项目经理、基础资源管理者)在对数据指标的认知上达成共识,并且基于每个角色关注的指标数据设计了相关的可视化展示菜单,从而使不同角色的人员在整个资源优化运营的生命周期闭环管理中既能发挥自身擅长的能力,又能获取到自身关注的数据指标。


5.实现基于业务系统的资源优化从“运动式”到“常态化”的转变


目前有些公司的资源优化任务是“运动式”的,即不定期开展一次后就停滞了下来,而基于我司FinOps数字化IT容量运营分析平台,在确定好资源优化场景后,可以通过配置任务的方式来触发该优化场景的开展,优化任务会对接ITSM工单进行任务推送,同时平台的全生命周期跟踪引擎会对此优化任务的工单执行情况进行跟踪分析,实现场景优化任务从“运动式”到“常态化”的转变。


6.平台部署双环境适配


在自主可控的大背景下,我司FinOps数字化IT容量运营分析平台支持部署在非信创与信创环境部署运行。在信创部署方面,平台目前适配海光7系列CPU、麒麟V10操作系统以及东方通THS中间件等。


7.基于低代码平台,带来需求迭代“飞一般”的感觉


我司FinOps数字化IT容量运营分析平台基于低代码框架进行开发,低代码开发平台通过提供可视化的开发工具和组件库,提高开发效率,相比于未采用低代码技术的开发方式,可以更快的支持各种新的需求以及场景落地,给降本增效的落地带来“飞一般”的感觉。


8.发明型专利


我司FinOps数字化IT容量运营分析平台从业务系统的视角出发,统计每个业务系统的资源使用情况,基于此设计业务系统的容量模型、评分机制、多维数据分析与任务跟踪以及落地了众多实用场景,并以此申请了相关发明型专利《业务系统容量相关管理方法、装置、存储介质及设备》专利号:ZL202310958572.X。


根据调研,目前基本没有平台具备基于可观测和无入侵的业务系统资源容量模型设计、容量评分机制、优化任务可跟踪、多维数据可分析以及多类型业务场景容量分析与优化等全生命周期的管理能力,从这个角度讲,具备我司平台具备首创性。同时我司FinOps数字化IT容量运营分析平台的建设思路和落地场景,具备证券基金行业通用性,可以通过推广复制的方式,运用于其他证券或者基金公司,为其数字化IT容量管理和企业降本增效提供实践经验。


三、项目技术方案


我司FinOps数字化IT容量分析平台在建设过程中为了能够让相关干系人能参与到整个业务系统容量分析与优化的全生命周期中,让相关干系人可以从各自的视角找到关注的数据指标,存在以下关键技术点:


1.“算总量”


统计每个业务系统以及业务系统下每个应用对云主机、数据库和数据存储的具体使用情况,为了解决这个问题,平台对接我司CMDB系统,获取每个业务系统下资源清单,从而计算出每个业务下资源的具体使用情况。


2.“无入侵”


平台在数据采集方面,没有再重复造轮子,一方面是使用监控平台采集的监控数据进行深度整合与处理,提取所需的数据;另一方面是使用自动化运维平台的能力对某些数据进行一次性或者周期性采集。


3.“可观测”


平台将采集到的原始数据和产生的运营数据进行分类存储,并可以通过制作各种报表、饼图、柱状图或者折线图,提供丰富的多维数据分析与可视化能力。


4.“定评分”


平台基于业务系统资源使用的情况确定了一套评分机制,基于该机制给每个业务系统进行评分,根据评分结果确认资源优化任务。


5.“双模态”


平台基于对CMDB平台和监控平台的数据采集,静态方面可以统计每个业务系统现网的资源分配情况,便于业务系统的横向对比;动态方面可以动态的查看业务系统资源分配的历史变化趋势,便于管理者结合业务系统情况进行联动分析。


6.“可跟踪


平台会跟踪每个资源优化工单,跟踪每个资源是否有按照预期要求完成资源优化工作,并且持续性地对业务系统的资源使用情况进行动态分析,标记资源优化完成情况和产生新的资源优化工单进行跟踪,将降本增效有效的闭环运转起来。


7.“多视角”


基于不同角色的用户关注的数据指标不同这个客观需求,平台针对不同类型的角色设置了相关的功能菜单和界面,可以满足不同角色对不同维度数据指标的可观测需求。


8.“全周期”


平台基于对每个业务系统IT资源容量分配与使用情况的统计、评分、优化调整、任务跟踪以及数据多维度的分析展示,一方面对于需要优化调整的资源实现了全生命周期的跟踪运营;另一方面使得不同角色的用户在平台数据上达成共识并获取到自身关注的数据,从而参与到整个基于业务系统容量管理的全生命周期中。


四、项目过程管理


需求分析:2022年7月


项目立项:2022年9月


项目实施:2022年10月至2023年5月


项目上线:2023年5月


五、运营情况


我司基于业务系统的FinOps数字化IT容量运营分析平台于2023年5月上线第一个版本,并且部署在信创环境,用户主要是我司对于业务系统使用IT资源容量关注的管理人员、业务系统负责人项目经理、基础资源管理员等,落地了5个场景,2个场景在规划中,并根据使用过程中遇到的问题和收到的需求一直在进行迭代优化。


五个已落地的场景如下:


1.分析的业务系统资源趋势偏离度预警


基于平台针对业务系统双态分析的能力,如果发现某个业务系统的资源投入与该业务系统的定级或者实际收益出现较大偏离度,则发出预警提示。例如,某业务系统定级为一般级或者该业务系统实际产出一般,但是通过双态分析,发现该业务系统资源使用率一直处于上升通道则发出预警通知,需要业务系统相关负责人进行关注并处理。


2.通用型业务场景资源优化


对于没有明显业务高峰低估的业务场景,基于每两周采集的资源使用情况数据,对于资源利用率小于15%的,则触发ITSM工单进行资源缩容;对于资源利用率大于80%的,则触发ITSM工单进行资源扩容,如图:


155.png


3.周期型业务场景资源优化


对于不同类型的业务系统,通过数据分析发现,其业务高峰期具备一定的周期型,例如在每天某个时间段繁忙,在其他时间段空闲,存在资源使用错峰的情况,针对这些情况,自动化运维平台和云平台进行对接,将错峰使用资源的云主机部署在相同的宿主机上,保证不同业务系统在运行时其云主机都能提供良好的性能,如图:


156.png



4.僵尸资源发现与回收


我司FinOps数字化IT容量分析平台会基于其采集能力,收集以下信息来辅助判断该云主机是否为“僵尸”云主机(没有实际业务运行)。一是应用云主机上是否有运行java或者python进程,因为我司业务系统基本都是基于java或者python开发的,如果云主机上未运行java或者python进程则可能未在使用;二是中间件云主机上是否存在业务连接,如果中间件云主机上没有业务连接,则说明该中间件可能未被使用;三是查看应用日志是否有近期更新,如果应用日志有近一个月没有更新则可能存在应用未使用的情况。针对以上三种情况,平台发现后会调用CMDB查到云主机负责人并进行通知,若确认资源不再使用则进行回收。


5.资源升级改造数据支撑


由于我司FinOps数字化IT容量分析平台统计了每个业务系统的资源使用情况,进而可以计算出每个业务系统资源占全局资源的百分比,那么在某些场景下,如果需要做底层资源的升级改造,就可以快速获取改造某个业务系统底层资源对全局资源的影响比例。


六、项目成效


1.经济效益


①直接经济效益


在容量优化方面,根据我司FinOps数字化IT运营分析平台的优化算法,从平台5月正式上线截止2023年12月31日,累计回收开发测试生产环境,1200个虚拟CPU、2200GB内存,即节约5台云平台宿主机采购,约925,000元。


②间接经济效益


在容量分析方面,统计每个业务系统各个环境(开发、测试、生产)对计算资源(CPU和内存)以及数据库资源(计算资源和存储资源)的使用情况,我司目前共计约400+业务系统,经估算,每次进行一次全量资源统计及报表整理约需要0.5人月,当前平台任务是2周一次,从上线到2023年底需要8人月(按照每月4周计算),再加上对资源生命周期变化的跟踪,计算约需要2人月,则从5月上线至2023年底约需要10人月,即节约10人月的投入。


2.社会效益


①数字化落地实践


我司FinOps数字化IT容量分析平台在软著和专利方面取得以下成果:一是完成发布相关软件著作一篇《FinOps数字化IT容量运营分析平台》登记号:2023SR1043733;二是完成相关专利申请《业务系统容量相关管理方法、装置、存储介质及设备》专利号:ZL 2023 1 0958572.X。


②行业推广与分享


我司FinOps数字化IT容量分析平台上线以来,先后在2023 Gops全球运维大会以及湾区金科(FinTech)沙龙(第四十七期)--运维专场,进行了相关内容的分享。通过在同业中交流我司FinOps数字化IT容量运营分析平台,向同业宣导基于业务系统的数字化IT容量运营分析思路与落地场景,引导同业开展相关工作,为切实落地降本增效提供经验。


七、经验总结


本课题以构建“数据+算法+场景”的高价值服务型数据资产为指引,构建以“数据资产管理、数据资产运营和数据资产评价”,三位一体的数据资产体系,以“价值为导向、运营为手段、管理为抓手”,落地了一套完整的以业务系统为中心的FinOps数字化IT容量运营分析平台。


1.数据资产管理之高价值数据生产


平台通过复用监控平台与CMDB平台采集到的海量基础数据并结合我司定义的“资源水位”算法,进行产能评估与效能评估,通过数据资产价值发掘与促活,生产出具备高价值的服务型数据,实现容量分析模型的量化评分。


2.数据资产运营之多维度、多角色全生命周期运营


平台通过对数据资产用户运营、数据资产内容运营和数据资产活动的运营,为多角色的参与者提供其可见、可懂、可用的高价值数据,同时基于平台与工单系统对接和全生命周期引擎实现场景优化任务从“运动式”到“常态化”的转变。


3.数据资产运营之同业复制


我司高价值服务型数据生产的经验以及落地场景,具备行业通用性,可以运用于其他证券或者基金公司,为其数字化IT容量管理和企业降本增效提供实践经验。


4.数据资产评价之高价值场景落地变现


平台目前落地5个具备高价值服务型数据的场景化实践,实现了基于数据发掘与促活的数据价值变现,从2023年5月截止2023年12月31日,共计节约直接成本约92.5万元和间接成本10人月。


5.风险控制方面


平台部署在我司本地机房的生产外网与交易网在不同的网段,需要通过VDI+密码+二次认证码的三重安全保障方式登录。本平台所采用的数据,均来自我司内部运维监控平台产生的资源监控数据与CMDB业务系统层级结构数据,这类数据属不涉及客户信息、监管信息以及业务相关信息,收集到数据只做基于业务系统的容量分析使用,不会提供给其他平台或者系统使用,不存在传播链路。


平台建设需要以价值为导向,引导尽可能多的相关方参与其中,一方面充分利用好每个参与方的价值输入,另一方面要为每个参与方提供大于其价值输入的价值输出。同时,在平台建设的过程中,还要考虑安全因素和同业的可复制性,切实为企业数字化IT容量管理和降本增效提供实践经验。


本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】

推荐阅读

更多

江西农信:“百福快贷”项目

网络信贷项目依托互联网技术,采用全流程“不落地”线上操作模式,以大数据应用为基础,实现贷款申请受理、审批、放款、回收和贷后管理全部在线完成,整个贷款审批流程无需人工参与,实现了系统几分钟内自动产生审批结果,真正意义上达到了可足不出户就可完成贷款申请和收到贷款的目标。

2018第二届农村中小金融机构科技创新优秀案例评选 江西农信 2024-06-05

金融科技如何支持普惠金融发展?40余项创新应用或给出答案

普惠金融,是“五篇大文章”之一。对于普惠金融所包含的服务对象来说,目前仍存在获取金融服务难等问题。做好“普惠金融”这篇文章,或需要金融科技的助力。前央行行长周小川早在2016年就指出,普惠金融强调运用新的信息技术实现普惠。那么,银行的普惠金融到底运用了哪些技术?或可通过银行申请的金融科技创新应用进行了解。

银行科技研究社 木子剑 2024-06-05

云南红塔银行:“香叶智农”——一站式烟农服务平台

云南红塔银行结合国家烟草专卖局《关于建设现代化烟草经济体系推动烟草行业高质量发展的实施意见》和云南省《云南省数字烟草农业发展总体规划》的相关要求,结合人民银行普惠金融的相关政策规定,配合南省烟草专卖局(公司)搭建了“香叶智农——一站式烟农服务平台”,结合烤烟生产全流程,在平台上为种植主体、第三方供应、服务商等提供多样化的场景金融服务,提供安全、便捷、高效的线上烟农支付结算服务,助力乡村振兴。

2022年度城市金融服务优秀案例评选 云南红塔银行 2024-06-05

广东农信:信贷平台消费易项目

为提高卡贷宝业务的竞争能力,顺应消费贷款业务的市场需要,继续开发卡贷宝消费易业务产品功能,实现对优质客户的主动授信,打通该产品线上精准营销渠道,简化申请和审批流程,风险可控,提升效率和客户体验度。

2018第二届农村中小金融机构科技创新优秀案例评选 广东农信 2024-06-05

重庆银行:乡村振兴青年贷

乡村振兴青年贷是重庆银行在共青团重庆市委、重庆市财政局、人民银行重庆营业管理部联合推出的“乡村振兴青年贷”项目基础上通过拓宽申请渠道、简化办理手续、丰富担保方式推出的重庆市首款专属青年人才“乡村振兴青年贷项目”特色信贷产品,具有资料简、额度高、利率低、审批快、担保方式灵活多样等优势。乡村振兴青年贷的推出,为投身乡村振兴、农业农村现代化发展的青年提供有力的信贷支持,助力农村人才振兴、产业振兴。

2022年度城市金融服务优秀案例评选 重庆银行 2024-06-05

深圳农商行:智能柜台

为积极贯彻落实金融产品创新及普惠金融理念,给客户提供更加便捷高效的金融服务,全面提升客户体验,综合上述因素,我行在优化运营业务流程、深化网点转型的基础上,着手开发创新型智能柜台系统。

2024-06-05

案例库

金融行业全面的数字金融创新案例,涵盖历届“鑫智奖·金融机构数智化转型优秀案例评选”、“农村金融机构科技创新优秀案例评选”、“城市金融服务同业案例征集活动”等科技创新参评案例

  • 基金
  • 数字化运营
  • 场景金融

微信
咨询

微信咨询

扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构