本文来源于:鑫智奖·2024第五届金融机构数智化转型优秀案例评选,作者:苏州银行

苏州银行:智能微服务平台

2024-06-13 关键词:城商行,基础设施,IT架构,云原生1725

一、项目背景及目标

当今的应用程序开发和IT系统管理都由云驱动,通过与基础设施深度整合优化,将计算、存储、网络资源管理以及相应的自动化部署能力交由云基础设施执行,应用自身变得更为灵活。将大型服务器虚拟化成较小的虚拟机,按需要扩容,充分利用机器计算资源,降低管理成本。相比于传统架构,云原生架构强调业务研发应充分利用云平台提供的IaaS和PaaS能力,处理分布式环境下复杂的非功能性问题,如分布式存储、弹性伸缩、流量管理等。云原生作为新一代的应用开发和运维范式,正在逐步改变企业的IT架构和业务模式。

随着业务规模上升,微服务应用也逐渐成为苏州银行未来系统建设的发展趋势,在信创云、VMWARE等环境中迫切需要更高质量的协同能力。同时,厂商也逐渐往微服务应用转型,但往往自成体系,行内虽具备统一的ESB治理,但缺少统一的微服务治理,因此在引入后造成资源浪费和管理不便。在此背景下,我行探索实施智能微服务平台,统筹IT应用交易线架构规划和网络规划,旨在统一服务目录和服务总线,避免未来信息系统建设混乱,降低系统间的服务访问复杂度,使未来苏州银行数字化转型更加高效。


二、创新点

智能微服务平台包括管理平台、注册中心、配置中心、监控中心、应用控制台、通讯协议SDK在内的多个组件,在内部采用命名空间逻辑隔离各个环境的服务和配置,采用业务域(对应网络大区)和网络区(对应网络小区)逻辑管理各个应用节点。其创新主要体现在以下方面:

(1)便捷化服务管理

通过管理平台管理注册中心,屏蔽了单独操作注册中心的操作复杂性和危险性,提高了对于服务、订阅、方法等数据的管理便捷度。服务信息用于登记应用提供的服务元数据、服务地址,支持方法实例上下线;订阅信息用于登记应用消费的服务和方法,支持超时时间配置。所有的配置和修改可在管理平台完成,按照不同命名空间生效,有效隔离各个环境中不同动态的服务数据。应用只需集成平台提供的SDK就可以完成服务纳管,形成服务、订阅资产。

(2)安全化服务调用

SDK提供了一份SSF协议定义整个服务调用,内部采用本地缓存机制,将管理平台下发的服务信息等数据缓存在应用本地,点对点发起服务调用,即使注册中心出现故障,依赖于本地缓存仍可以保障现有服务的可发现,确保调用无报错。SDK还统一定义了整个寻址过程,包括服务鉴权、灰度、熔断、限流、降级、负载均衡、链路追踪、推空保护、通讯重试、无损下线、同机房路由优先等多种管理和保障机制,其中熔断、限流、降级最大支持到方法级别,且实时生效。在负载均衡方面,SDK提供随机、加权、循环、繁忙等软负载算法,支持扩展策略,即应用系统可自行定义,进行负载均衡算法的管控。通讯层支持普通调用和泛化调用两种调用方式,通讯协议采用谷歌最新的gRPC协议,更加稳定高效。

(3)自动化应用部署

应用控制台承接了应用管理态、部署态到运行态的完整生命周期,支持寻址算法、服务端口、健康探测、JVM设置。在管理态提供机器纳管、应用创建、应用分组、应用扩容等功能;在部署态提供自动化部署、无损起停,灰度发布等能力,对接了国产信创的tongWeb、BES、apachetomcat多种中间件部署方式,兼容应用部署在任意云平台;在运行态登记应用实例信息,提供实例上下线、配置管理和下发、流量控制、应用监控等能力。

(4)全链路化监控

平台内部的监控组件解决了大规模微服务集群难以监控的问题,在服务调用出现问题时,及时产生相应告警,通过内部的全区流水号快速定位故障交易,交易链路信息则包括了应用的每笔交易信息、交易状态、处理时长、处理节点。在产生告警时,又可以设置灵活的告警规则统计出应用交易的超时笔数、交易的失败笔数、交易成功率等信息。此外,监控组件还提供了丰富的机器监控和JVM监控功能,包括fullGc、CPU、内存、负载、磁盘、网络流量等数据。


三、项目技术方案

(1)服务双注册与双订阅

注册中心采用了nacos和zk双中心容灾设计,当一中心集群因节点异常下线或产生网络分区等原因,无法对外提供服务时,由另一中心保障新服务的注册与订阅。Nacos用于存放注册服务和治理参数信息,通过Nacos同步复制保证集群内服务信息一致。静态数据采用CP算法保持一致性,动态数据采用AP算法保证可用性。Zookeeper用于存放注册服务和治理参数信息,采用3台以上(奇数)集群部署,通过ZK同步复制保证集群内服务信息一致。应用作为提供方同时完成Nacos和ZK的服务注册。应用作为消费方同时同步Nacos和ZK的静态数据(应用信息、服务信息、流控规则等)和动态数据(应用地址、服务地址)。

(2)无损上下线

为避免服务提供者中某个实例在下线时主动在注册中心中注销的服务实例状态无法实时被上游消费者感知到,从而导致调用已下线实例的问题。在接收到下线命令即将下线前,提供者对于在等待下线阶段内收到的请求,在其返回值中都增加特殊标记。让服务消费者接收到返回值并识别到相关标志后主动拉取一次注册中心服务实例,从而实时感知提供方实例最新状态,达到服务提供者的下线状态能够被服务消费者实时感知的目的。

无损上线在应用部署时执行,判断应用就绪后进行服务正式对外。通过探测手段检查应用实例是否准备就绪,提供小流量对刚上线应用实例进行预热,保护刚启动的应用实例。

(3)推空保护

应用正常停止会将该实例状态改为下线。然而当应用宕机或发生网络故障时,心跳全部丢失,注册中心会将该实例删除,当该应用所有实例都删除时,会开启推空保护机制。该机制保障了在极端情况下应用不会因找不到可用实例而产生交易风险。

(4)限流降级

限流:通过调节不同消费方流量阈值来控制通过提供方系统的最大流量值,保证系统安全可靠运行。支持按照应用、应用分组、服务、方法多个级别设置。

降级:降级通常用于对下游出现超时的非核心服务提供者进行低优先级调用,确保上游核心应用(服务消费者)不被影响。支持按照应用、服务、方法多个级别设置。

(5)服务治理

统一服务元数据:定义一套适用全行系统共用的元数据,包括:系统元数据、应用元数据、服务元数据、方法元数据、流控元数据等。

统一调用协议:内部采用google最新推出的gRPC协议和自主设计的寻址算法,封装成行内统一的SSF协议。

统一流量控制:采用自主设计的流控算法,包括:灰度、限流、熔断、降级,支持到应用级、应用分组级、服务级、方法级。

统一接口治理:参考ESB模式治理方式,引入接口治理和鉴权,保障接口的规范性、安全性,提高对接口的管理能力。


四、项目过程管理

为确保项目按计划上线,整体实施过程严格按照苏州银行项目管理办法相关要求开展,主要包括以下工作阶段:

(1)需求分析及评审

分析对比与EDAS、SOFA、TSF、Kubernetes、SpringCloud等多个方案的优劣,如应用打包、服务框架、发布和调度、弹性伸缩、进程隔离、环境管理、服务治理等方面。另外也对其他银行的架构现状和产品进行调研,开展相关同业交流,确定实施的内容和范围,形成会议纪要和需求初稿。在项目初期识别项目相关方,分析记录参与度、相互依赖性、影响力等,与相关方沟通确认需求并组织评审。

(2)计划制定与开发

分别制定项目里程碑、需求管理计划、开发计划、质量管理计划,根据需求和计划创建WBS,进入设计开发阶段。

(3)系统测试及验收

进行相应的SIT测试、UAT测试、高可用测试、容灾测试、性能测试、破坏性测试、稳定性测试验证平台功能。

(4)项目上线及推广

2023年6月“智能微服务平台(SSF)”正式上线,并进行试运行期间功能验证,根据验证清单检查相关功能,2023年8月顺利接入统一消息平台,2023年10月接入身份核查系统,2023年11月接入中间业务系统,2024年5月接入营销平台。


五、运营情况

目前线上对接了中间业务、身份核查、消息平台、营销平台四个系统,涉及的应用数量分别是:3个、1个、4个、2个,服务数量分别是:9个、8个、36个、10个,接口数量分别是: 43个、43个、87个、47个。身份核查、消息平台的近7日调用总次数分别为1054431笔和18895165笔,单日调用次数分别为218437笔和2305516笔。上线以来配置的三个监控规则产生的告警数量分别为:系统间5分钟超时监控6条、磁盘监控49条、应用健康检查告警56条。总体运行情况稳定。


六、项目成效

智能微服务平台的建设促进了苏州银行在分布式架构、云原生应用领域的科学研究,显著提升了苏州银行开发、应用部署、应用监控、应用运维能力。新的系统使异构应用也可以使用微服务调用,无需再依赖ESB,避免了单点问题,使苏州银行的云原生应用进一步扩展到信创云和vmware,并可以按照行内网络架构进行灵活部署。采用微服务架构的各个新系统也无需再依赖于自带的注册中心和配置中心,减少了重复建设成本。在项目推广过程中,有助于提升苏州银行对于云计算平台的自主掌控水平,提升企业科技创新能力。


七、经验总结

在项目建设前期,我行组织了多次方案选型调研、POC论证推演,论证了其实现难度、周期、价值,并选用瀑布型项目模式,进行了项目可行性分析、成本估算、范围估算。选派行内有相关领域经验的部门经理、项目经理、研发人员、测试经理参与到项目的架构设计、开发、测试中,在项目过程中,分别于项目多个阶段进行高层汇报决策,完成整个项目的实施和推广计划制定。并与行内的其他应用领域专家合作,弥补了项目短板,为项目争取到了更多的实践和验证机会,为平稳推广奠定了基础。


本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】

推荐阅读

更多

安徽农信:基于人工智能的滨湖数据中心基础设施能效优化

数据中心基础设施能耗巨大,数据中心节能能够带来显著的经济和社会效益。而在数据中心基础设施中,空调能耗又占到全部能耗的70%,本项目通过将人工智能应用到数据中心基础设施空调系统运行控制中,为安徽省联社乃至金融行业数据中心基础设施节能降耗探索一条智能化创新的道路。

2018第二届农村中小金融机构科技创新优秀案例评选 安徽农信 2024-06-13

九江银行:银行服务质量智能化辅助评估平台

银行服务辅助评估系统是以银行业务服务办理人员为核心,通过对服务区域进行统一的标准化视频采集,利用AI人工智能算法对采集的音视频按肢体、着装、语言以及人脸识别等模型分类进行运算处理,终以业务为维度输出服务规范记录的服务型管理平台。

2020首届城市商业银行数字金融与支付创新优秀案例评选 2024-06-13

河北银行:智能贷后项目

智能贷后通过挖掘外部数据,整合行内资源,改变了以往风险信息关注不到位、现场检查不及时的问题,能够充分识别和捕捉客户的风险特征,做到风险客户提前检视,逾期贷款及时控制,强化风险防控管理的同时提升了贷后管理效率,大大解放一线生产力。

2021第二届城市商业银行数字金融与支付创新优秀案例评选 河北银行 2024-06-13

河北银行:信用卡购车分期业务全流程自动化

河北银行信用卡购车分期业务经历多年探索,从汽车消费真实场景出发,强调“以客户体验”为中心,实现客户在4S店、二手车市场等购车场景下的“一站式”申请审批。后台打通购车分期前端申请、远程视频面签、信用卡自动审批、资金清算等系统,实现全流程的自动化。基于全流程获取的数据信息、外部引入大数据,开发优化系统模型,由线下转线上,数字化运营。持续完善业务流程和风控技术,实现了规模、质量、效益的良性发展。

2021第二届城市商业银行数字金融与支付创新优秀案例评选 河北银行 2024-06-13

日照银行:让银行服务“足不出户 触手可及”

日照银行远程银行是借助现代化科技手段,通过远程方式开展客户服务、客户经营的综合金融服务中心。客户可以通过手机微信小程序等渠道链接视频银行系统,足不出户就能与“视频柜员”远程“面对面”,进行个人业务和企业业务的办理。视频银行为客户提供有针对性的业务场景服务和全新体验,同时很好的做到业务分流,缓解柜面压力,增加客户的满意度。

2020首届城市商业银行数字金融与支付创新优秀案例评选 2024-06-13

浙江泰隆商业银行:RPA助力银行数字化转型

RPA (Robotic Process Automation, 机器人流程自动化),这是一种能够通过模拟人类来执行重复性任务的软件。通过软件机器人自动处理大量重复性、具备规则性的工作流程任务,从而将员工从疲于应付的情况下解放出来,让员工发挥主观能动性,执行具有更高价值的事务。RPA机器人与员工相比,能够更加的快速、精确,并全天候执行相应事务,提升工作效率,实现零错误率,降低运营成本。

2021第二届城市商业银行数字金融与支付创新优秀案例评选 浙江泰隆商业银行 2024-06-13

选型库

金融行业全面的数智化创新解决方案,涵盖历届“鑫智奖”参评方案及选型库会员机构提交的金融行业解决方案

  • 城商行
  • IT架构
  • 云原生
  • 基础设施

微信
咨询

微信咨询

扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构