本文来源于:鑫智奖·2024第五届金融机构数智化转型优秀案例评选,作者:大童保险服务

大童保险服务:敏捷开发运维管理平台

2024-05-29 关键词:运维管理,开发运维,智能运维1399

一、项目背景及目标


1.项目背景


随着企业数字化转型的加速,应用程序的开发、部署和管理变得越来越复杂。传统的手动部署方式效率低下,容易出错,无法满足快速迭代和高频发布的需求。同时,开发与运维(DevOps)之间的协作不畅也成为制约应用程序高效上线的重要因素。在这种背景下,企业迫切需要一种能够自动化、标准化和高效管理应用程序全生命周期的解决方案。


2.项目目标


①构建一站式管理平台:通过自主研发系统,整合开源软件和工具,实现从应用程序环境创建到版本发布的全流程管理。


②实现分钟级应用上线:结合企业微信,打造便捷的通知和协作渠道,确保应用程序能在分钟级别内实现快速上线。


③提升开发与运维效率:通过Kubernetes、Docker、Git、Maven、Ansible、Jenkins等开源工具的有效结合,实现应用程序的自动化部署和管理,优化开发与运维的协作流程。


④保证系统稳定性和安全性:在实现高效管理的同时,确保系统在可靠性、安全性上的高标准,减少人为操作失误,提高系统的整体健壮性。


⑤支持快速迭代和发布:通过自动化和标准化的流程管理,支持应用程序的快速迭代和高频发布,满足业务快速发展的需求。


⑥实现应用生命周期闭环管理:从开发、测试、部署到运维,全方位覆盖应用程序的生命周期,确保每个环节都能高效运作,实现闭环管理。


通过这一项目,我们旨在为企业提供一个高效、稳定、安全的一站式应用程序管理方案,支持其数字化转型和业务快速发展。


二、创新点


1.一站式管理平台


①高度集成:整合Kubernetes、Docker、Git、Maven、Ansible、Jenkins等多种开源工具,形成统一的平台,实现从开发到运维的全流程管理。


②无缝协作:通过企业微信,提供便捷的通知和协作渠道,使团队成员能够实时沟通和协作,进一步提升了平台的集成度和协同效率。


2.分钟级应用上线


即时发布:通过企业微信终端触发自动化部署流水线,实现应用程序的分钟级快速上线,极大缩短了发布周期,提升了业务响应速度。


实时反馈:结合企业微信,团队成员能够实时接收系统的各类通知和反馈,及时了解应用的上线进展和状态,快速响应问题。


3.自动化全生命周期管理


智能部署:利用Kubernetes和Docker技术,实现应用环境的自动化创建、部署和扩展,减少了人为干预,提高了部署效率和准确性。


持续集成与交付:通过Git、Jenkins和Maven,实现代码的持续集成和依赖管理,再结合Ansible的自动化配置与部署,构建了一条高效的CI/CD流水线。


4.高效协作与运维


DevOps一体化:平台将开发与运维紧密结合,通过自动化工具和流程,打破了开发与运维的壁垒,提升了整体协作效率。


监控与告警:集成实时监控和告警机制,确保应用程序在部署后的稳定运行,并能及时发现和处理潜在问题。


5.安全与稳定性保障


容器化隔离:利用Docker的容器化技术,将应用程序与运行环境隔离,提升了系统的安全性和稳定性。


自动化回滚:在部署过程中,如果检测到问题,系统可以自动回滚到稳定版本,减少了因发布故障导致的业务中断。


6.开源工具的创新组合


定制化集成:将Kubernetes、Docker、Git、Maven、Ansible、Jenkins等开源工具进行深度定制和优化,形成了独特的集成方案,提高了系统的适用性和灵活性。


创新应用:在传统工具的基础上,通过创新的组合和应用,开发出适应企业需求的独特功能和流程,提高了系统的整体创新性。


这些创新点不仅提升了系统的技术先进性和实用性,还显著改善了开发和运维的效率,为企业的数字化转型提供了有力支持。


三、项目技术方案


本项目旨在构建从应用程序环境创建到版本发布的全流程管理方案,结合企业微信,实现分钟级上线应用程序的一站式管理平台。


技术方案介绍:


1.架构图


96.png


2.虚拟化与容器编排管理


Docker:业务系统服务基础运行环境采用Docker容器虚拟化技术。通过自定义Dockerfile方式生成应用系统运行环境镜像文件,并上传至Harbor私服仓库管理。


Kubernetes:容器编排采用Kubernetes集群管理,确保应用程序的高可用性和可扩展性。


Harbor:使用Harbor作为私有镜像仓库管理Docker镜像,确保镜像的安全性和管理的便捷性。


3.持续集成


Git:代码版本控制工具,用于管理项目代码和协作开发。


Jenkins:持续集成工具,通过与Git、Maven、Node、Nexus等工具的集成,完成自动化编译、构建过程。


Maven:用于依赖管理和构建Java项目。


Nexus:作为私有的依赖仓库和Docker镜像仓库。


4.持续部署


Ansible:远程管理工具,用于自动化配置管理和应用部署。


Kubernetes API:结合Ansible,通过Kubernetes API实现应用的自动化部署到Kubernetes集群环境。


5. 统一运维管理平台


Django:使用Django框架开发统一运维管理平台,结合MySQL数据库,实现业务系统任务的统一管理。


功能:


业务系统任务流程管理:通过平台管理所有业务系统的任务,以及版本发布流程管理。


人员管理:通过平台实现开发人员的管理和权限控制。


权限管理:细粒度的权限控制,确保系统的安全性。


企业微信集成:平台与企业微信打通,以企业微信为入口,便捷管理业务系统的版本发布功能,以及发布状态查看,及时跟踪与同步发布进度,方便开发团队协同处理。


6.日志管理


ELK:业务系统日志通过自动化流程,在新建任务后自动收集到ELK日志管理平台。开发人员可以统一查看和检索日志信息,便于调试和问题排查。


7.监控与告警


Prometheus:用于监控业务系统的运行状态及基础环境状态。


Grafana:用于数据可视化,展示系统和应用的监控指标。


Alertmanager:结合Prometheus,配置告警规则,发送异常状态的告警推送。


企业微信集成:告警信息通过企业微信接收,及时发现异常问题,快速响应并处理。


通过上述技术方案,实现从应用程序环境创建到版本发布的全流程管理,结合企业微信,实现分钟级上线应用程序的一站式管理平台。该方案不仅确保了应用系统的高效开发和稳定运行,还通过统一的运维管理平台和企业微信集成,提高了团队协作效率和系统管理的便捷性。


四、项目过程管理


整体项目是分为多阶段分步进行的构建实施,主要分为五个阶段:


1.需求分析与规划阶段


项目启动是与公司数字化转型节奏保持的统一,2023年3月启动完善与优化开发运维一体化建设,规范发版流程和工具化流程穿透,并与企业微信内部办公协同打通。


2.系统设计优化阶段


公司业务系统采用了微服务架构设计,模块化服务构建,为了适应业务系统架构,运维平台底层采用了Docker容器虚拟化技术与Kubernetes集群管理编排容器。持续集成与交付方面选择了主流的Jenkins、Maven、Git等工具来搭建流水线任务。


3.优化各模块环境构建阶段


优化搭建各个基础模块的运行环境,包括基础运行环境,持续集成交付工具等环境的构建,保障业务系统具备初步的开发、测试功能,以及代码上线功能。


4.优化持续集成与交付流水线构建阶段


伴随业务系统的逐步上线运行,环境越来越多,越来越复杂,功能需求也越来越多,为了满足业务系统的快速迭代发展,我们逐步构建起了自动化流水线交付的系统功能,使业务系统的环境构建、版本发布达到了分钟级,大大提高了业务系统功能开发的迭代效率。


5.统一管理平台研发阶段


伴随业务系统的发展,业务系统模块快速增长,管理的流水线任务越来越多,为了更方便的管理业务系统任务,我们研发了统一管理平台,将业务系统任务统一管理、权限管控、记录管理,以及结合企业微信作为触发流水线入口,并实时跟踪任务状态,提高了开发、运维协调工作的效率。


五、运营情况


自项目上线以来,平台的运营情况表现良好,各项指标显示出系统在稳定性、效率性和用户满意度方面都有显著提升。并且在权限控制上做到了按需分配,开发测试人员可以自主管理开发环境的代码迭代,减少了运维与开发的协调时间,提高了开发的工作效率,节省了运维成本,提高了用户满意度。


六、项目成效


从整个平台搭建完善并投入使用后,大大提高了系统的迭代效率,并保证了系统的安全稳定可靠运行,避免了人为操作失误导致的故障。对比传统运维场景,环境交付时间时效从天提升到了分钟,版本发布时效从小时提升到了分钟。2023年度累计版本发布 75813次,生产发版13470次,测试环境发版62343次,为1568个生产测试环境服务提供支持保障。 


七、经验总结


通过本项目的实施,我们不仅成功构建了一站式管理平台,实现了分钟级上线应用程序的目标,还积累了宝贵的经验。在需求分析、技术选型、CI/CD实施、监控与日志管理、安全管理、用户反馈与持续优化以及团队协作等方面,我们总结出了一系列行之有效的方法和经验。这些经验将为未来项目的实施提供有力的指导,推动企业的持续发展和技术创新。


本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】

推荐阅读

更多

广东农信:自动化测试平台建设项目

随着广东农信的业务快速增长,软件产品的广泛使用,使客户对软件产品质量的要求不断提高,作为软件质量的重要保证,软件测试越来越显示出它的巨大优势。

2019第三届农村中小金融机构科技创新优秀案例评选 广东农信 2024-05-29

工商银行数据中心总经理刘方洲:数据中心数字化运维转型实践

近年来,工商银行加快推动全行经营模式和治理模式的数字化变革,以自主研发的“云+分布式”平台为核心,构建满足全行数字化转型需求的新型金融科技基础设施,扎实推进全球银行业大规模主机业务下移,打造了银行业科技高水平自立自强的样板工程。目前,工商银行金融云平台已实现17万节点和45万容器的超大规模自动化、集约化管理,成为工商银行数字化转型的重要驱动力。 工商银行数据中心作为支撑全行业务经营和数字化转型的关键信息基础设施,始终牢固树立底线思维,不断加大科技创新力度,持续探索生产运维管理新范式,为全行高质量发展和数字化转型奠定了新的发展优势。

中国金融电脑 刘方洲 2024-05-29

山东农信:集中运维监控平台项目

为保证日常运行维护工作的顺利开展,确保业务系统安全、稳定运行,山东省联社通过建设集中运维监控平台项目,完成了异构监控系统数据的集中,通过大数据技术对运维监控数据进行挖掘和分析,实现了对运维突发事件的监测、识别、评估与态势感知,有效提高了突发事件的处置能力,初步实现了由IT运维到主动运营服务的转变。

2018第二届农村中小金融机构科技创新优秀案例评选 山东农信 2024-05-29

福建农信:云平台“农信云”项目

随着福建省农村信用社联合社(下称 “福建农信”)规模不断扩大、业务不断增加,应用系统、设备、数据中心空间能耗都不断增加,IT运维各方面都面临种种挑战。

2017首届农村中小金融机构科技创新优秀案例评选 福建农信 2024-05-29

贵州农信:IT可视化运维管理体系建设方案

为切实满足业务连续性及监管部门要求,确保IT系统安全、高效、稳定运行,我社在观山湖数据中心建设过程中同步启动了IT可视化运维管理体系建设。

2019第三届农村中小金融机构科技创新优秀案例评选 贵州农信 2024-05-29

浙江农信:运维一体化管理平台

一体化运维平台的总体构架包括资产管理、自动化运维模块、任务管理、系统管理、单点登录等核心模块

2017首届农村中小金融机构科技创新优秀案例评选 浙江农信 2024-05-29

案例库

金融行业全面的数字金融创新案例,涵盖历届“鑫智奖·金融机构数智化转型优秀案例评选”、“农村金融机构科技创新优秀案例评选”、“城市金融服务同业案例征集活动”等科技创新参评案例

  • 开发运维
  • 运维管理
  • 智能运维

微信
咨询

微信咨询

扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构