本文来源于:鑫智奖·2025第六届金融机构数智化转型优秀案例评选,作者:中国邮政储蓄银行

中国邮政储蓄银行:新核心统一查询——实时数据分析查询的分布式解决方案

2025-06-11 关键词:数字化转型,数字运营,金融服务4171

一、项目背景及目标


在银行业不断能力开放和数字化转型的大背景下,邮政储蓄银行业务迅速发展,新产品、新业态层出不穷,核心系统性能、架构、功能扩展、自主可控和运行保障能力不足、开发测试周期长等已不能满足业务发展和管理的需要。在此背景下,邮政储蓄银行启动统一查询项目工程建设,聚焦于海量数据联机查询,进一步推进数字化转型,全面提升金融查询服务质效。


统一查询系统定位企业级联机实时查询系统,系统以“寻客所想,查客所需,为客提供全新查询体验”为建设理念,致力于为全渠道提供海量数据、大跨度、长周期和多维度的标准化数据查询服务。系统以前沿技术为驱动、创新业务为导向,基于计算与查询相分离的原则,采用分布式微服务架构,利用先进的大数据技术对混合事务分析进行了创新探索。基于国产硬件、国产操作系统和国产分布式数据库打造出一套关键核心技术自主可控的企业级联机实时查询系统,实现万亿数据规模的高时效在线分析处理以及高并发在线事务处理,支持上万并发和10年及以上、亿级数据的毫秒级高时效联机查询。


二、创新点


统一查询系统应用层采用分布式架构,通过构建灵活扩展的数据模型,以及对复杂数据的预处理,实现历史数据查询和实时收支分析,解决了传统数据库海量数据存储和海量数据处理的性能瓶颈问题,同时具备良好的可扩展性。相较金融同业的企业级查询系统,统一查询具备查询明细内容更详细、查询时间跨度更长和查询步骤更简便的个性化需求。具体创新点如下: (1)基于计算与查询相分离的原则,采用国产化分布式单元化架构部署,海量数据实时处理。


系统基于计算与查询相分离的设计理念,采用分布式单元化架构,根据业务特性拆解,实现服务拆分,利用云化能力实现快速扩缩容,具备良好的弹性伸缩能力,满足高并发、高可用、高性能和高可靠性要求;屏蔽多源数据接口差异,通过自研聚合分页算法动态地对多源接口数据进行全局性地聚合、排序、去重以及分页,对外提供统一化和标准化的联机查询接口服务,满足银行核心业务日均上亿级别的明细流水、登记簿和历史账户等重点交易查询需求。


(2)支持构建灵活可扩展的离线数据模型和实时数据处理平台,支持不同场景的离线实时数据统一处理,为客户提供高效的收支分析新体验。


本方案采用实时离线结合的数据处理架构,支撑对日均数十亿条以上的数据进行聚合、加工和处理,同时离线与实时数据处理互相补充,保证数据一致性、时效性和完整性;构建灵活可扩展的数据模型,实现在线数据和历史数据统一处理,确保数据完整性、一致性和准确性;引入流式计算引擎Flink,集成CDC变化数据捕获技术,实现高吞吐、低延时的实时数据处理,支持每日数亿级数据实时计算和分析,为客户提供海量收支明细数据实时查询与分析服务。支持每日数亿笔,峰值TPS达20万的数据处理能力,全量数据处理控制在4小时以内,处理时效在同业类似场景中处于较为领先地位。


(3)机器学习助力智能数据分析,实现活期交易明细智能分类,大幅提升分类准确率至93%。


创新应用自然语言模型与知识蒸馏技术,构建商户场景智能分类算法,实验室环境测试准确率较现有规则分类准确率大幅提升20个百分点,分类准确率高达93%。该技术可解析商户名称语义特征,实现48类场景智能归类。在优化移动端客户收支功能使用体验的同时,为后续快捷支付、理财、信用卡、信贷精准营销、反欺诈风险画像等业务应用奠定技术基础。


三、项目技术方案


本系统技术架构分为数据服务层、数据存储层、数据计算层、系统资源层。其中数据服务层包括分布式微服务平台、微服务容器以及运维监控平台,作为构建与管理应用服务的基础设施;数据存储层包括分布式数据库GaussDB、索引数据库ES和应用支撑数据库OpenGauss;数据计算层包含实时计算、准实时计算、离线计算及相关组件和技术,使用大数据处理框架Hadoop及其生态;系统资源层为本系统平台所有资源的总汇,主要包括数据库资源、操作系统、分布式文件系统、分布式消息队列。各层实现情况包括:


1)数据服务层


本系统微服务平台包括配置中心、注册中心、分布式文件系统、消息中间件、服务治理组件、网关组件、序号组件等多个自研基础功能组件。其中,分布式微服务配置中心实现统一管理不同环境、不同集群的配置,支持修改配置后实时发布、灰度发布、配置回滚等,并支持配置发布审核、操作审计等权限控制功能,降低配置管理成本。服务注册中心具备服务发现、健康检查功能。应用通过网关对外提供Rest风格HTTP API,使用Dubbo协议保证微服务间的负载均衡。分布式文件系统用于支持系统间文件传输与数据查询。


微服务容器中包含数据库访问、Log日志、Rest接口、SLA(Service-Level Agreement)服务等级协议作为质量保证,Restful接口规范采用Swagger进行管理。数据事务上采用最终一致性方案,使用补偿模式进行数据一致性的保证,通过消息中间件接受外系统消息进行数据同步通知。在软件技术架构上,通过对象关系映射方式实现,采用Mybatis技术框架进行数据库的操作实现。


运维监控平台包括链路追踪组件(Skywalking)、服务监控系统(Prometheus)和日志分析相关组件(ELK),提供了运行监控与运维管控功能。运行监控可实现应用监控、中间件监控、数据库监控、日志平台、链路追踪功能,结合日志平台对业务层中所有的日志进行保存和关联分析,负责对微服务应用进行运维监控与保障。运维管控平台集成了DEVOPS流水线构建、分级发布、批量任务管控、服务治理、容灾切换以及数据库切换功能。


2)数据存储层


数据存储主要由分布式数据库、索引数据库ElasticSearch(ES)构建,为应用数据库提供支撑。通过充分的测试和场景适配,本系统采用基于华为主导的GaussDB(for openGauss)生态推出的企业级分布式关系型数据库,作为联机数据库平台的业务数据库。结合ES做关键查询数据的全文索引,支持从大量数据中进行少量返回数据的快速灵活检索,应用支撑数据库采用PostgreSql,用于保存业务应用数据。此外,采用Elasticsearch实现分布式多用户能力的全文搜索引擎,其作为实时数据的存储介质,负责实时承接上游推送过来的数据,并且可根据关键词查询收支明细数据,对外提供高效的数据查询服务,本系统数据库时目前金融行业分布式数据库里单集群分片数最多,承载数据量最大、性能要求最高的实践案例。


3)数据计算层


数据计算层使用当前主流大数据处理框架Hadoop及其生态,采用具有高可靠性的Lambda处理架构,分别构建了实时计算模块、准实时计算模块、离线计算模块。


实时计算组件逻辑架构如图1所示。实时组件使用Flink框架,运行在大数据平台Hadoop上,并使用支持高消息吞吐的Kafka作为消息中间件进行活期交易明细的收支分析计算及相关数据的实时导入,提供十万级TPS的处理能力。其中Flink任务分为提供基础功能的公共层,接入源端数据的接入层,计算收支分析的计算层,写入到分布式数据库及ES的分发层,以及负责错误处理的补偿处理任务。


实时组件三中心各部署一套Kafka、Flink集群,北京双中心双活双写,合肥为灾备中心。DTS组件通过读取源系统OpenGuass的WAL日志,生成每笔活期交易明细的CDC(changed data capture)消息,发送到系统的Kafka中,本方案采用Flink实时平台进行实时数据处理,支持低延迟,高可靠性,高吞吐量的数据处理,使用分布式数据库、ES作为数据存储,提供高效的查询支持和海量的数据存储。


imageimage1_1749636598.813059.png

图1. 实时计算组件逻辑架构图


Flink层服务划分为贴源层、计算层、输出层和数据补偿服务,贴源层负责原始数据接入并对上游源数据进行数据清洗和过滤,计算层负责进行维表数据关联以及收支分析计算,输出层负责将计算完成的数据持久化到分布式数据库和索引数据库。实时处理平台如图2所示。


imageimage2_1749636598.8697605.png

图2. 实时数据处理平台结构图


实时收支分析计算模块支持对活期交易明细每一笔交易增加收支类别,支持按照收支类别、时间、金额、笔数等维度进行收支汇总分析,通过活期交易明细中的若干重点字段进行映射摘要码,交易对手,交易金额类型等计算出该笔交易的收支类型和交易类型。收支分析处理采用责任链模式,各交易场景间存在互斥和组合关系,针对不同交易场景(逻辑删除、ATM发起交易、 外币交易、冲正或取消交易、转账交易、正常交易)制定出对应的处理策略,图3为收支规则计算场景分类描述。


imageimage3_1749636598.9169958.png

图3. 收支分析场景分类处理


项目组提出实时与离线结合的部署方案,通过高斯数据库同步模型预测结果,支持历史数据回溯与实时分类;设计实时智能预测节点,结合离线批量更新商户映射规则表,确保计算一致性,数据补偿服务包含错误数据捕捉、补偿定时任务和ES补偿任务,可保证在Flink集群中任何出错的消息,都会进入数据库的数据补偿表或死信表,数据补偿服务会定时重新消费出错的消息,保证数据不会丢失。


同时对于三方支付数据收支分析引入机器学习BERT模型,从语义上对输入的商户名称进行解析,支持对每一笔活期交易明细实现智能化分类,整体模型部署如图4所示。


imageimage4_1749636598.949511.png

图4. 机器学习智能分类模型部署


离线组件主要为Hadoop相关组件,主要包括 HDFS、Spark、Hive等,离线组件实现方案如图5所示。


imageimage5_1749636599.0739207.png


图5. 离线数据加工逻辑图


离线计算组件主要针对整个批量数据采集和输出过程而展开,按照不同的功能模块,通过相关的技术手段或业务手段,控制并保证数据信息的准确性、完整性、时效性、安全性等关键因素。离线组件对接企业级数据总线,用于支持拉取主仓处理完成的离线数据,通过文件服务器和分布式数据库API实现离线数据的入库;通过统一的调度服务选项,使后续与行内各数据系统之间的衔接性更强;为支撑冷数据的临时查询,通过交互式数据分析组件Zeppelin实现数据查询功能平台化,提升使用体验,提高工作效率。数据计算层主要依赖于Hadoop基础资源中的YARN资源管理实现计算资源的分布式可容错调度管理,通过HDFS分布式文件存储系统提供离线数据的可扩展稳定存储,集群安全方面通过运维管理平台自研组件进行数据权限和访问权限的管理。


四、项目过程管理


A.项目实施重大事件表


(1)2020年7月,工程立项批复下达。


(2)2022年4月,一、二期工程完成投产。


(3)2023年1月,三期工程完成投产。


(4)2024年12月,四期工程完成投产。


B.项目的组织与实施


项目由金融科技创新部牵头组织,软件研发中心负责实施,采用先瀑布,后敏捷的实施模式,主要经历以下阶段:


(1)预研及批复阶段


2020年5月至2020年7月,主要完成了工程前期的预研及立项准备工作,形成了业务需求及技术方案文档,收到了首期工程(统一查询系统工程)的立项批复。


(2) 一、二期投产


2022年4月,完成了系统首次投产工作,主要实现了个人存汇款历史数据查询功能以及实时收支分析功能,共计145支查询交易,238个查询接口,支持查询聚合、排序、去重、打印等功能。


(3) 三期投产


2024年1月,完成了公司核心的投产工作,主要实现了线下对客非终态数据查询服务、线下对客终态数据查询服务、线下对内数据查询服务,线上查询服务以及准实时同步服务,共计新增397个交易,429个接口。


(4) 四期投产


2024年12月,完成了信用卡核心的投产工作,涉及账务,授权,发卡,打印4个模块,主要实现了账单补印查询功能、内部户台账查询功能以及批量授权流水信息查询功能等,共计新增44个交易,53个接口。


五、运营情况


项目自2020年起,在解决个人核心海量数据查询和存储问题上取得显著成效,随后逐步推广至对公、信用卡核心领域。其致力于攻克行内重要信息系统中海量数据的查询与存储难题,为各业务系统稳定运行提供关键支撑。


在服务范围方面,统一查询成绩斐然。目前已服务全行数万网点,为全行58个渠道,近七亿级客户提供历史数据的查询服务,提供查询交易共计1100余支,可满足客户十年以上多维度、长周期、大跨度的明细流水、登记簿、历史账户等查询需求。如动账类交易,支持线上、线下渠道实时查询个人与公司客户永久时间范围的活期、定期、保证金明细,还能进行回单打印,并且具备多维度和模糊查询功能,极大方便了客户与业务人员;登记簿类交易,能提供账户基本信息、开销户登记簿等多种数据查询,支持账户、机构维度的查询导出,为柜员、管理机构和司法机关的日常工作提供便利;账单类交易支持对账单明细、账单补打等功能,助力账户对账核对。


统一查询正稳步推进项目推广进程,已从个人拓展至对公、信用卡业务,后续还计划接入中间业务平台、数币核心、信贷零售等系统。这将进一步扩大统一查询系统服务的覆盖范围,提升全行各业务系统的数据查询与存储能力,为更多业务场景提供高效、精准的数据支持,全面增强银行在数字化时代的综合竞争力,为客户提供更优质、便捷的金融服务,促进银行业务的持续创新与发展。


六、项目成效


1、全面提升用户体验


1)查询范围更广、更快。系统服务于手机银行、统一柜面、企业网银、ATM、微信银行等58个渠道系统,查询时间范围扩大至10年及以上,查询跨度大幅延长,为全行客户提供高时效性的联机交易查询分析服务,平均响应耗时66ms,系统成功率99.99%,在业务优化提升方面展现了深刻而广泛的用户效益。


2)交易明细查询用户体验评分位列榜首。《2023中国数字金融调查报告》发布,邮储银行个人手机银行用户体验评分位列榜首,统一查询为邮储银行手机银行提供的余额查询、交易明细查询、理财查询首次操作成功率均获满分。交易明细的问题严重性、操作便捷度、满意度得分分别是95.3分、96.5分、97.2分,交易明细查询、理财查询推荐度均达100%,表现亮眼。此外,根据中国银行业协会提供的同业电子函证业务处理质效数据情况来看,我行各项指标均名列六大行前三,其中成功回函率、银行平均处理时间两项核心指标均排名第一,受到监管部门的认可和好评。


2、大幅提升柜员操作效率,实现降本增效


系统经优化查询链路、整合交易等举措,查询效率显著跃升。机构维度单次可支持5万条数据查询,极大简化柜员流程。对于复杂业务查询,在优化前,需进行多交易多次查询,查询繁琐且效率低下,客户业务办理时间较长,优化后,可实现业务数据一键查询,如异常账户查询,整合 8 支交易,客户等待时间锐减 90%。


3、科技赋能业务产品,如助力客户资金留存率提升


统一查询汇集个人、公司客户大量业务数据,利用大数据分析、人工智能技术,能挖掘出隐藏的客户行为模式、市场趋势等价值信息,实现技术引领业务。例如,统一查询联合四川省分行,对川行社保代发客户转账交易行为进行数据建模分析,创新性地实现了代发单位下每一个代发客户的资金流失具体情况和其投资、消费偏好、客户定位,并于2024年8月完成川行代发系统客户管理系统的投产工作,投产后9月客户资金30天留存率同比提升3.06%。


4、查、存分离,降低核心系统负载和压力


统一查询日交易量可达6000万笔,凭借强大的数据承载与处理能力,把诸多高频且复杂的查询功能从核心系统中巧妙剥离至统一查询,核心更加专注于转账、账户信息维护等新增、维护类业务功能,大幅削减了核心系统的每秒事务处理量(TPS)压力,使其得以 “轻装上阵”,为银行核心系统稳定、高效运行筑牢坚固防线。


5、赋能司法,助力国家金融风控


统一查询系统整合行内历代核心系统数据,为全国线上线下渠道、各类监管机构及各级公安司法机关提供7x24小时全天候、多维度的数据查询、整合及分析服务,涵盖交易流水、账户信息、客户信息等各类关键业务场景,构建统一高效的司法查询服务平台,有力支撑司法办案及监管机关数据审核。目前,生产环境下日均稳接 20 万笔司法查询,有效支持司法监管机关的风险预警和风险调查工作,助力国家金融风险控制。


行内外成果展示


统一查询累计获得4项专利,2项软著;获得3项行内,4项行外荣誉等,详细情况参下表。

日  期项  目  名  称类 别 (包括证书名称、编号)等)授予或批准部门
2023.5.12查询方法、查询装置、处理器和查询系统专利,CN116108066A国家知识产权局
2023.6.6银行系统的查询方法、银行系统的查询装置和电子设备专利,CN116226083A国家知识产权局
2023.6.23银行核心系统的数据同步方法、装置和电子设备专利,CN116303760A国家知识产权局
2023.6.6文件数据聚合方法、文件数据聚合装置和查询系统专利,CN116226045A国家知识产权局
2023.2.14智能化实时收支分析系统软著,2023SR0241866中华人民共和国国家版权局
2023.2.14实时数据处理补偿系统软著,2023SR0238587中华人民共和国国家版权局
2024.10基于海量交易数据的数据库弹性扩容和安全、高效数据迁移技术方案2024年中国邮政集团有限公司科学技术奖-三等奖中国邮政集团有限公司
2024.6NLP智能交易场景分类在快捷业务精细化运营中的探索应用2024全国邮政人工智能创新实践劳动竞赛建模赛道--三等奖中国邮政集团有限公司
2024.72024研发中心软研IT技能竞赛软件研发中心-反诈专项赛道--三等奖中国邮政储蓄银行软件研发中心
2023.2GaussDB:智能云原生分布式数据库科技进步一等奖,KJ2022-JI-30-D05中国电子学会
2024.12中国邮政储蓄银行基于分布式数据库GaussDB打造的统一查询系统扩容工程2024星河案例中国信息通信研究院云计算与大数据研究所
2024.10基于Lambda架构的大型商业银行核心数据实时查询的分布式解决方案四川省计算机科学技术奖-三等奖四川省计算机学会


七、经验总结


在邮储银行数字化转型关键时期,本系统以“寻客所想,查客所需,为客提供全新查询体验”为建设理念,成为邮储银行客户旅程优化的关键一环。围绕客户体验,通过数技融合和数实融合,全面驱动邮储银行数字化转型。


加速数据流通融合,激发数据要素价值。持续推进数据治理,提升数据规范性和合规性,推动邮储银行数字经济规范化;深化数字技术融合创新,使数字技术和数据价值可持续地惠及于民,为大数据时代银行业加速推进金融生态数字化与智能化作出新贡献。


全方位、全渠道打造用户极致体验。从线上到线下,从柜员到客户,从对客查询到银行内部查询,本系统为所有用户提供了一条联机查询分析服务 “高速主干道”,为邮储银行全面提升客户服务体验注入了新的动能,大幅提升了邮储银行的服务能力和服务品质,为金融业优化用户体验方面提供了成功的经验。


本系统属于银行业企业级联机查询分析系统。对标行业,在实现海量数据高并发在线事务处理以及高时效在线分析处理,海量数据联机高效查询方面属于行业前列。覆盖4万个网点,为全行客户提供了10年以上联机交易查询分析服务,通过全方位优化柜员和客户线下操作体验,提升了网点业务处理效率,大大缩短了客户业务办理时间,使高质量金融服务利之于民,切实增强了基层金融服务能力,极大地提升了人民群众对于金融服务的获得感和满意度,为金融业客户服务体验的提升提供了领先实践应用。


本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】

推荐阅读

更多

胡震:构建数字金融服务生态,探索数字化转型新路径

为贯彻落实《国务院关于全面推进乡村振兴加快农业农村现代化的意见》总体部署,全面推进乡村振兴,进一步加大支农惠农力度,有效支持当地畜牧业发展,切实解决畜牧经营主体融资难、融资贵及担保难问题。

金融电子化 胡震 2025-06-11

中信建投证券:基于AI大模型的多智能体技术在投顾领域的应用案例

该案例以大语言模型为核心,融合 RAG、Agent技术,构建“主 Agent+子Agent”架构,覆盖投顾全场景,包含个股分析助手、策略分析助手、产品分析助手。亮点包括:技术上实现知识可溯源与复杂任务规划;业务上赋能B端投顾效率、C端个性化服务;实施上分阶段落地,配套三级评测与合规体系;商业模式探索C端增值服务与B端技术输出。重点打造可信可控的智能投顾平台,推动证券投顾AI智能化转型,该平台服务于总部投资顾问,为行业首批实现案例。

鑫智奖·2025第六届金融机构数智化转型优秀案例评选 中信建投证券 2025-06-11

贵阳银行:写好“数字金融”大文章,赋能高质量发展新活力——“超级APP”体系打造

在全国大力发展数字经济,中央对数字金融高质量发展提出新要求,银行业全力推动数字化转型的背景下,贵阳银行聚焦零售线上渠道服务能力的全面升级,围绕“方便、快捷、吸引、依赖、获得”五大核心要求,整合零售条线流量,构建统一获客、统一营销工具,着手打造“线上场景+客户权益+金融服务”的“超级APP”体系,为客户提供触手可及的智能化、一站式综合金融服务。 “超级APP”作为贵州省内首批实现鸿蒙原生应用上架的城市商业银行应用,用户无论在安卓、iOS还是鸿蒙版手机银行上,都能享受到规则一致、体验一致的金融服务。

2024年度城市金融服务优秀案例征集活动 贵阳银行 2025-06-11

北银金科:金融操作系统智能化软件测试体系建设

智能化软件测试基于金融操作系统"五个统一"原则的系统设计,深度整合测试资源,构建全链路测试流程与资产复用体系,在保障系统稳定性的同时显著降低测试成本,形成可插拔的智能测试组件生态。

鑫智奖·2025第七届金融数据智能优秀解决方案评选 北银金科 2025-06-11

南京银行:AI应用探索与创新实践

近年来,伴随AI技术的快速发展,智能化为推动银行业务变革与数字化转型提供了全新动力,尤其在优化业务流程、提高运营效率、提升客户体验、强化风险防控等方面发挥着重要作用。例如,基于智能化的算法设计、AI技术广泛应用于电话银行、网上银行、手机银行等渠道,甚至在某些特定场景中,智能客服机器人已基本可实现对答如流。顺应这一趋势,南京银行在全方位强化AI布局的基础上,深入开展了数字员工营业厅建设实践,并终取得了良好成效。

中国金融电脑+ 张银川 王桂庆 2025-06-11

国元证券:企业综合金融服务协同系统建设项目

国元证券通过建设企业综合金融服务协同系统,构建“场景+数据”营销服务体系,实现数据驱动->场景应用->业务一线的数字化支撑。实现对销售人员从拓客、展业到业务协同一站式支持,助力管理层进行有效的经营决策。 本项目在信创化、数字化、智能化等几大维度创新实践。在业务上,实现智能化的企业全生命周期管理与多端协作模式实现业务场景化适配。在技术上,融合低代码技术快速开发与微服务技术深度治理,并顺应国产化的创新实践。

鑫智奖·2025第六届金融机构数智化转型优秀案例评选 国元证券 2025-06-11

案例库

金融行业全面的数字金融创新案例,涵盖历届“鑫智奖·金融机构数智化转型优秀案例评选”、“农村金融机构科技创新优秀案例评选”、“城市金融服务同业案例征集活动”等科技创新参评案例

  • 数字化转型
  • 数字运营
  • 金融服务

微信
咨询

微信咨询

扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构