吉林农信：面向多模态自演化高弹性的感知智能中台建设与实践

本文来源于：2022年第六届农村中小金融机构科技创新优秀案例评选，作者：吉林农信

2022-10-02 关键词：农信/农商行,中台,数据平台与数智应用 2855

一、项目背景及内容

吉林省联社根据数字化风控、营销、运营等业务发展需要，以人民银行金融科技发展规划为重要输入，以数字化、智能化、中台化为建设目标，开始建设感知智能中台项目。截至2022年，先后建设统一生物识别平台、机器学习平台、OCR训练平台等三个平台，实现了全行级智能AI能力的输出，有力助推吉林农信的数字化转型。

感知智能中台作为吉林省联社企业级智慧大脑，一是充分考虑吉林农信的省情社情，按照中台化进行总体架构设计，支持AI能力的快速组合和共享，满足省县两级机构多法人多层次多场景的实际需求，注重平台建设和后期运营，推进平台建设和金融实验室组建，探索农村金融机构的金融科技创新之路；二是充分吸收金融科技的前瞻性思维，该平台集成PyTorch、Tensorflow、Caffee等多种机器学习、深度学习前沿技术框架，集成丰富的算法与模型组件，采用多机多卡的分布式容器化部署，具备模型自学习演化能力；三是围绕服务三农、服务小微企业的企业宗旨，注重平台的应用效果，平台上线以来，应用在省联社集中作业中心、一线网点、线上系统等多个实体和虚拟机构，覆盖农户信息采集、线上业务办理、集中作业授权、智能客户服务等多个业务场景，助力吉林农信普惠金融的顺利实施。

二、项目技术方案

2.1系统应用架构

智能中台由统一生物识别平台、机器学习平台、OCR训练平台三部分组成，其整体应用架构如图所示：

图1 智能中台应用架构

各平台功能组件具体如下：

1.基础硬件资源层：实现对平台所需物理资源环境的搭建，并完成对容器、分布式存储、资源调度等基础设施的部署；

2.算法框架层:平台集成了Tensorflow、Angel、Caffee、scikit-learn、PyTorch等多种机器学习、深度学习框架，是平台的核心算法能力支撑；

3.技术平台层:实现“中台”的核心平台能力，包括模型仓库、镜像仓库、开发态（训练、调试、优化、部署）、运行态（模型服务、模型配置、资源调度、资源监控）、日志系统等模块；

4.交互层:为算法工程师提供可视化建模交互能力，建模方式分为Notebook纯代码模型构建、拖拉拽式模型构建、AutoML自动化模型构建，满足不同层次算法工程师的模型训练需求；

5.模型服务层:对外提供生物特征识别、OCR识别、风控决策等智能服务的开放API，供其他业务系统调用。

2.2系统技术架构

智能中台技术架构如下图所示：

图2 智能中台技术架构图

技术组件包括业务组件、存储组件、管理组件、计算组件，其主要功能和部署规划指引说明如下：

1.业务组件

Nginx网关:智能接入层网关服务器，给web前端http请求做负载均衡和代理转发，集群模式为多pod多活。

CAS：智能单点登录服务器，给用户账户密码登录智能系统做认证鉴权，集群模式为多pod多活。

Ti-Master：智能调度器，机器学习平台的核心调度引擎，负责任务流的依赖分析和各种作业任务的调度，集群模式为多pod多活。

Ti-Executor：智能执行器，机器学习平台的工作流任务提交服务，负责把各种任务提交到TKE，集群模式为多pod多活；

Model-Service：模型及服务管理器，模型仓库管理和模型服务管理相关的功能实现，集群模式为多pod多活。

Ti-Maker：Notebook引擎，负责管理和调度Notebook应用和通过SDK 提交任务的能力。

TDSQL：机器学习平台数据库，存储用户数据，工程数据，任务流，模型，Notebook，库表。集群模式为多活多pod，TDSQL数据落地在csp上。

Redis：机器学习平台缓存器，用于后台数据库数据缓存，缓存系统配置，缓存消息队列。集群模式为多活多pod，Redis数据落地在csp上。

API网关-Tomcat：管理机器学习平台后台提供的所有RestfulAPI服务，包括：模型工程创建，模型工程编辑，模型任务流编辑，创建交互式建模能力Notebook，库表管理，组件管理等。

2.存储组件

Ceph存储集群：分布式文件存储系统（打包带了原生ceph），机器学习平台各种数据加工及处理算子、机器学习算法、图算法、深度学习算法等可执行jar包，python脚本，及各种算法框架可执行代码等。集群模式至少3个节点。

3.管理组件

TKE集群平台组件：Kubernetes集群核心组件，管理计算集群和模型训练集群，提供平台功能、搜集相关数据。集群模式至少3个节点。

Harbor镜像仓库服务器：存储和管理机器学习平台用到的镜像文件；集群模式多pod多活。

4.计算组件

Tensorflow：深度学习镜像。

Pytorch：深度学习镜像。

Caffe：深度学习镜像。

Pyspark：机器学习镜像。

Kubeflow：机器学习组件镜像。

Notebook：交互式机器学习镜像。

2.3系统数据架构

图3 智能中台数据架构

平台数据架构方式采用两个数据流转方向，一个是前向流程，一个是反向流程。前向流程解决的是一次训练的问题，反向流程解决的是二次训练和二次推理的问题。

在前向流程下，数据流转方向是：

图4 数据前向流转流程图

可以在客户环境完成从数据到模型上线的完整流程。

在反向流程下，数据流转方向是：

图5 数据反向流转流程图

2.4系统安全架构

图6 系统安全架构图

整个系统的安全设计遵循两个原则：A：NEED TO KNOW原则 B：DEFENSE IN DEPTH 原则。通过践行NEED TO KNOW 原则，保障只有有必要性的用户才能访问到特定的数据和服务。通过实践DEFENSE IN DEPTH原则，在系统设计的方方面面都做比较完善的安全设计和保护，通过层层加码的安全设计，减少数据泄漏和越权访问等信息安全风险。

对数据处理，数据标注，模型训练，和模型推理对各个环境，主要安全设计如下：

1.在用户访问层，系统提供连接安全的保护，通过使用TLSV2、HTTPS等，确保数据不会被中间人攻击和篡改。

2.在系统管理层，提供登陆授权，日志脱敏，和日志审计等功能。每一个访问平台的用户必须通过Authentication检查，和Authorization检查，操作的所有动作都会被记录下来，做Audit日志审计。在数据处理，数据标注或数据训练过程中接入或产生的日志数据，通过数据脱敏，数据加密等授权保障日志安全。防止信息泄漏风险。

3.在应用平台层，通过RBAC基于角色的访问控制，计算隔离和数据隔离等手段，实现平台层的切割隔离和安全。在用户角色方面，平台可以包含算法组人员，算法组管理员，数据标注人员，数据标注管理员，系统管理员等角色。特定角色只能使用系统的特定功能。

4.在计算调度层，实现了计算安全和隔离。不同用户的计算任务和资源是互相隔离的，不能互相访问，相同用户的计算任务之间通过APPID和APP SECRET 通过OAUTH2等协议实现任务的互相访问。

5.在数据存储层，使用了数据加密，数据脱敏，模型加密，和模型签名等手段。数据加密和模型加密使用AES 256 CBC算法，数据脱敏使用SHA256等HASH算法，训练出来的模型可以被加密和签名，防止篡改。

2.5 系统业务架构

图7 系统业务架构图

整个业务应用场景分三层封装，如接口层，应用层，算法层。接口层做支持三种常用的数据交互接口：

1.接口层：提供HTTP、WEBSERVICE、SOCKET服务，报文类型支持目前流行的JSON和XML；

2.应用层：主要是用于渠道整合，平台应用功能管理，包括：统一身份认证，系统管理，查询统计，联网核查，验证规则，图片管理，生物特征库管理，人脸识别模拟，指纹识别模拟，声纹识别模拟，识别场景设置，1：N人员管理，1：N人脸库管理，设备管理，识别相机管理功能等;

3.算法层:主要是提供多种识别算法，如人脸检测、特征提取、特征融合、人脸比对、1：N特征提取、1：N特征检索、声纹采集比对、指纹采集比对等。

三、创新点

1.“多模态+自演化+高弹性”的中台化架构，支持AI能力的快速组合与共享

依据吉林农信IT发展规划，IT架构以“大中台、小前台”为理念进行转型，我社采用“中台化”思想构建全行级统一的智能中台，将可重复使用的AI模型、服务沉淀共享，快速组合、组装、产出，满足个性化智能业务需求。智能中台具备多模态、多场景感知能力，感知模型自演化能力，以及弹性AI服务能力。中台总体架构包括五个部分：一是基础硬件资源层，实现平台物理资源环境的搭建，完成对容器、分布式存储、资源调度等基础设施的部署；二是算法框架层，集成Tensorflow、Angel、Caffee、scikit-learn、PyTorch等多种机器学习及深度学习框架，为平台的核心算法提供有力支撑；三是平台技术层，实现“中台”核心能力，包括模型仓库、镜像仓库、开发态（训练、调试、优化、部署）、运行态（模型服务、模型配置、资源调度、资源监控）、日志系统等模块；四是交互层，为算法工程师提供可视化建模及交互功能，建模方式分为Notebook纯代码模型构建、拖拉拽式模型构建、AutoML自动化模型构建，满足不同层次算法工程师模型训练需求；五是模型服务层，提供生物特征识别、OCR识别、风控决策等智能服务的开放API，供其他业务系统调用。

2.“多算法+多模型+多场景”一体化集成，强化多模态的智能感知能力

智能中台提供一站式模型全生命周期管理，实现了从数据导入、数据处理、特征工程、模型训练、模型部署、模型迭代的闭环。通过“多算法+多模型+多场景”一体化集成，使平台具备“听，说，读，看”的多场景感知能力。平台一方面集成了数据预处理、分类算法、聚类算法、回归算法、时序算法、推荐算法、异常检测、计算机视觉等150多个算子组件，同时平台开放自定义算子的封装配置，实现平台算子的持续完善；另一方面支持多模型、多场景应用。我社目前技术应用场景主要有：一是OCR识别技术，应用到了集中作业、集中授权、集中监督、移动展业PAD端、手机银行等各渠道业务的固定版式票据、手写体、电子印章、身份证等凭证的自动识别；二是人脸识别技术，应用到了自助柜员机、ATM、移动展业PAD端、手机银行等渠道的人脸核身、证照比对、活体检测等业务场景以及门禁等安保场景；三是指纹特征识别技术，应用到了全行所有柜员、客户经理的系统登录、授权等操作认证场景；四是风控模型服务，通过外部数据和内部数据的融合，实现了贷前、贷中、贷后的贷款全生命周期风控；五是利用平台能力，实现了人行和公安部联网核查的自动切换，支持7*24小时身份核查业务。

3.“主动学习+超参优化+反向反馈”的自动化建模，构建感知模型的自演化机制

平台建设中，重点打造中台AutoML自动化建模能力，使用自动化建模不仅可以降低建模工作的门槛，还能提高模型开发和部署效率。模型自演化能力主要体现在三个方面：一是利用主动学习的方法，采用“Human-in-the-loop”的交互式框架进行数据标注，算法负责挑选对训练AI模型价值更高的样本，而用户则标注那些挑选出来的样本，将人工标注与智能标注相互迭代，每次迭代模型都会接收修正后的标注数据微调模型，通过这个过程直接改变模型决策的边界，提高模型的正确率；二是超参数搜索，模型训练需要进行大量的参数调试，平台提供参数集预置功能，工程师可以设置数值型、枚举型等参数，系统将根据设定的规则生成多个实例，实现不同的参数组合条件下的模型训练，通过对不同训练方案的AUC、ROC等评估指标的比对，挑选优参数进行反复迭代，实现超参数的自动调参，加速模型演化过程；三是反向反馈，算法评测模块通过模型持续效果评估对模型持续测试验证，生成精度和损失函数曲线等评测指标，全面评估不同算法在测试集上的效果，结合超参数搜索迭代式的提升模型上线效果。

4.“分布式+容器化+动态调度”的架构设计，实现智能中台的弹性AI服务

在项目建设中，一般服务器、存储、交换机等配套硬件资源往往占到项目建设成本的一半，我社作为地方性中小金融机构，考虑投入与产出之间的平衡，以集约化为原则，积极引入虚拟化、容器化技术，在成本可控的前提下保证平台的稳定性与AI服务高弹性。具体体现在三个方面：一是采用分布式部署架构，计算节点采用多GPU的物理机部署，保证平台的高效计算能力，管理节点、存储节点、服务节点等采用云平台虚拟化资源，可以支撑快速的弹性扩展能力；二是引入容器化技术，容器没有管理程序的额外开销，与底层共享操作系统，可以快速从镜像仓库拉起镜像备份，性能更加优良，系统负载更低，在同等条件下可以运行更多的应用实例，能够适应未来业务高速发展；三是具备分布式调度能力，服务动态调度将启动的各个解析服务均衡分配到各解析服务器节点，并与服务器节点的GPU算力资源匹配，实现各解析服务与算力资源的动态分配与控制；任务动态调度将解析任务均衡的分配到各解析服务中，避免部分解析服务高强度运算，部分解析服务空闲的情况，从而实现各解析任务与解析服务动态分配与控制。

四、技术实现特点

智能中台集合数据挖掘、生物特征识别、OCR识别、语音识别能力于一体，具备实时性高、易用性高、可靠性高、易扩展的技术特点，同时具备批量数据处理与前台交易处理的结合，支持全行的人脸识别、指纹、指静脉、身份证OCR、银行卡OCR的联机交易，处理性能较快，满足我行对于系统的高要求，关键技术要点总结如下：

1.统一的AI平台。实现对各个业务的支撑，统一建设，多层次复用，减少重复建设及重复计算；

2.丰富的AI能力。具备丰富的视觉感知、语音识别、文本分析，决策建模等AI能力，满足不同业务场景；

3.灵活的AI组合能力。AI能力可按需组合部署，适应不同的AI场景需求；

4.端到端的AI能力调度能力。将高度抽象的业务层任务分解为内部多个AI能力引擎调用，能力引擎间进行充分共享，减少冗余；

5.模型全生命周期闭环能力。在业务数据的驱动下，训练推理反馈闭环，能安全可控的自主学习，不断提升场景效果，支持引擎全生命周期管理；

6.标准化的服务接口。提供统一的业务调用接口及数据协议规范，提供高层抽象的AI网关，从用户视角简化抽象AI能力接口；

7.跨平台的部署能力。统一底层硬件，实现跨平台、高性能的服务框架，满足不同硬件平台的快速部署需求。

五、项目过程管理

面向多模态自演化高弹性的感知智能中台为技术支撑类平台，其项目建设由吉林省农村信用社联合社信息科技中心负责实施，采用分步分阶段实施的方式，主要经历了以下几个阶段：

5.1 统一生物识别基础平台需求和设计阶段

此阶段时间段为2019年08月至2020年10月，其间主要完成完成统一生物识别基础平台的需求调研与分析，形成需求规格说明书和非功能需求规格说明书；完成平台的架构设计。

5.2 基础平台开发测试完成阶段

此阶段时间段为2019年10月至2019年11月，其间主要完成完成统一生物识别基础平台的系统设计，形成系统设计说明书；完成基础平台的代码开发工作；完成了平台的单元测试和验收测试工作。

5.3 基础平台上线阶段

此阶段时间段为2019年11月，其间主要完成完成统一生物识别基础平台的投产试运行工作。

5.4 指纹识别模块及数据迁移

此阶段时间段为2020年1月-7月，此阶段主要完成全省所有员工的多厂商指纹信息数据迁移、指纹接口迁移、人行及公安部联网核查切换功能开发、测试、投产等工作。

5.5柜面、自主机具等系统对接上线

此阶段时间段为2020年4月-7月，此阶段主要完成综合柜面、自助机具等系统的对接，实现联网核查、人脸识别、活体检测等功能模块的业务对接。

5.6机器学习平台需求分析

此阶段时间段为2020年08月至2020年10月，其间主要完成完成智能普惠金融风控中台需求调研与分析，形成需求规格说明书和非功能需求规格说明书；完成2款贷款产品风控策略及模型设计；完成风控模型数据接口需求分析，确定外部第三方数据接口。

5.7机器学习平台开发及测试阶段

此阶段时间段为2020年11月至2021年4月，期间主要完成机器学习建模平台搭建及调试，结合联邦学习技术，针对贷款产品模型进行训练与测试。

5.8机器学习平台及风控模型上线

此阶段时间为2020年5月，其间完成了完成风控模型上线运行，并在长春农村商业银行、九台农村商业银行、双阳农村商业银行、四平农村信用社联合社贷款产品推广。

5.9 OCR训练平台引入

此阶段时间为2021年10月至今，OCR训练平台引入，补齐针对非结构化影像的智能识别能力，智能中台规划完成建设。

感知智能中台的建设实施严格按照我社项目管理相关制度，从计划、质量、财务等多方面进行规范化管理，项目终如期完成。

六、运营情况

截止目前，已为全省52家社员行社业务发展提供了智能服务，智能中台的落地一是满足了监管安全要求，赋能人民银行要求必须采用两种或两种以上身份验证方式的金融场景；二是提升了业务办理效率和准确性，OCR智能识别提供替代人工录入和核验身份证能力；三是突破身份证联网核查能力的时间限制，在人民银行不提供身份证联网核查时，提供核查能力，实现7*24服务；四是智能风控模型的落地，实现了贷前、贷中、贷后全生命周期的风险管控；五是满足全省需求的文本聚类及可视化分析，直观挖掘需求的深层次关联，提升服务质效。目前共27套应用系统接入使用，人脸比对月峰值交易量236万笔，指纹比对日峰值交易量32万笔，稳定运行。

七、项目成效

1.内外部客户体验有效提升

智能中台应用在集中作业、线上贷款、柜面、客户经理PAD端等多个场景，充分考虑业务处理中客户体验，通过智能化的手段，客户使用体验得到较大提升，网点繁复的业务受理过程得到了缓解，提高了柜台客户服务意识，营销人员专注于潜在优质客户的挖掘，省联社集中作业业务处理更加流畅。通过智能化服务，加强和客户的连接，内外部客户体验得到较大提升。

2.金融科技成果有效转化

金融科技作为技术驱动的金融创新，是深化金融改革、增强金融服务实体经济的重要引擎，吉林农信紧紧围绕服务三农、服务小微企业的企业宗旨，坚持规划先行、合理布局、有序落地的原则，进行了智能化中台的规划与建设，将金融科技作为架构转型乃至数字化转型的重要引擎，以促进业务发展、提质增效为终目的，以产学研一条龙服务构建技术平台，提升金融科技成果转化和应用效率，促进吉林农信自身转型和战略调整，提高农村金融服务可得性和便利性。

3.农村金融机构创新示范效应明显

智能中台采用“中台”思想规划建设全行级统一的智能中台，旨在打破传统项目级或产品级的应用范围局限性，以中台模式进行智能化体系建设在全国农信系统中走在前列，对全国农信体系内在智能化转型建设方面起到了良好的示范性效应，具备十分重要的参考价值。

4.吉林农信品牌形象有效提升

通过智能化的手段，我社业务风险控制能力得到提升，交易风险得到集中管控，“智能、高效、便捷、灵活”的服务转型成果逐渐显现，提升了吉林农信的服务能力和品牌声誉。

八、经验总结

智能中台的建设，是吉林农信迈出数字化转型的关键一环，是立足“吉林乡村振兴”战略，赋能各法人行社开展普惠金融业务的顺利开展的智慧“中枢”。其在多业务场景的成功应用，标志着金融科技成果的逐渐显现，印证了金融科技在推动中小金融机构数字化转型、提高金融服务质量和效率方面大有可为，具有广阔的应用前景，主要体现在：

一是智能中台的建设瞄准“吉林乡村振兴”所需，吉林省作为农业大省，在“黑土地保护”、“乡村振兴”、“脱贫攻坚”等国家级战略实施中，急需创新本地化、场景化的普惠金融产品，其关键又在于需要一个全行级的智能中台支撑金融服务转型，是战略所需；

二是吉林农信体系下辖各法人行社52家、营业网点1600多个，对接省内9个地区，服务客户1000余万人，拥有20000余名前台服务人员及信贷人员，其提供普惠金融业务的开展与本项目紧密相连，是金融赋能乡村振兴的现实需要；

三是智能中台的建设，积累丰富的业务场景、相关数据，以及不断优化的模型优化实践，为学术研究、人才培养提供广阔的成长空间，尤其是为“东北振兴”研究提供*****手资料，极具战略意义。

我社将立足实际需求，持续挖掘金融科技与业务转型的融合，加速智能服务的快速落地，有效提升金融服务质效，高效赋能实体经济，让金融科技成果更广泛、更深入地惠及广大客户群体。具体措施包括：一是深入推动金融科技与业务场景融合的研究，借鉴同业先进做法与经验，逐步推动业务数字化的转型；二是以智能中台为基础，持续丰富模型、算法等基础支撑能力，构建统一的AI能力入口；三是建立人工智能算法的使用与管理办法，确保人工智能技术的有效与合规使用，保障普惠金融的可持续开展；四是形成产品设计与研发团队，加强金融科技人才储备，对接高校科研与人才培养团队，致力金融政策与产品研究。

本网站案例，除特殊标明来源的，版权归金科创新社所有，未经许可不得转载，否则将视为侵权，对于不遵守此声明或者其他违法使用本文内容者，本网站依法保留追究权。另，本网站部分案例、观点文章来源于网络素材，如有侵权，请邮件联系 fenglei@fintechinchina.com 处理！
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务，详情点击【需求提交】。