本文来源于:2018第二届农村中小金融机构科技创新优秀案例评选,作者:湖北农信
湖北农信:逾期客户分析及优质客户筛选
2018-11-01 关键词:大数据,农信/农商行,采集与分析,数据可视化,风控
4834
项目背景及目标
一、项目背景
信用卡业务是湖北省农信资产业务发展的基石,湖北省农信于2015开始推广信用卡业务,截至2018年8月底约有88万信用卡客户,其中逾期客户占比较高。在电子银行了解的一些实际情况是那些大家认为的一些优质客户,他们的坏账率也很高,例如一些公务员和事业单位的工作人员,对他们进行调查后发现他们的信用卡多,而且往往都不是本人在使用,有不少在借给别人在进行套现和养卡,然后从中收取一些报酬。因此在信用卡审批方面需要一批优质客户的白名单,在存量信用卡客户里需要一批潜在风险客户的黑灰名单。从表面信息主观判断这个客户是优质客户或风险客户并不准确,需要通过模型进行多维度的分析才能得出准确有效的客户名单。
二、建设目标
湖北省农信为满足信用卡业务风险监管要求,提升信用卡不良风险管理水平,充分发挥农信大数据平台农商融e查系统的数据支撑作用,通过大数据平台提取全省信用卡客户数据,对信用卡客户分析(客户现状、分布情况、资产结构、负债结构、分期行为、交易行为等)、逾期客户分析(包括逾期客户的转化、核销和清收情况)、不良客户分析(包括不良客户现状、分布情况、资产结构、负债结构、分期行为、交易行为等)。
项目方案
一、项目架构
1. 源数据层:主要为从ODS接入的原始数据文件,包括信贷系统各类数据文件。
2.数据基础层:在源数据层接入的ODS文件中筛选出对业务有用的数据,并进行格式转换、分隔符处理等。
3.数据中间层:对基础层的数据按不同的业务主题进行加工处理过程中,会生成一些相关联的中间表,将该部分表保存在中间层;
4. 数据应用层:对通过中间层相关的信用卡中间数据进行关联处理,生成终需要使用到的信用卡数据集市。
5.数据展现层:通过对信用卡数据集市中的信用卡客户数据进行数据挖掘建立Logistic回归模型,得出信用卡优质客户特征,然后在应用层的存款数据集市中,通过筛选出未开通信用卡优质客户名单,并配置到农商融e查的灵活查询中可以进行多维度灵活查询;将该名单接入到BI工具中,进行可视化展现。
二、项目业务
1.信用卡客户分析:客户的现状、分布情况、资产结构、负债结构、分期行为、交易行为等。
2.信用卡逾期客户分析:逾期客户转化情况、核销情况、清收情况等;
3.信用卡不良客户分析:不良客户的现状、分布情况、资产结构、负债结构、分期行为、交易行为等。
4.信用卡优质客户名单可视化展示。
三、项目技术
1.基于Hive的数据存储技术;
2.基于HQL的数据分析技术;
3.基于Python的数据挖掘技术;
4.基于BI工具的数据可视化技术。
创新点
一、基于Hive的数据存储技术
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件(信用卡客户数据相关文件)映射为数据库表。
二、基于HQL的数据分析技术
Hive提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL(HQL)语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。
三、基于Python的数据挖掘技术
sklearn是python的重要机器学习库,其中封装了大量的机器学习算法,如:分类、回归、降维以及聚类;还包含了监督学习、非监督学习、数据变换三大模块。内置了大量的公开数据集,并且拥有完善的文档,因此成为目前受欢迎的机器学习学习与实践的工具。本案例采用sklearn包中的逻辑回归算法来对信用卡客户进行分类预测,发现逾期客户和正常客户分别具有的特征。
四、基于BI工具的数据可视化技术
对生成的信用卡优质客户名单在BI产品中进行可视化展现,可清晰了解优质客户的全貌特征。
技术实现特点
一、数据存储技术
在数据存储过程中,采用Hive进行存储,Hive中采用HQL为查询数据,HDFS进行数据存储,MapReduce执行任务,且执行延迟性高,能处理大规模数据。
二、数据挖掘技术
在数据挖掘过程中,采用Python语言作为实现数据挖掘算法的编程语言:Python的语法清晰;易于操作纯文本文件;使用广泛,存在大量的开发文档。
三、数据可视化技术
在数据可视化过程中,湖北省农信采用目前市场上成熟的BI产品,与其合作,将BI产品与农信大数据平台农商融e查进行数据对接,对信用卡优质客户名单进行可视化展现。
项目过程管理
项目各阶段的实施周期
1、需求分析阶段:对信用卡业务需求沟通、确认、分析,撰写需求说明书,时间2周;
2、数据提取阶段:在生产环境对信用卡业务相关所需的数据进行提取,时间2周;
3、数据入库阶段:对生产环境提取的信用卡数据,拷贝到验证环境,并进行数据入库,时间1周;
4、数据预处理阶段:对入库后的数据进行处理,加工整理出所需要的指标,时间2周;
5、数据分析挖掘阶段:对加工好后的信用卡数据进行描述性统计分析,并建立Logistic回归模型进行分类预测,时间2周;
6、撰写分析报告阶段:对描述性统计结果,进行报告撰写,时间2周;
7、数据展现阶段:对建立的Logistic回归模型得出的信用卡正常客户特征,在生产环境的存款数据集市中筛选出未开信用卡的优质客户名单,并对这份名单进行可视化展示,时间4周。
运营情况
目前,信用卡客户分析报告已经连续写了两个季度。已构建基于Logistic回归建立了信用卡客户分类预测模型,提炼出适合湖北省农信特色的优质客户筛选条件,在目前湖北省农商行存量客户中筛选出符合条件的未开信用卡的优质客户名单。
在湖北省农信大数据平台农商融e查的灵活查询功能的信用卡业务主题中添加了信用卡优质客户名单的分析主题,各法人行可以通过辖内操作员账号进行条件筛选查询,然后由对应的复核员进行复核后,查询员即可查看和下载相应的信用卡优质客户名单数据。
此外,湖北省农信大数据平台农商融e查数据已经和BI产品进行对接,其中信用卡优质客户白名单客户数据已经进行可视化展现,为电子银行部信用卡中心领导提供决策支持。
项目成效
一、经济效益
如何规避与降低信用卡风险,一直是各大商业银行面临的一道非常严峻的课题。湖北农信在农信大数据平台农商融e查的基础上构建基于Logistic回归的的信用卡风险控制模型,对信用卡客户进行分类预测,根据相关条件在全省存量客户中筛选出未办理信用卡的优质客户名单,并对已办理信用卡的客户进行不良预警,从而降低优质用户办卡的难度,扩大湖北省农信发卡规模,实现智能发卡、智能风控。
二、社会效益
本案例采用大数据技术对湖北省农信信用卡客户数据进行分析挖掘,终得出信用卡优质客户白名单及客户特征分析报告。而大数据对人类经济社会发展影响巨大,归纳起来主要有两个方面:
一是能够推动实现巨大经济效益。大数据所带来的新的信息技术应用需求,将推动整个银行信息技术产业的创新发展。
二是能够推动增强社会管理水平。大数据技术在政府和公共服务领域的应用,可有效推动政务工作开展,提高政府部门的决策水平、服务效率和社会管理水平,产生巨大社会价值。
经验总结
在数据集市方面,目前出于信用卡优质客户筛选的需求,只建设了信用卡数据集市,后续将建设更多的数据集市,比如:资产数据集市、负债数据集市、风险数据集市、财务数据集市等等。
在数据分析方面,出具的相关分析报告得到了电子银行信用卡中心领导的认可,连续写了两个季度的信用卡客户分析报告,其中报告分析的整体框架类似,后续会考虑将报告进行固化,实现报告自动化生成的功能。
在模型优化方面,目前信用卡数据采用的是Logistic回归模型,后续将对模型进行调整优化,或引入其他分类预测模型,如CART决策树算法、C5.0决策树算法、Apriori关联规则算法、BP神经网络算法等等,将多个模型进行对比分析,调整出适合湖北省农信相关业务的算法模型。
在数据可视化方面,目前虽然已经将BI产品与湖北省农信大数据平台农商融e查进行了数据对接,但是在可视化展现方面,只对信用卡优质客户名单进行了展现。后续将引入更多的可视化场景,对可视化进行丰富,比如:优质贷款客户可视化、电子银行各类业务营销名单的可视化、理财客户可视化等等。
本文由2018年度农村金融科技创新优秀案例评选组委会授权发表,转载请注明出处和本文链接。
本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】。
推荐阅读
更多
河南农信:基于大数据平台的智能审计管理信息系统
随着河南省农村信用社各项业务的飞速发展及信息化建设的不断深入,创新性金融产品和金融服务不断涌现,业务数据和业务流程复杂程度不断提高,交易信息和管理信息不断膨胀。
2018第二届农村中小金融机构科技创新优秀案例评选
河南农信
2018-11-01
安徽农信:基于人工智能的滨湖数据中心基础设施能效优化
数据中心基础设施能耗巨大,数据中心节能能够带来显著的经济和社会效益。而在数据中心基础设施中,空调能耗又占到全部能耗的70%,本项目通过将人工智能应用到数据中心基础设施空调系统运行控制中,为安徽省联社乃至金融行业数据中心基础设施节能降耗探索一条智能化创新的道路。
2018第二届农村中小金融机构科技创新优秀案例评选
安徽农信
2018-11-01
湖北农信:智慧学习平台
智慧学习平台的建设广泛运用互联网新媒体技术,集教、学、练、考评等要素,通过数字化学习运营将其打造为兼容、开放、共享、规范的多元一体化学习载体,成为全省农商行系统的学习中心,考试中心、直播中心、制度图书中心、员工交流中心,有效地提高了员工学习的时效性、便捷性和覆盖面,成为全省农商行“智慧银行”的建设重要载体。
第五届农村中小金融机构科技创新优秀案例评选
湖北农信
2018-11-01
江西农信:“百福快贷”项目
网络信贷项目依托互联网技术,采用全流程“不落地”线上操作模式,以大数据应用为基础,实现贷款申请受理、审批、放款、回收和贷后管理全部在线完成,整个贷款审批流程无需人工参与,实现了系统几分钟内自动产生审批结果,真正意义上达到了可足不出户就可完成贷款申请和收到贷款的目标。
2018第二届农村中小金融机构科技创新优秀案例评选
江西农信
2018-11-01
江苏省联社:风险偏好与限额管理系统
本项目旨在建设统一风险数据集市,打通风险管理相关数据,建立风险偏好与限额管理系统,提高各类风险识别、计量、监测和数据分析的能力,并提供给农商行风险管理相关的数据支撑,以帮助农商行进行合理的业务拓展与风险管理决策。
第五届农村中小金融机构科技创新优秀案例评选
江苏省联社
2018-11-01
重庆农商行:基于数据决策的全线上零售信贷产品“渝快贷”
“渝快贷”是重庆农商行推出的基于数据决策的个人全线上信用消费贷款产品。
2018第二届农村中小金融机构科技创新优秀案例评选
重庆农商行
2018-11-01
微信
咨询
微信咨询
扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构