设为首页 | 收藏本站 | 关于我们 | 广告服务
 
 
当前位置:首页 > 中国金融电脑 > 2015年8月
深耕数据资产,助力业务发展

  当今,大数据正从一种计算机处理对象演变为新时代的数据石油,随着全球数据量的指数级增长,数据挖掘技术将在金融领域广泛应用,帮助银行防范风险、发现商机。未来,银行利用数据挖掘模型提炼业务规律并进行经营决策是必然趋势。

兴业银行股份有限公司信息中心 张建 陈章辉 尤毅

  我国银行历经多年信息化建设,已积累大量高价值的数据,如今在大数据时代,伴随互联网、移动互联网、物联网的迅猛发展,各渠道、各种类的数据规模正以前所未有的速度增长,大数据正从一种计算机处理对象演变为新时代的数据石油,如何挖掘数据中的商业价值是当今最炙热的课题。兴业银行董事会及行领导高度关注大数据技术的发展,明确指示要充分拥抱大数据及互联网金融,大力拓展大数据技术在业务领域的应用。总行信息科技部根据行领导指示上下求索,不断加强大数据技术研究,积极寻找业务切入点,努力探索一条适合兴业银行的大数据应用之道。

  一、业务导向,直击痛点

  目前,我国正不断推进公共数据的公开,社会数据极大丰富,数据已不再是数据应用的主要瓶颈。然而,能否在银行经营管理中找到恰当的业务场景,利用大数据技术解决当前业务痛点,是大数据应用是否具有生命力的关键。当前我国经济下行压力大,外部经济形势复杂,银行资产质量下滑态势严峻,风险管理难度日益上升,积极推动大数据在风险管理领域的应用具有时代意义。因此,兴业银行大数据研究人员以风险管理领域为切入点,经多次对一线业务人员进行访谈和调研,发现兴业银行业务人员贷款审批过程存在如下几个痛点:一是业务人员需逐笔在不同互联网站和系统上查询数据,工作量极大;二是贷款业务相关数据未得到有效整合,业务人员需手工整合不同数据源(外部数据如:征信信息、法院信息、房产信息、工商信息;内部数据如:结算信息、还款信息、资产信息、负债信息),甚至还需手工计算加工部分数据后方能撰写报告用于综合评估贷款风险;三是分行没有保存外部数据的电子化手段,导致不同岗位人员重复查询,工作量倍增。

  为切实解决兴业银行业务人员的痛点,信息科技部启动了“核贷宝”大数据智能风控产品的建设工作,项目组遵循让“听的见炮火的人” 决定产品,在产品设计及研发过程中密切与一线业务人员沟通,确保“核贷宝”产品的可用性。“核贷宝”采集、整合、加工外部互联网数据及内部数据,制定风险预警规则,设计风险预警指标,直击一线业务人员三大痛点:一是 “一站式”查询服务极大降低了业务人员在贷款审批环节不断切换信息查询入口和录入重复查询条件的工作量;二是该产品弥补兴业银行外部数据没有电子化存储的空白,业务人员在贷款复核及审查环节无需再去翻阅纸质档案;三是产品依托模型规则为业务人员提供风险预警,有效缩减业务人员阅读撰写信审报告工作量,大幅提升兴业银行风险管控智能化水平。

  二、技术创新,厚积薄发

  新兴技术的发展日新月异,兴业银行始终以开放的心态拥抱新技术,早在2012年已开始储备大数据相关的技术能力,历经三年大数据技术的学习和积累,兴业银行初步具备了大数据技术的应用能力。“核贷宝”是兴业银行首批应用大数据技术的项目,在其开发过程中面临较多的技术难关,例如行外数据采集、行内外数据整合、海量数据存储、复杂数据类型分析等多重挑战。“核贷宝”项目组采用自主研发模式,以解决问题为出发点,寻找合适且稳定的技术架构和方案,在多个方面做出了有益尝试。

  一是利用爬虫技术采集外部非结构化数据。“核贷宝”应用的部分数据来自互联网上的公开数据,而原有的数据接口开发技术无法采集公开网站上的非结构化数据。项目组借鉴互联网行业的爬虫技术框架,成功开发稳定、高效、易扩展的数据采集功能,解决了业务对外部目标数据进行采集的需求。

  二是采用MongoDB存储半结构化数据。从互联网采集的网页等半结构化数据,无法被传统的关系型数据库直接存储与检索。经项目组研究测试发现:MongoDB很容易支持半结构化数据应用,并且具备很高的性能、可扩展性及可用性,因此选定MongoDB存储半结构化数据。

  三是引入Hadoop架构解决海量数据高效联合分析的问题。互联网获取的大量信息需要与兴业银行长期积累的客户基本信息、历史交易数据进行联合分析,而兴业银行常用的技术架构难以满足这种海量的、多数据类型(包含结构、非结构化数据)、复杂的数据分析的需求。项目组在经过多次尝试后,采用互联网企业常用的开源Hadoop平台来满足需求,实现了海量数据的高效查询和分析。

  “核贷宝”项目的开发进一步锻炼和培养了兴业银行大数据人才,积累了宝贵的大数据技术实战经验:合理利用开源社区的力量,在技术应用上遵循“既不拒绝,也不盲从”的态度,持续关注大数据技术进展;理论和实践相结合,对新技术的功能和适用场景进行性能及可用性测试,做到对大数据工具心中有数;采用组件化开发模式,不重复造轮子,尽量使用已有并且稳定的工具进行研发,减少系统内部的耦合,快速放大了研发生产力。

  三、数据驱动,迭代优化

  天下武功,唯快不破。当前我国整个金融行业正处转型浪潮之中,人工智能、大数据、云计算等新兴技术发展如火如荼,业务和技术同时变革引起的共振对IT产品设计研发提出更高要求。为缩短项目开发周期,更快地让系统与用户见面,“核贷宝”在产品设计研发时,避免“大而优美”的设计,根据项目实际情况分为三个阶段优先实现最重要、最紧迫的需求:第一阶段实现互联网数据查询入口的整合,自动化抓取、保存和加工互联网数据。开发支持分行批量查询互联网站数据的应用,减少分行人员的手工查询、重复查询的工作量;第二阶段整合行内外数据,并对分行关注的指标进行深入解读,梳理贷款风险预警规则,定期自动对贷款进行评估预警,提示业务人员对超出风险指标容忍度的贷款进行深入调查;第三阶段对整合后的数据进行深度分析,通过数据挖掘技术开发一系列的风险预警模型,进一步提升分行风险审核效率和管控能力。

  项目组秉持“产品不仅管生,还得管养”的产品开发理念,积极收集用户在真实业务场景下的使用信息,特地挑选试点分行试用系统,利用微信群与分行专家密切互动,聆听反馈意见。同时,项目组还不断积累和分析分行业务专家的查询行为数据以及客户行为记录,例如:分析分行关注的业务指标、常用的数据源和报告模块及最具异常客户辨识能力的业务规则等。数据分析结果使得“核贷宝”更贴近业务人员的真实需求,也为系统功能升级、业务规则及模型的迭代优化提供明确指引。

  四、模型引领,提升价值

  随着人类社会步入大数据时代,企业积累的数据越来越多,人们却逐渐陷入了“数据丰富、知识贫乏”的尴尬境地,大量数据淹没了业务规律和有益信息。企业管理者迫切需要将这些数据转换成有价值的知识,为企业带来切实的收益。诺贝尔经济学家赫伯特·西蒙认为“信息并不匮乏,匮乏的是我们处理信息的能力”。随着全球数据量的指数级增长,数据挖掘技术将在金融领域广泛应用,帮助银行防范风险、发现商机。未来,银行利用数据挖掘模型提炼业务规律并进行经营决策是必然趋势。

  “核贷宝”产品已基于现有数据梳理和构建量化预警规则20余条,为业务人员提供初步的贷款风险指标预警服务,提高贷款风险管控效率,迭代优化兴业银行风险管控智能化能力。项目组同时积极为大数据模型开发做准备,计划采用多种模型技术(如RFM模型、聚类模型、关联分析、逻辑回归模型、神经网络模型、多元回归模型、时间序列模型、决策树模型等)基于行内外大数据开发一系列的客户异常评分模型和相应防控规则,进一步提升兴业银行风险审核效率和管控能力,大幅提升贷款发放速度,精准预警存量贷款中的不良贷款,同时也为信贷类业务的创新提供核心支持。

  顺势而为,借力跨越!面对以云计算、大数据、移动互联和社交网络为代表的数字化浪潮,站在时代的风口浪尖上,我们当迎接全新的机遇与挑战,积极探索,勇于尝试,在当今互联网金融浪潮下深耕数据资产,乘风破浪,踏上这场变革的浪潮之巅,借势借力实现跨越式发展。FCC

 
过刊查询
2022年03月 2022年02月 2022年01月
2021年12月 2021年11月 2021年10月
2021年09月 2021年08月 2021年07月
2021年06月 2021年06月 2021年05月
查看所有过刊
本期精选
《中国金融电脑》2015年8月目录
打造全能金融服务,创造数据价值
陈敏:大数据撬动银行智慧型发展
吕志刚:大数据驱动下的银行应用分析平台..
深耕数据资产,助力业务发展
借助移动大数据,招商银行实现“互联网+..
张新宇:大数据时代的数据架构设计
 
企业简介 | 版权声明 | 免责声明 | 频道介绍 | 安全提示 | 法律顾问 | 网上投稿 | 客服电话 | RSS订阅
Copyright © 2005 Fcc.Com.Cn, All Rights Reserved. ,《中国金融电脑》杂志社版权所有
电话:010-51915111-805 传真:010-51915236,网络出版服务许可证(署)网出证(京)字第337号
京ICP备14024077号-1 京公安网备:11010802025321 技术支持:站多多