古有水泊梁山英雄108将叱咤江湖,今有"中国大数据技术先锋108将"高端人物访谈搅动风云。2017年,由DT学院、中国城市报大数据中心、清华大数据产业联合会、山西省大数据产业协会联合举办,面向大数据产业的技术精英、专家学者以及大数据产业链领域公司CTO的"中国大数据技术先锋108将"高端人物访谈活动正式启动,围绕大数据技术的多个层面进行分享,旨在搭建大数据技术传播分享的高端平台,促进大数据技术的业内交流。
访谈主题:银行风控管理中的大数据技术应用实践分享
访谈对象:石棋玲
北京东方金信科技有限公司CTO、联合创始人。2009年获得美国中佛罗里达大学应用数学博士学位,是国内最早开展高强度超级图形方法大规模风险分析的数据科学家,曾就职美国银行总部,开发许多算法控制风险、打击欺诈。
访谈内容
1.DT学院:请您给大家介绍下在银行风控管理中主要应用了哪些大数据技术?
石棋玲:随着移动互联网时代的来临,从电子商务到互联网金融,人们在网络上产生的数据越来越多,大数据已经成为当前金融机构加强风险控制的重要补充手段,大数据技术的应用也越来越广泛。
在银行风控管理中,通过大数据图形分析与流处理技术,能够对历史数据、一段时间窗口的信息流和触发计算的事件进行快速统计,并且与模型匹配,在毫秒级别内进行响应作出判断;大数据能够处理非结构化数据,能够整合图像、语音、文本、网页、JSON、XML 等非结构化数据,转化成结构化字段等。
在实际应用方面,许多银行基于 Hadoop打造了面向全行的开放共享大数据平台,并且推出了金融贷款产品和个人消费贷款产品;也有银行利用大数据分析进行精准营销,比如,对客户的购物、上网习惯等进行精准细分,推出针对某类用户的银行卡等等。
2.DT学院:大数据技术应用解决了银行风控管理中的哪些行业痛点和问题?请结合案例给大家做下分享。
石棋玲:要想了解大数据风控的优势,首先要分析传统风控与大数据风控在建模原理及方法论上的区别。传统金融风控是以"风控评分卡模型自动审核为主,以人工审核为辅"的模式进行风险审核,大数据风险控制是通过大数据构建模型对借款人进行风险控制和风险提示。
与传统风控相比较,大数据风控的优势可以概括为:数据量大、数据维度多、双重变量降低主观判断误差、使用范围更广。
现阶段,我国征信体系不够完善,金融行业欺诈是银行风控的头号难题,银行可利用大数据进行有效推演和预测风险。各大银行可以通过不同的途径获取数据,逐渐补充新客户群体的风险定价数据,借以提高风控管理的能力。
3.DT学院:金融领域中有两大风险,一种是历史风险,一种是未来风险。大数据技术对这两种风险的识别能力如何?
石棋玲:历史风险是从企业或者个人的历史数据判断客户过去的表现;未来风险,是各式各样未来具有不确定性的因素造成损失的风险。对这两种风险,大数据的识别能力并不相同。"画历史易知未来难",就历史风险而言,大数据可以使得历史画像越来越清晰。通过不断拓宽历史信息的收集整理,再利用大数据神经网络技术、深度学习技术,个人或企业的画像逐步逼近个人或企业真实的历史表现是可能的。从理论上讲,随着数据信息量增大、计算机算力提升、深度学习能力不断提高,对个人和企业的画像会越来越清晰,逐步逼近真实情况。
但对于未来风险,依据大数据得到的未来画像,其可靠性却不容乐观。历史是静态的信息,在刻画历史画像时,变量为空,就可以不予考虑,凭借有值变量即可刻画客户。即使我们有1000个数据采集变量,对一个客户来说,可能只需几百个,甚至几十个有值变量即可刻画历史画像。而对于未来画像的刻画,需要考虑的变量则要要多出很多。
针对一个同样采集到1000个变量客户,刻画未来画像可能需要考虑900个变量,因为每个变量都可能发生,其发生的概率是根据历史数据刻画的,一方面其发生的概率可能并不真实;另一方面,未来各种变量间的相关性变化会导致事件发生的概率发生变化,因此,在刻画未来画像时,对变量的认识存在发生变化的可能性。
另外,即使对变量发生概率的估计是正确的,但几百个、上千个变量综合的结果也会对未来判断正确的概率产生影响,要准确刻画客户的难度非常大。还有一点,就是未来还存在从宏观、中观到微观的多个层次的变量,世界经济环境、地缘政治、国家经济环境、行业前景、企业经营能力、管理层变动、自然灾害等,都会影响未来客户违约风险。
因此,对未来画像,大数据所能发挥的作用会有折扣。一个典型的案例是华尔街那么多计量经济学家、金融学家,都未能避免2008年全球金融危机。
4.DT学院:在银行风控管理中,反洗钱、反欺诈一直是重中之重,大数据技术在这一方面是如何发挥作用的?取得了怎样的成效?
石棋玲:大数据技术对于反洗钱、反欺诈的作用和成效可以归纳为以下几个方面:
充分发挥商业银行的数据优势
商业银行在大数据应用方面具备天然优势。在业务的开展过程中,商业银行每天都会产生海量数据,包括交易系统产生的数以亿计的交易信息、业务处理过程中用于作业、授权的影像视频等半结构化数据、银行官网的客户访问以及客户投诉评价等交互信息。充分发挥大数据技术与聚类、神经网络、决策树等智能算法,对这些数据进行分析和挖掘,可以对反洗钱、反欺诈工作的时效性、准确度进行提升。
提高反洗钱调查的实效性
商业银行在判断客户交易是否可疑时,前提条件是确定客户的真实身份,提高客户身份识别的准确度才能提高可疑报告的质量。商业银行在进行反洗钱调查时,主要依据《金融机构大额交易和可疑交易报告管理办法》进行判别,只要相关交易数据符合可疑交易标准,就将该数据报送反洗钱监管机构。
提升反洗钱工作效率
作为数据来源,商业银行内部有许多套信息系统。这些系统具有分散、异构的特征,技术指标各不相同,形成了一个个封闭的信息孤岛。利用传统的关系型数据库和挖掘技术构建反洗钱平台,会遇到数据量大,数据格式不一致,无法存储、处理等技术难点。而利用大数据技术,则可以解决这些难题。大数据技术接受非结构化数据,允许数据存在不一致。利用大数据技术,整合银行内部数据资源,构建一个统一的反洗钱系统,将缩短响应时间,提升反洗钱工作的效率。
5.DT学院:目前国内部分银行尚未采用大数据技术,依然对大数据技术应用存在困惑。您觉得他们的困惑之处在哪?怎样做才可以使他们消除这些困惑?
石棋玲:在互联网技术和信息技术的推动下,大数据在金融行业的风控中获得了引人注目的进展,但是在实际运用中其有效性还需进一步提高。当前大数据技术所遇到的问题,既有数据质量的障碍,也有大数据风控的理论性障碍,还有数据保护的制度障碍。消除这些障碍、提高大数据风控的有效性,需要金融企业、金融研究部门和政府监管部门的共同努力。
建议采取的对策:
(1)加大金融创新力度,并建立大型数据实验室。构建分析平台,可以在金融企业设置大型技术创新实验,学习更先进的数据处理技术和分析方法。同时,还能培养高素质的专业人员,对数据进行管理和分析,实现数据和思维的统一。
(2)加强大数据的集成。这不仅包括金融企业,但更重要的是结合在数据库中其他领域的相关信息。除此之外,还要提高数据获取和分析能力,能使用大数据专业工具,建立数据逻辑模型。
(3)加强风险管理和控制,以保证数据安全。大数据可以在很大程度上缓解信息不对称问题,并提供更有效的手段对金融企业进行风险管理。但如果不加以适当管理规范,大数据可能演变为 "大风险"。大型数据应用程序已经改变了原有数据安全性的特点,不仅需要一种新的管理方法,还必须纳入全面风险管理体系和统一的监测和控制制度。金融企业应当抓住机遇,实现自身的改革转型,打造大数据时代的新金融。
6.DT学院:大数据风控在国内的应用属于哪一阶段?您觉得在金融领域的风控管理中,大数据技术应用还存在哪些不足和亟待提高的地方?
石棋玲:大数据已经撼动了世界的方方面面,从商业科技到医疗、政府、教育、经济、人文以及社会其他各个领域。根据数据显示,中国大数据IT应用投资规模以五大行业最高,其中金融行业占比17。5%,排名第三,位于互联网和电信行业之后。
中国互联网金融企业对于大数据风控的运用,也如火如荼,实际应用方面有很多案例,比如某金融平台推出了面向社会的信用服务体系,该服务通过分析大量的网络交易及行为数据,对用户进行信用评估,这些信用评估可以帮助互联网金融企业对用户的还款意愿及还款能力做出结论,继而为用户提供相关的金融和经济服务。某网络公司的金融信贷产品,其风控核心就是,通过社交大数据与央行征信等传统银行信用数据结合,运用社交圈、行为特征、交易、基本社会特征、人行征信5个维度对客户综合评级,运用大量的指标构建多重模型,以快速识别客户的信用风险。
在互联网技术和信息技术的推动下,大数据在金融风控管理上获得了引人注目的进展,但是其有效性还需进一步提高。对于政府监管部门,要积极推动和完善与数据相关的制度建设。对于金融企业而言,需要构建多样化、连续性和实时性的基础数据,还需要多维度的收集数据,互联互通,打破数据的孤岛,从供应链交易环节获取数据。对于金融研究部门,要从经济、金融等多个角度综合论证大数据风控的有效性,为大数据风控提供理论支持。
媒体支持
数邦客.人民网.新华网.中国城市网.央视网.中国城市报.经济日报.中国新闻网.封面传媒.中国日报网.央广网.每日经济新闻.腾讯科技.新浪科技. 搜狐科技.网易科技.国大数据产业观察网.大数据科技视界.DT学院.DT私享汇.数据猿.中国大数据.大数据人.大数据文摘.大数据周刊. 数据分析师.09大数据.紫数网.BI168.GBDC.数据观察.研趣网.推酷网.大数据中国.咕噜网.界面新闻.中国科技信息杂志社.今日头条