在人类历史上,资源的分配有两种方式:
第一种是用战争的方式进行掠夺、无偿占有;第二种是用信用的方式,依据不同主体的不同信用等级来分配。现在,处于和平年代,战争思维已不合时宜,建立全民信用体系,依据不同主体的不同信用等级配置社会资源是唯一的选择。在大数据时代,信用已经成为数据的函数。企业间数据共享模型可以让全社会的信用函数值最大化,也就是说,全社会将因为信用最大化而幸福指数最大化。
个人信贷规模发展迅速。近几年,我国包括个人住房贷款、个人消费贷款等在内的个人信贷规模发展迅速。越来越多的年轻人选择超前消费,信用卡、小额贷款已经成了越来越多人资金周转的选择。央行发布的支付结算体系总体运行情况显示,截至2016年第三季度末,信用卡和借贷合一卡在用发卡数量共计4.96亿张,人均持有信用卡0.33张。此外,根据P2P咨询平台网贷天眼发布的《2016年网贷年度数据报告》的数据,2016年网贷行业整体成交额突破2万亿元,与2015年同比增长102%;个人信贷市场业务规模快速增长,与此同时个人不良贷款余额和不良率也在攀升。据估计,截止2016年年末,网贷问题平台历史累计设计的投资人数约为45.2万人,涉及贷款余额约为258.1亿元。个人信贷市场规模不断扩大,作为风险管理方式的个人征信的发展就有了很大的需求。
此外,个人征信是构建我国社会信用体系建设的基石。征信,作为信用的标准化考量,从金融角度看可以减少信贷交易成本,从市场角度看是契约经济的前提。在生活中有许多体现个人信用的场景,这时个人信用就有了“价值”。个人信用应用主要包括金融和生活两大领域,前者包括个人信贷、消费分期、信用卡、P2P等;后者则包括押金、后付款、证明,比如说酒店、租车等一些服务公司会对于信用好的客户免除押金。我们可以预测在这样的发展趋势下,在签证、找工作、甚至是相亲时,个人信用将会成为考量的标准之一。由此可见,个人征信系统不仅是对信贷规模扩大的支持,也是建设信用社会的基石。
国外征信行业的发展经验。从国外征信行业发展来看,美国的征信体系和产业已经发展得较为成熟,从上个世纪20年代美国大众消费文化盛行到今,美国征信市场经历了快速发展、法律完善、并购整合、成熟拓展四个时期,如今形成了以征信局及信用产品为核心的产业链。
以个人征信为例,产业链中第一环节是数据收集,其来源比较广泛,有利于机构更加全面的掌握个人的信用状况。然后是对数据进行标准化处理,例如,第二环节中,Metro1及Metro2是美国信用局协会制定的用于个人征信业务的统一标准数据报告格式和标准数据采集格式。这种标准的诞生是征信行业发展的非常重要的里程碑。第三环节是三大征信局对海量数据进行处理,进而形成信用产品,包括Fico信用分、报告等,最后是将数据应用于各种场景中,比如个人租房,办理贷款业务等等。除美国外,其他国家的征信模式也可参考。例如说政府主导型的法国征信市场,政府与市场混合型的日本与德国等,这些国家的征信模式都是可以学习借鉴的经验。
国内征信行业的发展现状。目前我国的个人征信仍然是以中国人民银行的征信系统为核心,但是个人征信牌照的开放,一系列政策意见的推出代表着我国征信市场向着更加市场化、商业化的竞争模式转变。目前央行个人征信数据覆盖8.6亿人,其中有信贷记录约3.5亿,覆盖率为40%,远低于美国95%的渗透率。基于信用历史资料的传统征信模式仅能覆盖一部分人群,并且数据维度仅限于银行领域,已经无法满足互联网大数据时代与日俱信的征信要求。例如互联网金融快速发展,但是网贷、P2P平台并没有纳入统一的征信体系中,恶意圈钱跑路的现象不断发生。互联网征信机构发展起来一些像芝麻信用、考拉征信等具有代表性的产品,这些产品在信用历史的基础维度上,还加入了用户画像、社交数据、设备指纹等多方面维度,应用场景多集中在金融领域。
大数据与信用的结合。信用数据是个人数据维度重要的一部分,数据资产化、数据红利的理论同样适用。信用报告上所有个人基本信息、信贷交易记录等数据的数据主体应该是个人自己。《征信业管理条例》中明确规定机构未经同意不能查询个人征信信息,这一条例虽然保证了个人的知情权与隐私权,但是并没有明确“个人数据归个人所有”这一所有权。如果明确了“个人数据归个人所有”,那么机构就需要向个人,而不是征信中心,申请其征信报告。现在市面上的大多数征信机构的模式本质上都是第三方数据中心,把个人的数据收集、整理、加工,再向其他机构提供信用报告或者查询接口。目前商业银行等机构查询央行个人征信报告的收费是5元一份,那么这个费用就应该是被查询个人所获的的征信数据红利。这是从数据交易角度定义的数据红利。另外,从经济角度看,一般来说信用好的人往往能比信用较差的人,以更低的成本得到更好的效益。比如说银行会给信用良好的贷款者放贷,甚至放低利率,而把历史信用差的贷款者拒之门外。如果把信用量化,以信用评分来衡量一个人的信用,通常我们可以认为信用分700分以上的人群信用风险较小,更容易获得贷款。这可以看作是信用数据带来的红利。所以将信用、数据两个因素综合,未来的信用大数据,或者说大数据时代下的征信,将会颠覆传统的征信机构商业模式。
破除征信行业发展瓶颈三大问题亟待完善
数据资源是征信业的核心竞争力,但是目前数据资源的供给存在数据源散乱不联通、数据权益不明确、数据质量无规范三大问题。
数据孤岛。在国外,征信机构之间的数据都是共享的,据共享是征信行业发展的基石,例如美国三大征信局益百利、环联、艾奎法克斯之间数据都是共享的。它们之间虽有竞争,但是这种竞争主要体现在对于数据的管理、加工、保护、风险判断的良性竞争。但是目前国内征信行业仍处于发展起步阶段,一方面,金融机构数据、政府服务数据、互联网数据等分别散落在各机构中,大量民间借贷、互联网金融数据未能实现统一的征集和标准化处理。政府公共服务数据则是由公检法、税务、教育及其他企事业单位分别披露。生活类数据更是分散在日常吃穿住行用等各类场景中,线上线下数据混杂,一人多账户多设备或多人共享账户等问题导致线上数据难以归集到数据主体等问题始终存在;另一方面,征信机构对独家数据有较强的保护意识,这是其核心竞争力。各方都希望能够共享他人信息而独享自身掌握的信息以获得更多的利益,由此形成了一种“囚徒困境”的市场局面,数据孤岛难以消除。各家机构若能够在价值链上找到利益共同点,实现一定程度的信息共享机制,可有效的降低数据获取的成本,带来一定的协同效应。
为了解决数据孤岛这一痛点,实现信息共享,玛娜金科开发的企业级建模平台,使得机构各方能够自主共享数据和信用评分结果。该平台具有以下优势:①采用哈希加密的方法,对敏感信息进行转换加密;②各个机构可共享变量与黑名单,数据维度较多;③模型结果通用可解释;
企业级建模平台的信用评分方法运用先进的数据挖掘技术和统计分析方法,通过对个人的基本概况、信用历史记录、行为记录、交易记录等大量数据进行系统的分析,挖掘数据中蕴含的行为模式和信用特征,以信用评分的形式对个人未来的某种信用表现做出综合评估。信用评分模型有各种类型,能够预测未来不同的信用表现;在对征信数据进行分析时,还可以借助统计分析方法对征信数据进行全方位分析,并将分析获得的综合信息用于不同的目的。
数据权益保护。征信有效解决了双方信息不对称的问题,降低了交易成本,减少了潜在的信用风险。但是目前征信市场乱象多,个人信用的收集、管理和使用边界均不明确。市面上一些公司,开展征信业务的模式是倒卖信用数据,直接从黑客或者黑市数据中介的手里买个人数据,例如400万条车管所的数据可以卖到30万,车牌号码、所有人、发动机号、保险到期时间等信息都有。这些“裸奔”的隐私数据被随意倒卖,一些公司、中介从中谋取暴利。《中国网民权益保护调查报告2016》统计:近一年,我国网民因为垃圾信息、诈骗信息、个人信息泄露等遭受的经济损失为人均133元,比去年增加9元,总体经济损失约915亿元。
个人数据在使用过程中,需要注意透明性和对个人权利、隐私的保护。个人应该明确知道哪一方在收集和使用数据,其目的和实效性,数据将会与共享与否。个人数据的所有权、知情权和被遗忘权,是大数据时代下个人数据权益保护的核心内涵。欧盟在2016年通过的《一般数据保护法规》中规定消费者将能查询自身信息的储存和处理情况,此外还要保证个人的数据可携带权和被遗忘权。可携带权是指消费者有权将个人数据从一家公司传输到另一家公司;被遗忘权是一旦用户不希望自己的数据由公司进行处理,并且“只要没有保留该数据的合法理由”,该数据就必须删除。国内大数据行业发展迅速,但是相关立法并没有跟上脚步。我国目前没有统一的个人信息保护法,对个人信息保护的规定散见于法律、法规、规章和司法解释中。个人数据权益尚未得到法律保障,个人数据被肆意滥用,个人数据红利被侵占,就导致了个人不能完全享受到大数据发展的红利。玛娜花园——个人数据授权交易平台将解决市场对于上述问题的困惑,通过为个人提供大数据服务的方式解决商业机构竞争造成的个人数据被割裂而引发的各类问题。玛娜花园正服务于每一个有意了解、支配自己数据价值的消费者。消费者每时每刻都在创造着自己的数据:吃饭、工作、出行、运动、学习、听音乐、看电影甚至是睡眠都在创造着自己的数据。这些数据会因为购物而被留存在购物平台;因为填写会员表而留存在服务商的平台;因为线上学习而留存在学习平台;因为购买金融产品而留存在金融机构。消费者无法准确的了解自己在这些不同的商业平台上留存了多少数据,也不知道自己这些数据具有多大的价值,更无法知晓这些商业平台如何利用自己的这些数据。因为没有专业的大数据产品为消费者解决上述问题,连消费自己都对自己的数据价值长期忽视甚至遗忘。玛娜花园的问世为消费者维护自己的数据权益提供了便捷的平台,使用玛娜花园不仅仅是在维护自己的数据权益,更是在倡导全社会关注消费者数据权益的保护。在消费者数据不断被倒卖、隐私不断被恶意侵犯的恶劣市场环境下,消费者使用玛娜花园保护自己的数据权益就是拿起正义的武器向数据侵权的不法者宣战,从而推动数据的规范化利用,消除因数据割裂而造成的社会资源浪费以及人与人之间的隔阂矛盾,改善整个市场的生态环境。
数据标准建立。建立并推广个人信息数据采集标准是数据整合共享的前提。以美国征信行业为例,美国消费者数据行业协会制定了统一数据采集标准与报告格式Metro2,用于贷款数据收集与报告,确保了原始数据的真实性与一致性,避免了信息资源的浪费,有力推动了美国征信产业蓬勃发展。故而,今后我国无论是央行、行业协会抑或是行业巨头联名倡议,逐步建立统一的数据交换与共享标准势在必行。这不但可以有效节省数据转化与清洗耗时,而且能够提升进入模型数据的质量,从而生成更为真实可靠的个人资信评估结果。
在美国FICO评分是被普遍采用并具有行业标准价值的信用评分体系,但是FICO本身并非一家征信公司,而是提供决策分析的第三方咨询机构。美国三大信用局都是用FICO分,每一份信用报告上都附有FICO分。但是在国内对信用评分体系也没有统一的行业标准,芝麻信用的“芝麻分”、华道征信的“猪猪分”等。不同机构的评分标准不同,不同机构之间评分不通用,从某种程度来讲造成了一定的资源浪费和重复工作。由于“数据孤岛”的存在,尽管现在中国已经出现了一些信用评分体系,但还没有一个称为能够覆盖全民的,被普遍认可的评分标准。显而易见的是,谁能率先打破数据割裂的状况,谁就有望成为最终的那两至三家胜出者。
征信行业立足于信贷,服务于社会经济,繁荣于诚信的社会风气。一个繁荣壮大、成熟稳健的个人征信行业不仅能促进信贷市场的健康发展,有利于提升经济社会的融资效率,降低融资成本,符合国家宏观经济转型的核心诉求,更有利于维护良好的经济和社会秩序,提升社会治理水平,促进社会信用体系假设的不断发展。大数据时代下的征信发展,需要做好数据基础建设。