众所周知,在大数据领域中,数据源是大数据企业发展的基础。但从目前市场整体情况来看,对于发展还不太成熟的大数据行业来说,大多数企业对如何获得数据并没有统一的答案。从数据猿采访过的众多大数据企业可以看出,大部分公司要么是自己就能产生数据量,要么是从其他渠道获取公开数据,还有公司选择从数据交易市场购买数据。
而从第三种情况来看,目前整个数据交易市场中,并没有明确公开的数据定价和规范合理的数据交易机制。同时,由于不同公司对数据的需求存在差别,导致同样的数据对于不同公司的价值也不一样。比如1000万份病例数据,对于金融公司来说可能只值10万元,但对于医药公司而言却可能出价100万。可以说,目前数据定价缺乏指导价格、参考价格的专项规制,行业内仍有“讨价还价”的空间,数据交易市场的痛点急需解决。
数据交易急需体系保障
上海数据交易中心合伙人申翔宇就强调了这一点。申翔宇拥有20多年电信运营商工作经历,熟悉运营商数据情况,可以说是首创了中国电信大数据应用DMP平台,并创造了可观的商业价值。
他接受数据猿专访时表示,中国的数据交易仍处于“摸着石头过河”的探索阶段。在数据交易规则和创新应用还不够成熟时,我们需要对数据流通实施必要的监管,明确行业发展底线。而数据交易机构的出现,不但起到了对数据流通的规范作用,保障建立健康、安全的数据交易市场,同时推动了数据产业的发展进程。
他说,“数据交易中心为数据需求方和数据供应方提供了桥梁,促进了商业数据的市场化流通,推动跨区域的企业合作,实现数据互联创造新价值”。
以上海数据交易中心为例,其本身不存储任何交易方的数据,而是通过建立数据交易平台,为数据供应方和需求方提供规范透明的数据交易平台,规范交易流程,把控交易数据的质量,进行数据类型细分,实现有序交易。
为构建安全有序的数据交易市场,上海数据交易中心联合大数据行业专家学者,对数据安全规约进行了探索,制定并发布了《数据互联规则》、《个人数据保护原则》、《流通数据禁止清单》等文件。同时,为了保障数据供应方和数据需求方的权益,上海数据交易中心对数据交易进行全范围、全周期的管理,以构建合理有序的数据交易环境,保证数据交易的合法性。
“去身份”数据保护个人隐私
针对数据领域最受关注的安全与隐私问题,上海数据交易中心有一套自己的保障数据主体合法权益保障规则。
据了解,在欧盟今年发布的《个人数据保护法》中有一条数据“匿名处理”原则,即将数据与个人身份隔离以后,进行“匿名化”,使其可以在一定条件下应用。由此,上海数据交易中心在《个人数据保护原则》中,特别强调了个人数据与其身份信息必须进行隔离,然后才能进入流通。
申翔宇说,“为了落实个人数据保护原则,我们汇集分析了10多份涉及个人信息的国家法律法规,参照列出了30多项数据的禁止清单,凡是与个人隐私相关的规定,不管是数据流通、数据交易还是数据共享,我们都不会触碰”。
从技术方面来看,上海数据交易中心采用自主知识产权的IKVLTP六要素数据结构和EXID虚拟标识技术,结合24小时去中心化的线上交易模式,采取对数据标识统一加密、转译处理的方法,实现对交易数据“去身份”,同时在配送过程中运用二次加密技术,确保个人身份信息不发生泄漏。
此外,上海数据交易中心不响应应用场景合理维度之外的任何数据请求、不存储任何交易方的数据、不传输任何个人的隐私数据(PII信息)、不允许并技术性限制使用方非授权数据留存。
“规则+技术”双重保障数据互联
10月7日,上海数据交易中心正式宣布开放交易系统,采用会员制形式进行数据互联。同日,二十家首批会员也正式入驻交易系统,其中很多是上海数据交易中心的股东。比如,联通、电信等公司作为数据供应方加入了交易平台。另外,晶赞科技、复星星际大数据、东方航空、建设银行等有数据互联需求的公司也成为其第一批会员。
申翔宇告诉数据猿记者,“我们发布了数据互联规则,之所以没有简单使用‘交易’二字,是因为,我们认为在大数据行业中,数据是相互流通的,可以按需使用。另外,我们更希望交易中心产生增量价值。所以,在三年之内,我们不需要向交易双方收取佣金。”
据了解,在交易系统的数据互联流程中,数据供应方要提供原始数据授权,还要在上海交易中心事先划定的数据标签库中选取可供应标签数据产品,添加对应的数据属性描述,最终形成挂牌后的可供应数据产品。
而对于数据需求方来说,可以在交易大厅中查询所有数据供应方已挂牌的可供应产品,并将所需产品添加进购物车,经供需双方确认价格之后,生成数据商品订单。
订单生成以后,即进入数据配送环节。为此,上海数据交易中心采用同步/异步实时在线方式进行单次或批量的数据配送。最后,在财务清算方面,数据交易系统会自动记录数据配送系统日志,并向各成员定期发送结算清算结果。
“营销+征信”应用打造数据交易单品
在数据交易品的组织设计方面,上海数据交易中心开设了两大应用板块——营销应用与征信应用。
申翔宇告诉数据猿记者,他认为精准营销领域的数据应用已经相对成熟,其市场规模约占整个精准营销行业的5%,有很大发展前景。目前,在交易中心营销应用数据交易品中,包含汽车、母婴、金融三大行业的特有数据单品。
而在征信应用方面,交易平台主要的数据单品方向为身份要素验证。目前交易系统主要支持三要素(身份证、姓名、手机)、四要素(身份证、姓名、手机、银行卡)验证,后续将扩展到五要素、六要素等加入多维度身份要素的验证。
对于未来规划,上海数据交易中心有自己的打算。申翔宇表示,交易中心会进一步在互联规则、功能设置等方面进行突破,以规范数据的互联进程,继续探索推动数据交易市场合法有序健康发展。
对于数据交易方来说,规范的数据交易中心为其提供了合理的保障。另一方面,交易中心也顺应了国家发展大数据战略趋势,可以说,在大数据产业发展进程中起到里程碑式意义。