数据产权:从不确定性到确定性的探索创新

2024-02-26 09:04 来源:云端杂记
浏览量: 收藏:0 分享

      数据,作为一种新型生产要素,自迈入土地、劳动、资本和技术四大传统生产要素行列后,随着流通利用广度和深度的不断拓展,“数据属于谁,谁有权处置”——这个最普通的权属问题,无论在产业界还是法律界,都引起了广泛关注,理论研究和专家观点层出不穷,似乎各有各的理。而在法律条件、技术环境与应用生态尚不具备或尚不完善的时间节点上,一些与数据有关的重大公共事件也引发了政府机构与社会公众对数据产权的思考。

  (一)、2016年,一家名为“剑桥分析” (Cambridge Analytica)的英国咨询公司,在总统竞选中受雇于特朗普团队,通过一款发布于Facebook的性格测试游戏,利用用户在线参与的方式获取用户主动提供的个人数据,通过对“点赞”数据的挖掘分析,将美国选民的心理档案进行了商业化,并以此为手段违规获取了超过5000万用户的个人信息,有效地干预了2016年美国大选。“剑桥分析”事件曾在互联网、法律等领域掀起轩然大波,扎克伯格本人因此受到了美国国会的质询,而基于数据与算法的平台商业模式弊病和缺陷,不得不使人们重新审视个人数据权利。

  “剑桥分析”事件意味着上传至平台的个人隐私数据在完全不知情的情况下被肆意利用,而这一切在传统产权模式的物理环境中是不可能出现的。比如:你不能随意占有其他人的房产,因为房产证会证明房屋的权利归属。还有,你不可能在无人察觉的情况夺取别人身上的首饰或衣物,因为物品具有天然的排他性,你拥有了,别人就会失去。而数据的存在、利用与转移方式则全然不同。另外,由于数据价值应用场景的不同,同样的数据在你的手中是一堆冗余或废弃的二进制代码,而在其他人的手中则可能价值连城。“剑桥分析”事件,从产权角度来说,也表明了数据确权的重要性,如果我们对已成为生产要素的数据无法界定产权,那么数字空间将有可能成为“数据盗窃”“数据剥削”与“数据霸权”泛滥的不法之地,导致人人自危,数字生存也将无法生存。

  人工智能时代来临,作为算法、算力的重要基础资源,数据的需求量和应用价值在迅速提升,如何对数据进行确权成为迫在眉睫的问题。数据使用过程中呈现出来的“非损耗性”,使数据看上去具有“非稀缺性”,但是,在商业领域,具有核心价值的数据,却往往是一种核心竞争力。例如,顺丰与菜鸟的“物流数据”之争、华为与腾讯的“微信数据”之争、新浪微博与脉脉的“微博数据”之争,可以说,这在较大程度上凸显了数据确权的紧迫性。人工智能技术在文娱领域的“花式”应用,让数据确权开始面临新的挑战。比如“AI孙燕姿”在互联网上的走红,就是以歌手孙燕姿独特的音色与唱腔配上与歌手本人风格或相似或迥异的歌曲成为互联网新宠。有网友通过一个名为so vits svc的开源项目将“AI孙燕姿”打造成了具有独立IP特征的“数字艺人”,并陆续翻唱了《好汉歌》《向天再借五百年》等系列家喻户晓的歌曲。

数据确权的“权”包括数据所有权、使用权、经营权、知情权、遗忘权、修改权、删除权、拒绝与限制处理权等一系列的权利。数据确权是数据要素流通利用的基础条件,是数据要素收益分配的重要前提。但是,数据确权仍然存在诸多难点。从数据全生命周期来看,从生产、汇聚、加工、流通到使用等环节,都存在不同的权利主体,且拥有不同的责任和义务。同时,数据传递的易复制性、虚拟性等特点也加大了数据确权的难度。而从数据类型及隐性价值来看,数据权利的多样化与复杂性也对确权造成阻碍。

  个人数据、企业数据和政府数据均具有不同的属性、流通范围、应用价值以及风险,个人数据具有隐私权,泄露个人数据则会直接侵犯人格权和财产权,而企业数据则因为商业机密和客户隐私问题使得数据产权更加难以界定。政府数据则需要对外开放,以满足公民的知情权和使用权。

  对于政府数据和企业数据的权属问题,还应该引起注意的是,由于人工智能与大数据对公众工作生活学习的渗透越来越深,政府数据的开放很有可能涉及个人隐私。比如某一家美国出租车公司的数据被要求开放以后,某个住宅小区的居民经常去脱衣舞厅的轨迹数据被人发现。比如某一高科技企业的部分数据在市场流通后,公众发现其存在涉嫌性别歧视或灰色经营。

  就数据权属来看,数据具有资源和资产属性。《中国数据要素市场发展报告(2020~2021)》指出,数据资源和数据资产都是由数据汇聚而产生。数据资源侧重于数据的自然维度,数据资产则更着重于数据的经济维度,强调的是产权概念。数据确权意味着数据有数据主体、定价报酬和流通配置等属性。其中,数据资产的权利主要以所有权为核心,包括使用权以及收益权等权利。明确所有权归属是数据资源、资产交易的前提条件,作为数据要素市场化的关键内容,对数据确权机制的研究非常重要。

  (二)、从数据融合发展来看,由于数据通过与不同类型数据的组合,数据的权利内容也随之发生变化,这使得数据确权具有不确定性。而就模型训练数据而言,数据产生价值方式,主要体现在经过模型训练获得不同程度上满足需求的成果,而不是取决于其自身的结构,因此,数据价值具有不确定性。比如不同数据在相同模型中体现价值不同,而相同数据在不同模型中由于需求不同也将产生不同价值。因为数据价值的不确定性,使得数据资产属性很难进行合理评估,其价值不能得以科学界定,也无法量化计算。

  有人认为,就数据而言:无场景,零价值。从数据的存在形态来看,数据不同于其他物理资产,作为一种生产要素参与社会生产,需在系统间、网络间、组织间、主体间充分流动才能逐步释放其价值。数据流动是实现价值的前提和基础,也给数据产权界定的灵活性、适应性提出了更高要求。因此,数据产权界定本身就是一个动态的过程。从数据的价值转化角度来看,数据价值具有增益性,也就说当物理产品在使用过程中存在损耗、贬值的时候,数据反而是在使用的过程中逐步凸显价值和提升价值的。价值增益与产权界定密切关联,对于数据产权界定的公平性与效率性都提出了更高要求。

  中央党校(国家行政学院)原副校(院)长王东京认为,作为生产要素的数据要进入市场交易,必须界定产权;若数据使用不存在负外部性,产权应依据效率规则界定;若数据使用存在负外部性,产权界定应看交易成本。比如疫情防控期间健康码对公民个人数据的使用问题。当政府部门掌握的健康码数据用于疫情防控、保障公民健康,不存在负外部性;而当有企业或个体未经用户许可,将健康码数据运用到其他领域,对他人或社会造成损害,而这种损害的成本并没有被其所承担,就会出现负外部性,导致这个交易成本的背后是有组织或个人将为此“买单”、受惩处。

  数据产权界定难,还有一种重要原因是数据分类标准尚未统一,目前分类标准大致可分为四种:一是以数据性质划分,数据可分为生产经营与社会管理数据,前者具有营利性,通常为企业使用,后者为公共管理服务机构使用,通常收费低或者免费。二是从数据产权来划分,数据可分为个人数据、企业数据与公共数据,个人和企业数据归独立的经济主体所有,公共数据主要由政府所持有,面向社会开放,免费提供服务。三是以数据功能来划分,数据包括综合性数据和专业数据,综合性数据具有使用高频、共享范围广的需求,专业数据则主要为特定领域和特定用户提供服务。一般来说,专业数据价值密度相对较高。四是按数据加工程度划分,数据可划分为原始数据与衍生数据,衍生数据是在原始数据的基础上进行清洗、筛选、挖掘等加工,形成有价值的、利于使用的数据。由于数据分类标准不统一进而增加了数据确权的不确定性,不仅使数据价值利用效能下降,也极大地影响了数据质量的提升,导致数据交易受阻。也因此使数据归集整合、数据目录编制、数据资产盘点等基础性工作,成为当前政府机构、企业单位等开展数据治理工作的逻辑起点。

  对数据产权的关注并非只是在政府系统、企业组织以及法律学界的讨论,智慧城市作为未来人类将与数据“唇齿相依”的生存空间,也逐渐开始了着手对数据产权安排的予以重视和行动,日本丰田的“编织之城” (Woven City)就是一个例证。日本的“编织之城”是希望通过协议约定的方式来取得对个人数据的组织化授权应用。而华东政法大学教授、法律研究中心主任高富平在《数据“产权”的体系化解读》一文中则认为,《个人信息保护法》中规定个人对数据的“事先同意权”的出发点是为了防范这些权利被他人或组织滥用,而并没有建立非经同意不能使用规则。只是现在被人理解成“来源者可以决定”。他认为,假如每个人都能决定数据授权使用的话,那么所有社会运行过程中的个人数据应用都先要去和个人谈判,其社会成本将会不可估量,因而“来源者不应该有数据的使用决定权”。这种从社会总成本角度对个人数据的权利界定,似乎与“数据二十条”规定了数据“持有权”而非“所有权”存在某种程度的契合。

  (三)、尽管当前国家层面尚未出台有关数据产权的系统性法律文件,但部分城市已经看到了数据确权对未来数据要素市场化的影响,并在地方立法工作上先行一步,从制度上破解数据产权的不确定性,并以法规固化其确定性。2021年11月25日,上海市第十五届人大常委会第三十七次会议表决通过了《上海市数据条例》,自2022年1月1日起正式施行。《上海市数据条例》明确数据交易民事主体享有“数据财产权”,并规定自然人、法人和非法人组织可以依法开展数据交易活动。法律、行政法规另有规定的除外。面对数据权属的敏感问题,《上海市数据条例》明确规定,自然人、法人和非法人组织可以通过合法、正当的方式收集数据,并对其合法取得的数据,可以依法使用、加工。在数据交易活动过程中,明确保护民事主体合法获取的数据利益,让交易主体自行探索,待交易市场培育成熟,法律再予以固化,厘清权利边界。需要注意的是,民事主体享有的“数据财产权”的前提是“合法数据”,强调数据的收集、存储、使用、加工、传输、提供、公开等全流程都应当是合法的。

  作为深圳的综合改革试点成果之一,《深圳经济特区数据条例》于2021年7月6日发布,内容涵盖了个人信息数据、公共数据、数据市场、数据安全等方面,是国内数据领域首部基础性、综合性立法。《深圳经济特区数据条例》率先提出“数据权益”,并着重强化个人信息数据保护,用户有权拒绝对其进行“用户画像”。此外,《深圳经济特区数据条例》还首次明确了数据领域的公益诉讼制度,规定人民检察院和法律法规规定的组织可以就违规处理数据致使国家利益或者公共利益受到损害的行为,依法提起民事公益诉讼;人民检察院还可以对违法行使职权或者不作为致使国家利益或者公共利益受到损害的行政机关,提出检察建议或者提起行政公益诉讼。数据公益诉讼制度的本质是对个人和组织的数据产权保护的一种“反向”的法治机制安排。

  对于数据产权保护和困难,浙江大学公共管理学院教授吴超、郁建兴认为,考虑数据区别于土地、劳动力、资本等传统要素的特性,主要三点:一是数据资源的非排他性。数据的使用过程并不消耗其价值,且在不断的交易、流通过程中可以被任意需求方任意多次使用,而不是被原始所有者或者任意单位独立地占有或使用。也因此带来了数据的所有权与其使用权在传输过程中无法分离的问题,使得数据的所有权难以固定。二是数据边际效用的不确定性。数据产生价值的方式在于经过模型训练获得不同程度上满足需求的成果,而不是固定地取决于其自身的结构,也因此具有不确定的边际效用。比如不同的数据集在相同的模型中获得的边际效用不同,而相同的数据集在不同的模型中由于需求的不同将产生不同的边际效用。三是数据边际成本的特殊性。数据直接传输等同于极低成本的复制数据,这一过程的边际成本几乎为零。这意味着原始所有者无法掌握数据所有权,甚至因为传播的复杂性难以对此后的流通途径进行追踪,导致数据所有权不可避免地被破坏。

  从全球各国对数据权属的框架设计与推进模式来看,各具特色,各有不同路径的选择。欧盟通过《通用数据保护条例》(GDPR)的发布,设置了“个人数据”与“非个人数据”的二元结构。即针对任何已识别或可识别的自然人相关“个人数据”,其权利归属于该自然人,其享有包括知情同意权、修改权、删除权、拒绝和限制处理权、遗忘权、可携权等一系列广泛且绝对的权利。针对“个人数据”以外的“非个人数据”,企业享有“数据生产者权”。但由于数据区别于物理产品的特性,导致欧盟数据确权尝试很不顺利,“个人数据”与“非个人数据”的剥离处理和差异化监管与实践需求存在差距,“理想很丰满现实很骨感”。而由于GDPR对数据流通的制约,由此导致对欧盟数字经济发展的冲击,甚至阻碍了新兴数字技术产业在欧盟的顺利发展。与欧盟截然不同的是,美国采取了数据确权的实用主义路径,将个人数据置于传统隐私权的架构下,利用“信息隐私权”化解互联网对个人隐私信息的威胁。基于《信息自由法》与《隐私权法》的总体框架,在金融、医疗、通信等领域制定行业法,辅以行业自律措施,形成了相对灵活的体制机制。比如美国旧金山就曾出台法规对人脸识别技术进行禁止。

  (四)、就我国而言,在推进数据确权过程中,逐渐找到属于自己的独特路径。2022年发布的《关于构建数据基础制度更好发挥数据要素作用的意见》(即“数据二十条”)指出,未来数据基础制度的建设将以数据产权、流通交易、收益分配、安全治理为重点,探索数据产权结构性分置制度,建立公共数据、企业数据、个人数据的分类分级确权授权制度。根据数据来源和数据生成特征,分别界定数据生产、流通、使用过程中各参与方享有的合法权利,建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制,推进非公共数据按市场化方式“共同使用、共享收益”的新模式,为激活数据要素价值创造和价值实现提供基础性制度保障。

  此外,在公共数据确权授权方面,鼓励公共数据在保护个人隐私和确保公共安全的前提下,按照“原始数据不出域、数据可用不可见”的要求,以模型、核验等产品和服务等形式向社会提供。推动用于公共治理、公益事业的公共数据有条件无偿使用,探索用于产业发展、行业发展的公共数据有条件有偿使用。在企业数据确权授权方面,鼓励大型企业发挥带头作用,促进与中小微企业双向公平授权,共同合理使用数据,赋能中小微企业数字化转型。政府部门在约定并严格遵守使用限制要求的前提下,可依法依规获取相关企业和机构数据。在个人信息数据确权授权方面,要求不得采取“一揽子授权”、强制同意等方式过度收集个人信息,促进个人信息合理利用。探索由受托者代表个人利益,监督市场主体对个人信息数据进行采集、加工、使用的机制。

  从我国数据基础制度构建的路径设计安排来看,有四点值得注意,具有确定性:一是在数据“三权分置”设计中强调了“数据持有权”而非“数据所有权”“数据持有权”的“权益”而非“数据所有权”的“权利”,主要是考虑到数据的内生性与非竞争特性,以开发利用价值实现为根本目的,围绕数据持有主体的权利,在数据流通利用过程中进行分级分类确权;二是公共数据作为一种公共资源,其所折射和呈现的社会价值归全社会共享,因此在公共治理、城市服务等领域应无偿使用,而在经营性行业由于其授权应用过程中所产生的加工成本、交易成本而进行有偿使用。三是有关数据确权授权问题,强调在确权授权的过程中,因为涉及商业利益、授权成本、决策流程及其他关联性问题,大型企业往往会有更多考虑,因此需要明确大型企业和中小微企业的数据授权公平性问题。四是围绕个人信息数据的隐私保护问题,由于移动互联网普及对用户体验的相关要求,非法违规获取用户位置、语音、人脸等数据现象时有发生,为此要杜绝“一揽子授权”,比如对个人位置或使用行为的跟踪可以按每次使用进行授权。

  诚然,土地、劳动、资本、技术和数据都是生产要素,但数据产权又不同于其他要素传统产权,如何区别数据产权与传统产权十分重要,这一点毋庸置疑是确定的。中国社会科学院法学所副所长、研究员周汉华认为,“数据二十条”采用的“数据产权”概念,完全不同于传统的财产权或产权概念,并不需要界定数据属于谁所有,而是强调数据相关方均有权使用数据。数据资源持有权、数据加工使用权和数据产品经营权均属于使用权,数据使用权“三权分置”不同于农村集体土地所有权、承包权、经营权“三权分置”。前者淡化所有权,强调的是不同主体均有权使用数据,不同主体之间的使用权平等,以促进数据合规高效流通使用,这种“三权分置”是基于使用权的横切分置;后者以维护土地公有制为原则,根据《民法典》所有权与用益物权划分为标准,设定不同权利主体不同层级的权利,不同权利之间存在决定与被决定的关系,而所有权是最根本的权利,这种“三权分置”是基于所有权的纵切分置。

  也就是说,农村集体土地“三权分置”定义的是确定了村集体为所有者的独立分配模式,而“数据产权”的“三权分置”是为了激活数据要素市场、发展数据生产力,从而使数据创新链上的每个环节主体都可以分配权益的共享分配模式。

  从解决数据产权问题来看,从不确定性中寻找确定性,破解难题堵点,形成制度性共识,这是当前推进数据要素市场化运行的必然选择;而从确定性中发现一些不确定性,探索通过制度创新和场景应用,不断予以完善提升,形成正循环,推动数据价值释放实现螺旋式上升,赋能以数据为关键要素的数字经济高质量发展,这也许就是最大的确定性。

↓↓了解更多资讯,请识别下方二维码↓↓

  1701840725(1).jpg

国脉集团

国脉集团是数据资产化先锋企业,主要提供培训、咨询和产品设计服务。为数据资源拥有者提供专业、规范、合规的全流程资产化服务,提升机构数据管理服务能力,实现数据资源价值最大化。运用最先进的培训理念方法和平台工具提供高绩效培训服务。研发“一头一体两翼”企业数据资产化咨询服务方法论,提升数据资产化战略设计、就绪度评估与咨询、入表和产品化全流程咨询服务。基于战略思维和实操需求研发“易”系列产品,并与数源方合作研发系列数据产品。

主要课程

主要课程包括数据资产入表、数据经纪人、公共数据运营和政府CDO、数据精品等精品课程。

数据产品

主要产品:数据易投、数据易贷、数据易保、数据易售。

标签:

责任编辑:chenshanliang
在线客服