数据确权主要参与者大数据交易所(基于公共资源论的平台数据确权探讨)(1)

数据确权主要参与者大数据交易所(基于公共资源论的平台数据确权探讨)(2)

摘要

双边市场、非竞争性与公共资源论。双边市场决定了平台数据具有联合创造属性,自然人和平台企业需要共享平台数据产权;非竞争性意味着平台企业间共享数据理论上有利于增进全社会的福利;平台企业配置资源的权力具有准公权力属性,且数字技术推动着平台企业边界不断扩大,意味着平台企业有必要与政府在某种程度上共享平台数据。

生产关系应服务于生产力的发展,可以作为平台数据确权的基本原则。权利安排并非是外生的,作为一种基本的生产关系,内生于生产力的发展需要。与此同时,平台数据虽然具有非竞争性,但所产生的商业利益仍具有竞争性。参考美国政府资助产生的专利的界定经验,对于具有研发密集型特点的非竞争性公共资源,更适宜界定给企业,以激励企业加大研发投入。

技术进步决定了平台数据人格权应归属于个人,这是个人与平台之间实现自由交易的基础。除了消费者个人数据保护外,考虑到平台领域中出现的新型个体经济“回归”现象,也应对平台劳动者的个人数据进行保护,以改善平台劳动者对于平台企业的谈判地位,防范“算法剥削”。考虑到当前的国际竞争形势后,对消费者和劳动者的数据保护应把握好度的平衡。

由于个人、企业与政府均有主张平台数据权利的合理性,以完全排他性为特点的传统确权思路难以完全适用于平台数据,而是可以采取类似产权束拆分的思路,将人格权和财产权分开界定,以兼顾各方的产权共享需要,但这也意味着数据流转难免遭遇一些落地挑战,可以考虑在匿名算法的基础上,来完善现有的产权束拆分确权思路。

在匿名算法的基础上,可以将平台数据划分成注重隐私的原始数据、强调公平的匿名数据、以及聚焦效率的衍生数据三类,分别将相应的权利划归个人、政府与平台企业所有。可考虑:组织政府引导、多方共建的专业委员会来界定匿名算法及数据分类标准;加强个人信息保护,慎重对待“政策理念比市场先进”的欧式数据保护理念。

正文

2020年,平台反垄断与反不正当竞争开启了数字治理的新阶段。如何完善数字治理机制,关乎数字经济能否健康可持续发展,一个重要方面即是如何推动数据确权。事实上,在稍早些的2019年10月,党的十九届四中全会即首次将数据纳入生产要素的范畴,要求健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制[1]。2020年,《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》进一步明确提出:研究根据数据性质完善产权性质[2]。

按照科斯的观点,由于交易成本的存在,清晰的确权安排是实现要素市场有效运行的前提条件。但现实中,实现清晰的数据确权安排存在着较大难度:①数据要素类型多、权利主张主体多,导致数据产权难以完全按照同一个规则进行排他性的界定;②数据确权需要兼顾保护消费者隐私、打破平台数据垄断、维护国家数据安全等多个目标,这些目标之间在很多情形下并不完全兼容;③更重要的是,数据应用场景日新月异,确权规则往往跟不上技术和商业模式的发展。这些因素共同决定了数据要素的确权难度要高于传统生产要素,也意味着数字经济领域的产权纠纷将比传统经济领域更为复杂。

在近期的数字经济领域产权纠纷中,“知网案”受到了广泛关注。2021年11月北京互联网法院对“知网与周秀鸾侵害作品信息网络传播权纠纷”案做出一审判决:知网侵害了周秀鸾对涉案作品的信息网络传播权,应当承担侵权赔偿责任[3]。此后知网提出上诉,2022年4月28日北京知识产权法院做出二审判决,指出:一审判决认定事实清楚,适用法律正确,应予维持;知网的上诉请求不能成立,应予驳回[4]。“知网案”备受关注,一个重要的背景是知网连年涨价、续订费用过高,以至于中科院等知名学术机构不得不声明考虑放弃使用知网[5]。原本旨在致力于学术成果推广的中国知网,却以极其高昂的续订费用事实上阻碍了学术机构对学术成果的使用。北京知识产权法院作出二审判决不久后,市场监管总局于2022年5月13日宣布对知网涉嫌实施垄断行为进行立案调查[6]。

究竟知网实施高额续订费是否构成垄断,以知网数据形式侵犯他人知识产权在这个过程中又扮演着什么样的角色,仍待有关部门的调查结论。不过,正如《企业边界、萨伊定律与平台反垄断》所提出的:平台企业边界持续扩大具有经济合理性的一个重要原因,在于平台企业所拥有的数据具有非竞争性,意味着数字产品的边际成本几乎为零,支撑着双边市场规模不断扩大[7]。也就是说,对于判断平台企业的垄断是否具有合理性而言,平台数据的归属问题[8]可能是一个重要考量因素。以“知网案”为例,其所涉及的数据权属纠纷并未超出现有的法律框架,是一个典型的知识产权侵犯行为。基于非法占有的数据去获取超额利润,明显不具备合理性。

但问题是,现有知识产权法规是建立在传统经济模式上的,而平台经济作为一种方兴未艾的新经济形式,其所涉数据权属争议并不能够完全像“知网案”这样适用于现有知识产权法规(图表1)。那么,平台数据归属争议的根源在于什么地方?为什么知识产权等现有法规框架无法完全覆盖这些问题?面对这些争议,应如何对平台数据进行确权?本文尝试从经济学的视角对这些问题进行分析,具体从如下几个方面展开:①以大众点评网与爱帮网的法律纠纷为例,提出平台数据归属争议的表现形式和根源;②结合数据的非竞争性,阐述平台数据作为公共资源的权属内涵;③在公共资源论的基础上,将平台数据划分为原始数据、匿名数据、衍生数据三个层次,并讨论不同类型数据的确权问题;④提出相关的思考和启示。

图表1:现有知识产权保护框架难以完全覆盖数据确权问题[9]

数据确权主要参与者大数据交易所(基于公共资源论的平台数据确权探讨)(3)

资料来源:华劼(2020)[10],中金研究院

一、双边市场、非竞争性与公共资源论

如前所述,知网案虽备受关注,但所涉及的数据权属纠纷基本上仍然能够被传统的知识产权保护框架所覆盖,并非当前平台数据确权的主要争议点。大众点评网与爱帮网之间的诉讼纠纷,有助于加深对平台数据确权争议的认识。

(一)平台数据具有消费者与平台企业联合创造特点

大众点评网在发现爱帮网未经其允许而使用大众点评网上的点评内容后,于2008年以爱帮网侵犯其著作权为由将爱帮网诉至北京市海淀区人民法院,一审判决支持了大众点评关于著作权的主张。爱帮网不服判决,向北京市第一中级人民法院提起上述。2009年的二审判决提出:大众点评网对其网站内容中商家的介绍和消费者点评信息的编排并不构成著作权法意义上的汇编作品,并没有体现其独创性,不能就其编排享有著作权,因此爱帮网使用来源于大众点评的内容不构成侵犯著作权行为,据此撤销一审判决,并驳回大众点评对爱帮网的相关诉讼请求[11]。

一审和二审之间的分歧,体现了传统知识产权概念套用于平台数据所面临的新问题。不过,即便大众点评网对消费者点评信息的编排构成著作权,依旧会产生的新的争议。因为平台经济是一个典型的双边市场,平台上的数据是平台、消费者等多方“联合创造”出来的。以大众点评在这个案件中所主张的著作权为例,实际上有两个主体贡献的要素构成,一是消费者贡献的点评看法,二是大众点评网对这些点评内容的编排。也就是说,即便是爱帮网侵犯了著作权,被侵权者不应只有大众点评,还有相关消费者。为此,大众点评于2010年通过修改用户协议,以合同转让的形式取得了消费者点评信息的著作财产权,并于当年以爱帮网侵犯其对商家介绍和用户点评信息享有的著作权为由重新发起诉讼。尽管法院依旧认为大众点评网对商家介绍这块内容没有著作权,但由于用户已将点评内容的著作权转让给大众点评网,因而法院最终支持了大众点评网对用户点评内容的著作权诉求[12]。

这个一波三折的平台数据确权纠纷案,充分展现了双边市场特点在平台数据确权争议中所扮演的角色。在这个案例中,大众点评网通过协议转让获得了原属于消费者的那部分数据产权,解决了双边市场联合创造形成的共有产权问题。但是,如果没有这种自由交易形式下的协议转让,而在立法或者规定层面上直接将数据确定为某个主体,将会产生较大争议。例如,2017年欧盟曾设想过数据生产者权利,并提出两种可能的立法方式:一种是创设数据所有权,赋予数据主体使用和授权第三方使用这些数据的权利;另一种是设计一套防卫型权利,允许数据主体可以向数据非法使用方提起诉讼[13]。不过欧盟至今在此方面未有实质性的立法进展。

2020年,中国《深圳经济特区数据条例(征求意见稿)》曾希望以地方性法规的方式明晰数据权属,提出了“数据权”设想,即:自然人、法人和非法人组织依据法律、法规和本条例的规定享有数据权,任何组织或者个人不得侵犯。数据权是权利人依法对特定数据的自主决定、控制、处理、收益、利益损害受偿的权利[14]。具体到主要以自然人为消费者的平台而言,这里的关键争议点在于自然人的数据权问题。主张将数据权界定给消费者的观点认为,将数据权利赋予消费者有助于打破企业对于数据要素垄断、实现数据广泛流通和最优配置[15];而且考虑到消费者往往处于信息弱势的一方,数据交易可能会导致企业对于消费者信息的过度收集,市场交易不一定能够实现社会效用的最大化[16]。

事实上,从自然人的角度看,无论是人格权[17]带来的非货币效用,还是财产权带来的货币化效用,都是用来实现个人效用最大化的权利,因此将数据的人格权、财产权均划归自然人的做法并无不妥。以肖像权为例,这既是基本的人格权,自然人又可以将自己的肖像权进行某种形式的转让(例如明星的肖像代言)来获取财产性收益[18]。但对于具有双边市场特征的平台经济而言,之所以这个市场能够运转起来,正是因为平台企业在以平台数据为载体的信息流通中扮演着关键角色。因此,平台数据虽然源于自然人,与自然人高度相关,但平台数据具有典型的自然人与平台企业联合创造属性,要求自然人和平台企业共享这部分数据的产权。与此同时,现代社会的权利观念认为人格权是天然归属于自然人的,那么平台数据的产权共有性似乎只能体现在财产权上了。

因此,在2021年通过的《深圳经济特区数据条例》正式版本中,将此前征求意见稿中的有关“数据权”的设想删除。对此,深圳市人大常委会法工委做出如下解读:目前就数据权属问题还未形成统一认识,难以通过地方性法规旗帜鲜明地创设“数据权”这一新的权利类型,但是对于“个人数据具有人格权属性”“企业对其投入大量智力劳动成果形成的数据产品和服务具有财产性权益”已经取得普遍共识。基于这一认识,《条例》率先在立法中探索数据相关权益范围和类型,明确自然人对个人数据依法享有人格权益,包括知情同意、补充更正、删除、查阅复制等权益;自然人、法人和非法人组织对其合法处理数据形成的数据产品和服务享有法律、行政法规及条例规定的财产权益,可以依法自主使用,取得收益,进行处分[19]。

(二)非竞争性意味着平台企业间存在着共享数据的合理性

如前所述,《深圳经济特区数据条例》正式版本不再坚持自然人的数据权是人格权与财产权兼备的,而是只明确了自然人对于个人数据的人格权,这也是欧美目前在探索数据确权立法时所采用的方式,尊重了双边市场中数据的联合创造特点,也意味着自然人与平台企业在某种程度上共享了与个人高度相关的平台数据。在此之外,还有观点认为平台数据也应该在不同企业之间共享。例如,欧盟委员会在2020年2月发布的《欧盟数据战略》中提出,未来欧盟将寻求通过立法途径推动企业对企业间的数据共享[20]。2021年,中国也有报道称阿里和腾讯会互相开放生态[21]。

为什么要求平台企业之间共享数据?一个流行看法是大型平台通过数据优势享有巨大的市场势力,而中小企业在数据获取和使用上处于不公平的竞争劣势地位,因此要求平台企业间共享数据有助于反垄断。这有点类似于产业组织理论中的资源垄断,即企业排他性地占据了某些特殊资源而形成了进入壁垒,导致其他企业难以与之竞争,进而形成了垄断势力。在经典阐述中,通常是指企业排他性地占据了某些特殊的自然资源,在数字经济时代,大数据是最重要的资源,平台巨头确实有可能因为排他性地占据了大数据资源而形成垄断势力。

更重要的是,平台企业起步时虽然需要大量投入以获得初始数据,不过一旦业务顺利展开,云大物移(云计算、大数据、物联网、移动互联网等)技术就会使数据成为生产过程的副产品。并且,平台经济的网络外部性加上云大物移的技术特点,决定了大数据采集、加工、储存与使用,通常具有显著的规模经济与范围经济性,也即伴随着参与主体数量日益增多、主体间联系日益广泛,单位数据生产成本将以更快速度下降、数据质量将以更快速度提升。这种特点决定了平台巨头的竞争力将得益于大数据生产的网络效应日益增长,似乎平台最终可以凭借不断自我增强的大数据优势来实现垄断地位的不断固化和增强。

不过,因为担心平台垄断而要求平台之间共享数据的观点可能是值得商榷的。正如《企业边界、萨伊定律与平台反垄断》一文所提出的:“创新悖论”意味着平台企业的市场势力具有内在不稳定性[22]。也就是说,即便平台企业之间不共享数据,创新驱动的行业特性也意味着平台的市场势力难以持久。比方说,在大家认为淘宝和京东的电商市场地位牢不可破时,拼多多凭借新的销售模式异军突起;微信的社交生态看似占据了绝对优势地位,但抖音凭借新兴的短视频产品迅速成为新的社交平台巨头,而且由社交不断向电商领域切入。

当然,这并不是说平台之间不需要共享数据,只是说可能需要更多关注反垄断之外的其他经济合理性,例如平台数据的非竞争性。数据作为平台企业的核心生产要素,本身是非竞争性的,这和传统企业生产要素的竞争性特点很不相同。当一个生产者在使用特定的土地或生产性资本时,其他生产者将无法再使用,但一个生产者使用数据时,并不会减少其他生产者可以使用的数据量。也就是说,由于平台数据具有非竞争性的物理特点,平台间共享数据理论上可以在不减少在位生产者对数据使用的同时,满足更多生产者对数据要素的使用需要,以增进全社会的福利。

事实上,这样一个理念已经应用到有关数据确权争议的案例中。以2017年淘宝公司对美景公司发起的诉讼案为例,杭州铁路运输法院在判决中提出:财产所有权作为一项绝对权利,如果赋予网络运营者享有网络大数据产品财产所有权,则意味不特定多数人将因此承担相应的义务。是否赋予网络运营者享有网络大数据产品财产所有权,事关民事法律制度的确定,限于我国法律目前对于数据产品的权利保护尚未作出具体规定,基于“物权法定”原则,故对淘宝公司该项诉讼主张,本院不予确认[23]。

(三)平台企业有必要与政府在某种程度上共享数据

如前所述,双边市场决定了平台数据具有联合创造属性,自然人和平台企业应当共享平台数据的产权;非竞争性则意味着平台企业共享数据有利于增进全社会的福利。此外,平台企业配置资源的权力具有准公权力属性,意味着平台企业有必要与政府在某种程度上共享平台数据。

在有关企业边界的经典阐述中,讨价还价的市场机制主要发生在企业之间,靠行政命令的方式配置资源主要是发生在企业内部,两种资源配置方式的交易成本决定了企业的边界。但在平台经济中,平台企业作为双边市场的核心组织者,担负着有效匹配大量平台企业之外的生产者和消费者供求的责任,事实上在双边市场中发挥了监管者的角色。以打车平台为例,平台企业与出租车司机并不属于同一个企业,不同的企业之间通常应该采取讨价还价的市场谈判机制,但在平台经济中,平台企业对于出租车司机以类似于行政命令的方式直接派单却很常见。在零售市场中,平台企业也通常发挥着消费者与平台上小生产者、小卖家纠纷的仲裁者角色。也就是说,原本是在企业内部才会使用的命令式资源配置方式,在平台经济中超出了单个企业边界,成为协调平台与平台上小生产者、平台上小生产者与消费者之间关系的常见方式,这意味着在双边市场中发挥着组织者、监管者角色的平台,其权力已经超出了企业自身的边界范围,具有了一定的准公权力属性。

与此同时,企业的本质是追逐利润,公权力的职责是为大众福利服务,这就意味着平台所拥有的准公权力,内在面临着究竟是服务于企业利润,还是服务于大众福利的矛盾与抉择。当然,按照斯密的观点,市场上每一个参与者主观上都是为了追逐私利而从事经济活动,市场机制却让追逐私利的主观愿望,变成了增进大众福利的客观结果。这就是著名的“看不见的手”原理。但是,这只手要起到这样一种积极效果,是需要建立在法治和监督的基础上。如果种植罂粟并不违法,为什么还要种植粮食?至少在纯市场自发机制的引导下,罂粟的均衡种植面积占比要比当下高的多。同样的道理,如果缺乏了监督和约束,平台企业所拥有的准公权力并不必然确保对私利的追逐最后能增进大众福利,甚至有可能对国家安全等公共利益造成威胁。

更重要的是,数字技术的广泛应用造成了传统企业边界的缩小,与平台企业边界的扩大。伴随着罕见的规模经济与范围经济,平台企业的边界也呈现出史无前例的扩大态势,出现了企业市场化和市场企业化的现象,这也意味着平台企业准公权力所能支配的范围也在空前扩大。如此态势持续下去,平台企业所拥有的准公权力和监管部门所拥有的公权力难免边界交叠。一个突出的例子即是Facebook的Libra计划,在历史上虽然曾经有商品货币的阶段,但现代经济条件下,发行货币已经成为一项法定的公权力。即便扎克伯格宣称Libra要挂钩美元,美国国会依旧对其抱有极为谨慎的态度[24]。总之,考虑到平台模式赋予平台企业配置资源的准公权力属性,以及平台数据推动着平台企业不断扩张这种准公权力的覆盖范围后,有必要确保平台数据为企业和政府进行某种程度的共享,以确保准公权力和公权力之间实现良性互动。

二、平台研发投入与平台数据确权的逻辑

综上所述,由于平台的双边市场、数据的非竞争性等特点,意味着平台数据存在着在自然人与平台企业、平台企业之间以及平台企业与政府之间共享的必要性和合理性,因此可以看成是一种公共资源。既然是公共资源,而政府是公共利益的代表,似乎平台数据“天然”应归政府所有。而且,对于大数据这种具有高度非竞争性的生产要素而言,将其权属界定给政府,似乎有利于防止单个企业对数据的排他性占有,可以实现这些数据为更多企业所使用,能够充分利用大数据的非竞争性特点,促进生产力的发展。

以征信数据管理为例,国务院于2013年颁布的《征信业管理条例》规定,从事信贷业务的机构应向金融信用信息基础数据库提供信贷信息,同时金融信用信息基础数据库为信息主体和取得信息主体本人书面同意的信息使用者提供查询服务[25]。从经济学的角度看,这正是通过政府事实上拥有数据的方式实现了非竞争性生产要素的共享[26]。目前看,这种政府所有的监管模式在征信数据管理上是成功的,那是否也普遍适用于平台数据?这实际上包含了两个方面的问题,一方面在于是否存在“天然”的权利安排,另一方面是具有非竞争性的生产要素通过政府所有的方式进行共享是否具有最好的经济效率?

(一)权利内生观:生产关系应服务于生产力发展

在人们有关权利[27]来源的认知中,外生论是在古今中外均流传甚广的一种观点。以中国为例,在《尚书》中就有“有夏服天命”的记载,古代皇帝自称“天子”,玉玺上刻着“受命于天”的字样,以彰显皇权天授。类似地外生论在古代欧洲体现为“君权神授”,这种观点在欧洲影响极为深远,以至于即便是到了法国大革命时期,拿破仑自己加冕为帝也需要邀请罗马教皇参加仪式。不过,也正是法国大革命宣告了“君权神授论”彻底走向末路,卢梭等人的“天赋人权观”应运而生。单纯从上层建筑的角度看,“天赋人权”相比于“君权神授”无疑是历史的巨大进步,但两者对于权利来源的认识却是如出一辙,以人权的外生论取代君权的外生论。从逻辑的角度看,两者明显是互为矛盾的。如果人权真的是天然外生的,那为什么在古代没有体现出这种“天然性”?如果君权真的是天然外生的,那为什么在现代没有体现出这种“天然性”?

对于这个问题,IMF前首席经济学家拉詹曾经做出过有意思的探索。他发现当前被视为尊重财产权典范的英美,在历史上也并非一贯如此。在对英国从君主专制转变为君主立宪的一百多年历史进行研究后,他提出:当财产的所有者对该财产的经营管理比其他人做的更好时,财产权利更容易得到保护。因为把财产夺走将付出高昂的代价,使得原来的财产所有者不能再施展他的经营管理技能来创造价值。这样,如果财产被最好的管理者所拥有,那么它们不但拥有法律上的保护,而且还有经济价值上的保护。进而得出结论:宪法不过是几张写着文字的纸,能有多少斤两?不应该把财产权利的保护单纯看作是政治现象和法律现象,而应该同时视为一种经济现象[28]。

事实上,正如马克思所强调的:生产力决定生产关系;经济基础决定上层建筑。权利的安排既是一种反映思想认识的上层建筑,更是对于生产力有巨大影响的生产关系。因此,权利的安排是内生于经济基础的,而不是来自于外生的所谓“天然”因素。对于平台数据权利归属的理解,可能也更适合从生产关系的角度去看,归根结底是要看是否有助于促进生产力的发展。

(二)来自于专利权界定的启示:研发投入与公共资源归属

如前所述,即便是从生产关系应该服务于生产力发展的角度看,征信数据的政府所有模式有助于充分发挥数据的非竞争性特点,理论上讲是有利于促进生产力发展的,这是否意味着平台数据确权也可以参考征信数据的管理模式?这里需要明确平台数据的另一个特点,即研发密集型生产要素。数据固然是一种重要的生产要素,但原始数据的价值密度通常比较低,需要通过算法等二次开发才能凝练出有价值的信息,比如基于用户消费记录数据进行模型化开发后得到的商品需求预测数据。

因此,平台数据的另一个重要经济特点在于需要平台在数据加工和分析等方面进行大量研发投入,将低价值密度的原始数据转换为了高价值密度的平台数据。研究表明,如果没有合适的算法支撑,数据越多反而越有可能加剧平台的成本负担[29]。也就是说,随着数据量爆炸式增长,算法等二次开发投入的重要性将越来越大。

或者说,平台数据之所以有价值,更重要的是支撑平台数据的算法等研发投入。2020年8月,商务部和科技部发布调整后的限制出口技术目录[30],明确将“基于数据分析的个性化信息推送服务技术”列入其中,在一个侧面印证了算法的价值。因此,对于如何看待平台数据在企业间以及企业与政府间的共享问题,可能不太适合参考汇集了大量原始数据的征信数据,而是更适合参考投入了大量研发资源的专利。与平台数据相类似的是,专利也是典型的非竞争性资产,政府对其资助下的专利成果主张所有权也有其合理性。因此,美国有关政府资助下的专利权归属安排,对于理解研发投入在平台数据归属中扮演的角色,可能是有一定借鉴意义的。

在二战之前,由于美国政府对科研活动的资助有限,因此专利大多归属于非政府的个人或企业。伴随着二战期间美国政府研发的大规模扩张,政府资助下的专利权归属问题开始凸显。1947年,美国司法部发布了《政府专利实践和政策的调查--司法部长向总统提出的报告和建议》(又称“Biddle报告”)[31],主张由公共资金资助的发明专利的所有权应由公共部门(由联邦政府代表)持有,要求任何与政府机构签订研究开发合同的人,将在合同过程中做出的所有发明归属于联邦政府,而非留给承包商私人所有。

Biddle报告的主张似乎具有“显然”的合理性,政府资助私人研发的资金是公共资金,产生的发明成果自然也是应当归属于公共所有的公共资源,政府又是公共利益的天然代表,由政府来保有政府资助下专利所有权,可以避免私人部门排他性地占有公共资源,以确保所有市场主体对公共资源的可获得性[32]。但这个看似“显然”的合理性,显然不是经济视角的合理性,最终导致美国政府资助的研发成果的产业化过程一度非常缓慢。截止到1980年,美国联邦政府累积了近28000项专利,只有5%的专利获得商业许可[33],根本没有充分发挥这些专利对生产力的促进作用。

究其原因,根本原因在于公共资源的所谓非竞争性,只是说其在物理形态上具有非竞争性,但在商业利益的层面依然具有竞争性。因此,政策将具有非竞争性物理特点的专利界定给政府,虽然是希望最大化发挥专利的非竞争性优势,但会抑制企业对于购买政府专利以进行商业开发的意愿,因为他们知道竞争对手也可以很容易地获得同样的许可,进而开发和销售同样的产品。除了事后产业化的障碍外,政府持有资助研发成果的专利,意味着具体承担研发工作的企业无法获得进一步商业化的回报,将会抑制企业在从事政府资助的研发工作时的积极性,会对政府资助下的技术创新速度和质量产生负面影响。

也就是说,对于高度依赖研发投入的专利而言,即便被看作是接受了政府资助的、非竞争性的公共资源,从经济学角度看,也未必一定要界定为政府所有。因为这可能会抑制事中的企业研发投入积极性,以及事后企业对这些公共资源进行产业化的意愿,产生“公地的悲剧”。最终,美国于1980年推出了《拜杜法案》(Bayh-Dole Act),核心内容是允许非政府部门保有政府资助下的发明成果的所有权[34]。同样的道理,平台数据虽然在物理形态上具有非竞争性,但由此产生的商业价值却具有竞争性,如果因为公共资源属性,而强制要求平台企业之间共享数据,或者平台与政府之间应当分享数据,则有可能抑制平台对于原始数据进行研发投入的积极性,不利于平台数据价值的发挥。

三、谈判地位平等化与个人数据保护的度

综上所述,平台数据的公共资源属性,意味着没有直接协作甚至具有竞争关系的平台企业之间,以及平台与政府之间存在共享数据的合理性。但考虑到平台数据具有研发密集型的特点,这并不意味着应强制要求平台公开或者共享其数据,也不意味着必然需要通过政府所有的方式来实现数据共享,而是应该着眼于激励平台企业加大研发投入。正如科斯所指出的:这些权利应归属于能最有效地使用它们,并具有这样做的动机的那些人[35]。

问题是,平台数据具有典型的联合创造特点,不只依赖于平台企业的研发投入,也依赖于自然人的个人数据投入。对于自然人和平台企业而言,“有效地使用”的含义各自是什么?自然人和平台企业谁能更有效的使用这些数据?这涉及到究竟应该将平台数据界定给自然人还是平台企业的问题。在各国的数据确权现状中,中、美、欧似乎达成了共识:数据的人格权明确归属个人。随之而来的问题是,为什么要把数据的人格权归属于个人?流行的观点大多认为这是“天赋人权”,自然需要严格保护,无需讨论。

实则不然,前面有关权利来源的讨论中,已经明确讲到这种权利外生论很容易在历史面前陷入困境,为什么“天”没有赋予奴隶社会的奴隶以现代的人格权?同一片“天”之下,为什么欧美对个人数据人格权的保护尺度也存在差别?如果需要严格保护个人数据,是否意味着全部平台数据的人格权都应该受到严格保护?保护到什么样的程度才叫严格?要回答这些问题,都需要搞清楚为什么要把人格权归属于个人。如前所述,权利安排作为一种生产关系,应当服务于生产力的发展。下文依然从这个角度出发尝试对这些问题进行探讨。

(一)技术进步决定了人格权应该归属于个人

对于奴隶社会的奴隶而言,他们所享受的人格权比起现代社会无疑要差很多,他们几乎无法享受到现代意义上的生命权、健康权等基本人格权,或者说奴隶的生命权、健康权事实上是归属于奴隶主拥有的。这样一个堪称“野蛮”的历史阶段,一方面在实践的意义上证伪了“天赋人权论”,另一方面也得到了恩格斯的“称赞”:在当时的条件下,采用奴隶制是一个巨大的进步[36]。这里恩格斯所强调的“当时的条件”,即是当时落后的生产力条件。

在生产力极端落后的奴隶社会,即便奴隶们拥有现代人意义上的生命权、健康权等基本人格权,他们也不具备足够的生产力来实现自己的这些权利。当奴隶主集中拥有了奴隶们的生命权、健康权等人格权利后,他会像现代企业家在意自己尚未报废的机器设备那样,在意具有劳动能力的奴隶们的死活,得以用现代人视角下的“野蛮”生产关系,促进了当时生产力的发展。因此,恩格斯才会说:甚至对奴隶来说,这也是一种进步,成为大批奴隶来源的战俘以前都被杀掉,在更早的时候甚至被吃掉,现在至少能保存生命了[37]。

事实上,不只是在野蛮的奴隶时代,在工业革命前的数千年人类文明史中,人格权从未获得过现代社会这般重视。一个重要的原因就在于在生产力落后的时代,人在经济活动中的主要角色是消费者,过多的人口不利于资本的积累,会拖累人均收入的增长,这即是马尔萨斯所称的“人口陷阱”。由技术进步推动的工业革命彻底改变了这种状况,生产力获得了巨大进步,人在经济活动中的主要角色从马尔萨斯笔下不利于资本积累的消费者,变成了能够产生大量剩余物资的生产者。

也就是说,由于技术进步带来的生产力巨大进步,即便将人格权界定给相应的个人,也无需再像奴隶社会和封建社会那样“担心”他们没有足够的生产力来实现自己的人格权。更重要的是,现代经济的增长模式也因为工业革命而在很大程度上摆脱了土地等自然资源的硬约束,劳动供给、资本积累乃至技术进步等三大现代生产要素,或取决于劳动的量,或取决于劳动的质,都来自于人的创造[38]。因此,尽可能促进生产力持续进步的关键,在于有效激励每一个人的积极性。从市场的微观运行机制看,这有赖于自由交易和充分竞争。

对于自然人而言,自由交易和充分竞争的前提条件即是个人具有人格权。一个没有人格权的个人,自然也就不会成为自由交易的主体。美国南北战争解放黑奴的一个重要经济意义,在于为美国即将到来的快速工业化带来了大量可以自由交易的劳动力。同样的道理,目前各国有关数据的立法中,均明确了个人对个人数据具有知情权。如果个人没有知情权,也就不存在个人数据的自由交易问题,自然也就谈不上所谓个人数据的有效配置。

总之,平台数据作为自然人与平台企业的联合创造:平台企业投入了研发资源,自然人提供了个人数据;要确保平台愿意持续投入研发,就需要将平台数据的财产性权利更多界定给企业;要确保双方交易是有效的,就要确保自然人对个人数据的人格权,以实现个人与平台的自由交易和充分竞争。随之而来的问题有三个:应该保护哪些自然人的个人数据?哪些个人数据应该受到保护?如何确保个人数据保护规则落实到位?

(二)消费者之外,是否还需要保护劳动者的个人数据?

在传统的交易模式中,消费者通常是分散的个人,生产者则是有组织的企业,因此所谓保护自然人的人格权通常被认为是保护消费者的人格权。在当前社会各界对平台数据保护的讨论中,主要的关注依旧是如何保护消费者对数据的相关权利。例如,美国加州《消费者隐私法案》本身就是直接聚焦消费者隐私保护的,欧盟《通用数据保护条例》(以下简称GDPR)虽然是通用性的数据保护框架,并没有说专门关注消费者,但从法案生效后处罚金额在2千万欧元以上的案例看,基本上都是保护消费者的案例(图表2)。

图表2:按照GDPR规则,处罚金额前十的案例

数据确权主要参与者大数据交易所(基于公共资源论的平台数据确权探讨)(4)

资料来源:GDPR Enforcement Tracker(截至2022年5月25日)[39],中金研究院

对以自然人为主的消费者进行保护无疑是个人数据保护的核心,但双边经济的特点也意味着不应忽视生产者的个人数据保护,这涉及到如何保护平台经济中的劳动者,以及平台经济能否可持续发展的问题。以外卖骑手的劳动者保护为例,社会各界给予了巨大关注,一个重要的关注点在于平台给予外卖骑手社保的比例远低于城镇职工平均水平(图表3)。问题是从缴纳社保的角度看,将外卖骑手等平台上的劳动者与受雇于企业的劳动者相比较,是否合适?或者说,表面看起来似乎都在给企业“打工”,为什么平台给外卖骑手的社保比例要低一些?如果平台不给骑手缴纳社保是侵犯了骑手的劳动者权益,为什么年轻人宁愿去送外卖,也不去社保制度比较完善的制造业大工厂?

图表3:外卖骑手社保比例低于城镇职工水平

数据确权主要参与者大数据交易所(基于公共资源论的平台数据确权探讨)(5)

资料来源:《2021年中国快递员权益保障问卷调研》(国家统计局,2021),中金研究院

这些问题的部分答案可能在于平台经济带来的一个新动向,即是以自然人为生产者的个体经济“回归”,忽视了这部分个人的数据保护问题,有可能造成所谓的“算法剥削”问题。个体经济回归的根源在于数字技术的广泛应用,降低了传统行业中运用市场机制的交易成本,这意味着传统企业边界存在缩小压力[40]。随着传统企业边界收缩,“劳动者—企业—消费者”的传统商业模式逐渐被“劳动者—平台—消费者”的双边市场模式所取代(图表4)。

图表4:平台带来个体经济的“回归”

数据确权主要参与者大数据交易所(基于公共资源论的平台数据确权探讨)(6)

资料来源:中金研究院绘制

以出租车市场为例,如果没有出租车公司,居民对出租车服务的需求只能通过出租车个体户这种传统个体经济来满足。然而,信息不对称带来的高昂交易成本使得这种由出租车个体户构成的市场难以扩大。出租车公司的出现带来了标准化、正规化的服务,降低了交易成本,激活了市场的需求,出租车公司取代出租车个体户占据市场主流地位。伴随着滴滴、Uber等平台企业填平了阻碍传统个体经济发展的“信息鸿沟”,信息成本下降、信息不对称减少使得市场型交易成本开始低于企业型交易成本,最终的结果是,相比于传统出租车公司的出租车服务而言,专车、顺风车等出租车个体户能够实现对消费者需求的更高效响应、更优质服务,最终促使出租车“个体户”强势回归出租车市场。

虽然许多双边市场并没有经历图表4那种完整的三阶段变迁,但就供给侧的组织模式而言,也是呈现出明显的个体经济色彩。例如,淘宝的许多小商户、抖音的很多博主、公众号的很多作者以及外卖的很多骑手也是以个体经济的形式存在。值得注意的是,个体经济“回归”现象主要出现在资本分割性较强的领域,这些领域存在单个劳动者用一小部分资本、甚至无需资本就可以单独提供产出的可能性,也就是具有“个体经济”的技术可能性。例如,有一辆电动两轮车就可以成为外卖骑手,有一辆车就可以成为Uber或者滴滴司机,有一栋房子就可以成为Airbnb房东。在目前的技术条件下,难以想象在汽车制造这种资本分割性较差或者说不可分割的产业,一个劳动者就可以单独生产出汽车。

由于制造业的资本可分割性较差,而服务业的资本可分割性较强,因此,这种个体经济“回归”的现象主要出现在服务业。这也在部分程度上解释了为什么年轻人宁肯去送外卖,也不进工厂。因为双边市场中劳动者所从事的活动带有个体经济的性质,在自由度上要高于工厂中的工人,而自由本身就可以给劳动者带来非货币化的效用。需要说明的是,这里要区分两类劳动者,即平台劳动者和平台企业的劳动者。虽然看起来都是为平台“打工”的服务业人员,但与外卖骑手等具有个体经济色彩的平台劳动者不同,程序员是平台企业的劳动者,更适合采用传统的劳动者保障模式。

当然,这并不是说平台企业对平台劳动者的权益保障就完全没有义务。新型个体经济与传统个体经济的一个最大不同在于,会受到平台企业准公权力的约束,也即平台企业与平台劳动者之间并非完全的市场化交易,平台企业大量通过行政指令的方式来干预平台劳动者的行为。对于平台企业而言,这种准公权力的一个重要体现形式即是算法。2020年,在社会各界引起极大反响的《外卖骑手,困在系统里》[41]一文,体现了算法对平台劳动者的支配力。而算法之所以能够如此极限地使用劳动力,自然得益于平台对于劳动者数据的详细占有。

这种数据优势无疑是单向的,就像平台对于消费者具有绝对数据优势一样,平台对于另一侧的生产者也拥有绝对的数据优势。如前所述,市场经济之所以会产生效率,微观的基础在于自由交易和充分竞争,而交易所能达到的自由程度、竞争所能实现的充分程度,有赖于双方谈判地位在多大程度上是对等的。因此,赋予消费者以个人数据的人格权,不只是消费者与平台之间构成自由交易的基础,也有利于改善消费者的数据劣势地位,以提升对平台的谈判能力。同样的道理,对平台劳动者的个人数据进行某种程度的保护,有助于改善平台劳动者与平台企业之间的数据不平等,进而提升平台劳动者的谈判地位,以提升资源配置的效率。

当然,这样的说法可能带来一个争议。以外卖为例,增强骑手个人数据保护,可能会导致算法无法节约配送时间,甚至有可能延长配送时间,为什么能够称为提升了资源配置的效率?这里需要说明的是,算法只是形式,所体现依旧是经典的劳资互动问题,回顾一下劳资互动的历史有助于我们加深对这个问题的理解。从新制度经济学的角度看,无论是资本家还是劳动者,都存在机会主义动机。劳动者的机会主义动机是偷懒,资本家的机会主义动机是剥削。偷懒对效率的危害是显而易见的,但剥削对效率的危害却隐蔽的多。

以一百年前的20世纪初为例,资本家对劳动者的严格监督有效防止了劳动者的偷懒行为、提高了劳动生产率,但机会主义动机也促使资本家对劳动者进行过度使用,超长工时的现象普遍存在,甚至出现了雇佣童工的行为。如果从利用一切可以利用的劳动力来投入生产的角度看,无论是雇佣童工,还是超长工时,无疑是实现了资源的最大化利用。但问题在于,资本和劳动虽然都是生产要素,过度使用资本不过是造成物的损毁,过度使用劳动的结果却是对人的伤害。

作为物的资本不会对资本家的过度使用进行有意识的抵抗,作为人的劳动者却会通过种种方式来反抗剥削他们的人。因此,20世纪初的劳资矛盾体现为激烈的阶级对抗与社会运动,整个宏观经济的可持续增长受到了巨大威胁。简单来说,资本家的机会主义动机确实可以在微观层面提高效率,但在宏观层面却会积累增长不可持续的风险,甚至有可能通过危机的方式将此前创造的财富毁于一旦,这样一种“微观有效”是难以称得上“宏观有效”的,我们将此称为“效率悖论”。问题是,为什么20世纪初期威胁经济可持续增长的是资本家的机会主义动机,而不是劳动者的机会主义动机?

在一定程度上是因为劳动力市场存在天然的缺陷,即资本供给是相对集中的,而劳动供给是高度分散的。这意味着如果没有外部干预,在劳动与资本的交易中,劳动难免处于谈判下风。然而在主张自由放任的古典经济学时代,代表劳动者利益的工会却成为反垄断目标。例如,1890年美国出台了原本旨在反垄断的《谢尔曼法》,这个法律在初期却被资方用来限制工会的发展。资方律师无视资本集中所有的事实,辩称说工会是对劳动力市场的垄断,阻止了劳动力市场的自由竞争。这样一种打着维护自由交易的旗号,用公权力去维护不公平交易机制的做法,最终导致社会矛盾日益激化。

这种情况直到1933年大萧条之后的罗斯福新政才迎来转机(图表5),罗斯福坚持以政策干预来弥补劳动力市场的天然缺陷,先后推出了《工业复兴法》(1933年)、《劳资关系法》、《社会保障法》(1935年)以及《公平劳动标准法》(1938年)等法案,实行最低工资制度、限制最高工时并改善劳动条件,明确要求资方不得干涉工人组织工会和行使集体谈判权,赋予了劳动与资本更平等的交易地位,大幅缓和了自工业革命以来日益激化的阶级矛盾,为资本主义可持续发展扫清了道路。

图表5:美国制造业的劳动报酬占比

数据确权主要参与者大数据交易所(基于公共资源论的平台数据确权探讨)(7)

资料来源:One Hundred Years of Economic Statistics(Liesner, 1989),中金研究院

如前所述,平台经济一方面带来了个体经济的“回归”,大量的平台劳动者难以得到传统模式下的安全网覆盖,缺乏有效的劳动保护机制,另一方面平台数据赋予了平台企业远超传统企业的算法监督优势。两方面的因素共同决定了平台经济模式在能够显著提升微观效率的同时,也在酝酿宏观层面的“效率悖论”风险。因此,在为平台劳动者量身打造社会安全网的同时,也需要对劳动者的个人数据进行适度保护,这有利于改善平台劳动者对于平台企业的谈判弱势地位,实现微观效率与宏观效率的平衡。

(三)个人数据保护越严格,数据监管理念越先进?

在前面有关平台劳动者个人数据的保护讨论中,我们提出的措辞是“适度保护”。因为劳资双方均有不利于效率的机会主义动机,因此保护的目的不是矫枉过正、建立起平台劳动者对于平台企业的绝对优势,而是让双方能够尽量在谈判地位比较平等的基础上实现自由交易、充分竞争,这样才有可能实现微观效率与宏观效率的平衡。也就是说,这是一个度的问题。目前的主流关切对于平台劳动者相关数据保护尚不够重视,即便是在目前居于核心地位的消费者相关数据保护中,如何把握数据保护的度依旧是一个值得探讨的问题。

由于平台数据的核心是海量的个人数据,这里面既有家庭住址、面部信息、身份证号码等个人隐私数据,也有用户公开点评信息、从业资格编号等个人公开数据。而近些年曝出的多起涉嫌侵犯公民隐私的案例中,既有平台巨头,也有一些政府部门(例如2020年苏州文明码)。因此一个颇受欢迎的主张是,个人数据应归个人所有,并进行严格的个人数据保护,如果没有获得个人授权,任何人或者机构不得使用相关数据。问题在于,什么是个人数据?这是个要比隐私数据更宽泛的概念。

目前各国法律都主要基于可识别性来定义个人数据,但可识别性也是个内涵极为宽泛的概念,与身份识别手段息息相关。很多情况下,一些单独不具有可识别性的非个人数据,在与其他公开数据组合后很可能会具有了可识别性。在个人数据定义模糊的情况下,明确受保护的个人数据范围就显得非常重要了。从欧、美目前的数据监管规则来看,虽然都是将个人数据的人格权界定给了个人,但欧、美的保护范围明显不一样。究竟孰优孰劣?是否个人数据保护越严格,意味着监管理念越先进?我们将结合欧、美个人数据保护法案的对比分析,尝试对这个问题进行回答。

在欧盟,严格保护个人数据似乎是理所应当的。欧盟数据政策最重要的特征是将隐私视为一项基础人权且优先于其他权利,并以此概念为基础构建了全面的个人数据保护框架。总的来看,欧洲个人数据保护政策大致经历了三个阶段的演变过程[42]。第一阶段是二战后到欧盟正式成立前,这一阶段明确了个人数据保护的重要地位,但相关法律以约束力不强的公约、指南为主。早在1953年,《欧洲人权公约》正式生效,其中第八条规定:“Everyone has the right to respect for his private and family life, his home and his correspondence”[43]。此后四十年,在欧洲个人数据保护领域发挥重要影响的两部文件是1980年OECD发布的《关于保护隐私和个人数据国际流通的指南》[44]和1981年欧洲委员会颁布的《关于自动化处理的个人数据保护公约》[45]。前者确立了个人数据处理时的八项基础原则[46],对于各国的数据保护理念有着深远影响,后者是第一个关于个人信息保护的国际公约性法律文件。

由于第一阶段中公约和指南的法律约束力不强,在1993年欧盟正式成立后,欧洲各国决定以法律形式规范欧盟境内的数据保护规定,并于1995年正式颁布了欧盟层面的第一部数据保护法,即《保护与个人数据处理有关的权利以及个人数据自由流动的指令》,这也标志着欧洲个人数据政策进入第二阶段。但该指令在欧盟各国的实施效果并不理想,各国出现了不同版本的数据保护法案,增大了欧盟建立单一数据市场的难度。这背后的原因主要有三个:一是根据欧盟法律层级,指令(Directive)形式的法律允许成员国决定各国具体的执行细节,这就导致了欧洲各国出现了各个版本的数据保护法案,增大了数据跨境的交易成本;二是21世纪以来信息技术和数字技术的快速发展,该指令已越来越难适应最新的技术和市场现状了;三是由于欧盟自身在立法方面的权力有限,导致欧洲法院在引用该指令时底气不足(lack of confidence)[47]。

直到2009年《里斯本条约》和《欧盟基本权利宪章》生效后,欧洲个人数据保护才正式进入第三阶段。在这一阶段,欧盟在欧盟成文法层面上真正拥有了就基本人权进行立法的权力[48],基于人权制定的数据保护指令才有了更坚实的法律依据。在此期间,欧盟进一步从人权角度出发加强了数据保护立法工作,2016年颁布的欧盟《通用数据管理条例》(以下简称GDPR)正是这一阶段的重要成果。欧盟GDPR虽然也未明确数据财产权的界定问题,但在人格权的保护上是非常全面的。强调个人是自身信息的控制主体,并以“知情同意”原则为基础,全面、细致地赋予了公民包括知情权、访问权、修正权、删除权、限制处理权、可携带权、拒绝权等各项权利。这些权利不只覆盖个人不愿意公开的隐私数据,也覆盖了个人的公开数据。

图表6:GDPR中规定的个人数据权利

数据确权主要参与者大数据交易所(基于公共资源论的平台数据确权探讨)(8)

资料来源:欧盟《通用数据保护条例》,中金研究院

按照GDPR第14条规定,如果平台等数据控制者不是从个人那里获得个人数据,数据控制者需要向个人告知数据来源、处理者身份、处理目的等诸多信息,除非无法告知或者告知行为将导致数据控制者付出不成比例的投入。在2019年由波兰个人数据保护办公室(UODO)对Bisnode发起的调查中[49],Bisnode作为一家从事数字营销业务的瑞典公司,从公开可得的公共注册资料中[50]爬取了公司登记信息中的企业家的个人信息。虽然Bisnode在其网站上刊登了相关数据的处理说明,但只通知了部分留有电子邮箱的企业家。最后,UODO还是根据GDPR第14条规定对Bisnode公司发出了约22万欧元罚款的处罚令,理由是该公司仍未尽到向数据主体的告知义务。

同样是涉及网络爬虫的法律纠纷,在美国数据分析公司HiQ于2017年诉LinkedIn一案中,HiQ利用LinkedIn网站上的公开会员资料[51]进行数据分析,LinkedIn则利用技术手段阻止HiQ获得相关数据。该案历经数年的多轮诉讼后,美国第九巡回法院于2022年4月做出裁决[52],提出:法院选择从公共利益角度出发,裁定HiQ公司使用爬虫技术从LinkedIn这类公共网站收集公开个人数据的行为完全合法,且无需LinkedIn的授权,并要求LinkedIn不得采取法律或技术措施限制第三方公司爬取公开数据。

作为判例法国家,美国法院的这样一个判决意味着平台数据中的个人公开数据是一种公共资源,任何企业都可以非排他性地使用,而且无需告知相关个人,这很明显与欧盟GDPR的严格保护态度不同。在成文法律上,这样一个理念也体现在美国加州《消费者隐私法案》(以下简称CCPA)和《隐私权法案》(以下简称CPRA)中[53],法案规定:受保护的个人数据不包括去标识化数据、汇总的消费者数据、公开可得数据、合法获得且引起公众关注的真实数据。也就是说,被认为高度重视个人权利保护的美国,无论是在有关隐私数据保护的法院判罚或者法律规定中,个人数据保护的范围相比于欧盟明显较为有限,极大降低了企业使用个人公开数据的交易成本。

事实上,如果以保护是否严格作为数据监管理念是否先进的标准,美国的“落后”不只体现在保护范围有限上。例如,以知情权的保护为例,美国加州CCPA和CPRA并未采用欧盟的“选择加入”(opt-in)模式,而是采用了“选择退出”(opt-out)模式,即除非用户明确拒绝,企业即可处理用户的个人信息。在民事诉讼方面,美国加州的CCPA和CPRA还限制了个人诉权的范围,规定消费者可以发起诉讼的前提是消费者个人信息遭到未经授权的访问和泄露等[54],而欧盟GDPR则宽泛地规定了如果数据主体认为其权利受到侵犯,即有权获得司法救济[55]。此外,美国加州CCPA和CPRA还在民事诉讼中给予了企业30天的豁免期,如果企业能就违规行为进行适当补救,则不得对企业提起个人或集体的法定损害赔偿诉讼[56]。

很明显,与欧盟严格的个人数据保护理念相比,美国的个人数据保护法律与判例似乎更倾向于兼顾企业利益,极大降低了企业使用个人数据的交易成本。事实上,欧、美的这些理念差异并非是在平台经济蓬勃发展后才出现的,而是欧、美监管理念的历史差异在数字经济时代的进一步体现。正如我们在《企业边界、萨伊定律与平台反垄断》一文中,对欧、美反垄断理念进行比较分析时所指出的:虽然反垄断目的都是保护竞争,但欧洲更倾向于保护竞争者,美国更倾向于保护竞争机制本身。类似地,欧、美虽然都在探索个人数据的监管问题,欧盟明显更倾向于保护个人的利益,但美国则给予了企业利益更多的考虑。

或者说,无论是在反垄断,还是在个人数据保护方面,欧洲监管理念更倾向于促进公平,美国则更倾向于促进效率。这也许进一步回答了我们在《企业边界、萨伊定律与平台反垄断》中提出的那个问题:人均GDP高于中国、人口密度高于美国的欧盟,为什么在平台经济发展方面却乏善可陈[57]?因为平台数据虽然大多是个人数据,但本质上是一种公共资源,如果对个人利益进行过于严格的保护,则意味着企业运用相关数据的交易成本过高,势必降低企业使用相关数据的意愿,这将极大抑制平台等数字经济的发展,并不符合生产关系安排需要服务于生产力发展的确权原则。

图表7:2021年排名前10的平台等数字经济企业

数据确权主要参与者大数据交易所(基于公共资源论的平台数据确权探讨)(9)

资料来源:万得资讯,中金研究院整理

通常而言,不利于生产力发展的生产关系安排,最终也将不利于消费者福利的改进。然而,欧盟对于个人数据保护的严格态度,似乎并没有阻碍欧盟民众享受到数字经济的便捷服务。需要指出的是,这并不能证明欧盟的数据监管理念并未阻碍数字经济的发展,因为欧盟民众所使用的数字产品大多来自美国平台企业的供给,而非来自于欧盟本土企业。也就是说,由于欧美特殊盟友关系,欧盟可以几乎毫无障碍的享受到美国生产关系带来的生产力进步红利。就如同美国辉瑞收购德国Biotech的技术来产业化mRNA疫苗一样,欧盟资本市场虽然不发达,但并不妨碍欧盟利用美国发达的资本市场将创新成果实现产业化。

图表8:GDP对比与大国关系互动[58]

数据确权主要参与者大数据交易所(基于公共资源论的平台数据确权探讨)(10)

资料来源:万得资讯,美国CBO,中金研究院

然而,在当前国际竞争背景下,中国面临的技术封锁态势愈发严重,从外吸取先进科技成果越发困难。事实上,在奥巴马第二个任期中,美国对华制裁强度就已大幅提升。特朗普任期内中美贸易摩擦持续升温,美国在芯片等领域也加大对于中国企业的打压。即便是拜登上台,这样一个科技上的竞争、封锁态势,也并没有明显缓和迹象。事实上,国际竞争是由双方实力此消彼长的客观态势决定(图表8),不以人的意志为转移,意味着科技竞争是大国竞争的关键所在,这进一步决定了寄希望于美国主动缓和对中国的科技封锁是不现实的[59]。我们认为,这也意味着欧盟的数据监管理念并不适合于中国,我们还是应该更多的考虑如何促进生产力发展问题,以增强自主创新能力。

四、另一个思路:基于匿名算法的三类平台数据划分

如前所述,平台数据作为一种公共资源,个人、平台企业与政府均有主张权利的合理性,以完全排他性为特点的传统确权思路难以适用于平台数据,而是可以采取将人格权和财产权分开的产权束拆分思路,以兼顾各方对平台数据产权的共享需要。这有点类似于改革开放初期农村土地制度的改革思路,即通过产权束的拆分来兼顾各方对土地的产权主张。在改革开放之初,在坚持土地集体所有的同时,为了最大化地提高农民的生产积极性,出现了以土地所有权归集体和承包权归个人的家庭联产承包责任制,既坚持了土地公有的性质不变,又极大提升了我国土地要素的利用效率。这样一种产权束的拆分思路,在新形势下也面临着挑战。因为产权束的拆分是对生产要素产权的不完全界定,一旦涉及到流转,究竟是所有权还是承包权,应对要素流转有更大话语权的问题就会凸显出来。由于同样采取了产权束拆分思路,类似的要素流转问题也出现在平台数据保护规则的落地中,尤其是在保护好个人数据人格权的同时,如何促进数据由个人向平台企业、由平台企业向社会有序流转存在着一些落地挑战。

(一)个人数据保护规则的落地挑战

1、多少人能够读懂用户协议?

在我们访问网站或者安装应用软件时,企业往往都会按法律要求设置弹窗,提醒用户需要先浏览并同意用户协议,这体现了对用户“知情权”的保护。但实际上,这些用户协议往往冗长且晦涩难懂,以至于平台和用户事实上处于不平等的数据交易地位,调查显示近80%的用户在安装App时“很少或从未”阅读过须知协议,并且用户协议中经常存在“不同意就不能用”的情况[60]。这有点类似于前述20世纪初期的劳资关系互动,看起来用户选择“同意”并将个人数据流转给企业是自由交易的体现,但考虑到双方的不平等交易地位,这种自由交易也仅仅是形式上的自由交易,导致难以真正实现个人数据保护尤其是隐私数据保护的初衷。

针对这一问题,尽管有关部门一直在尝试弥补漏洞[61],但似乎是“按下葫芦起了瓢”。以算法推荐服务为例,在2022年《互联网信息服务算法推荐管理规定》生效后,用户有权关闭平台的算法推荐服务[62],这有助于减少不必要的用户信息收集。不过有用户表示,关闭个性化推荐之后,使用体验变差,推送的很多是不感兴趣的内容,于是又重新同意了算法推荐[63]。对此类问题,有观点提出,企业应注意“不能故意提供过时、低质信息逼消费者打开算法”[64]。当然,监管部门也可以再进一步细化若关闭算法推荐后,哪些范围内的推送是合理的。但可预见的是,由于掌握了大量用户数据,占有数据优势地位的平台总会有新的办法去引导用户选择算法推荐。

另一方面,从企业的立场看,消费者关闭了算法推荐后,用户体验难免会下降。抖音就明确提醒用户,在关闭个性化内容推荐后,“你可能会看到你不感兴趣甚至不喜欢的内容,你的使用体验可能会受到影响”[65]。更重要的是,从公共资源论的角度出发,“知情权”原则应是兼顾用户隐私保护和促进数据流通的双重需求,而非形成用户体验和企业效率的双输局面。因此,即便制定“不同意也可以使用”的规定也未必合理,这意味着个人数据流通到平台企业的激励降低,极大提升了企业使用平台数据的交易成本,不利于平台数据的形成与生产力的发展。

2、可携带权、修改删除权等基础权利如何保障?

在2022年发布的欧盟《数据法(草案)》中,欧盟希望通过强化用户的数据可携带权去打破平台的数据垄断,该法案要求用户可以获取或转移与自己相关的数据,企业应提供相关技术支持,并禁止签订不平等的数据分享合同。对于可携带权而言,已经生效的《深圳经济特区数据条例》中,也明确规定自然人可以向数据处理者要求查阅、复制其个人数据。但是在2022年4月发布的微信8.0.20版本中,用户能快速导出的个人信息仅有头像、名字、微信号等简单信息(进入方式:设置 -> 隐私 -> 个人信息与权限 -> 个人信息浏览与导出),同样属于个人信息范畴的用户的朋友圈、聊天记录等则不能通过此方式便捷获取。

与此相关的第二个问题是用户能否便利地将数据从一个平台迁移至另一个平台。因为很多用户的数据都存放在不同的平台上,如果平台间的数据接口不能互相打通,那么可携带权的有效性将大打折扣。以金融数据平台为例,如果用户希望将Wind上建立的数据模型迁移至同花顺,会面临很多细节处理上的不便,事实上不利于确保数据可迁移性的实现。2018年,美国谷歌、微软、Facebook、Twitter四家平台巨头共同发起了“数据传输计划”项目,旨在打通不同数据平台间的用户迁移通道。应该说这是带有明显数据共享基础设施意义的公共项目,但在历时四年的推进之后,究竟能够什么时候完成仍不得而知[66]。即便是在完成后,如果这些基础设施无法做到无差异的向全部企业开放,则有可能增强少数企业的市场势力,形成数据卡特尔的风险。

对于修改删除权,现实中用户想修改或删除自己掌控的个人数据相对容易,但是如果这些隐私数据一旦外泄,用户想要修改或删除则非常困难。特别是在区块链等基于分布式存储技术的应用场景中,数据一旦上链公开,被同时存储在多个网络节点中,数据后续的修改和删除成本极其高昂。这也就意味着,区块链等技术所宣扬的“数据公开和不可变”的理念与隐私权保护理念可能存在一些冲突,有可能会削弱隐私数据的保护力度。更重要的是如前所述,平台企业可以凭借谈判优势地位来获得个人隐私等敏感数据,如果平台又无需对这些敏感数据进行匿名化操作的话,则可能进一步加大区块链等技术对个人隐私的威胁。

(二)因数确权:基于匿名算法的数据确权思路探讨

总之,即便是在平台数据确权后,尤其在明确个人对隐私数据的人格权之后,如何确保这种保护能够落地,切实避免隐私数据泄漏对于个人造成伤害的同时,最大限度地促进平台数据流通,以发挥平台数据的公共资源优势,依旧是个挑战。这个挑战内在的根源就在于平台数据是一种公共资源,难以将其完整地界定给某个单一的主体,而是只能进行产权束拆分,这决定了数据流转难免遭遇一些落地挑战。

从美国的经验来看,平衡的把握主要是通过“事前规矩较松,事后严格监管”的方式实现的,这有点类似于资本市场上的“注册制”。较为宽松的事前规矩,有利于最大限度调动企业积极性、促进效率,事后的严格监管也有助最大限度的防范违法违规、维护公平。在美国联邦贸易委员会有关隐私保护的事后监管中,最重要的是保证数据收集中无欺诈或非法收集行为,以及没有发生隐私泄露的事件[67]。从中国“注册制”改革的历程看,这样一种监管模式的有效落地并非易事,对于执法资源供给会形成较大的挑战。

除了提高监管的执法水平外,还有一个可以尝试的思路是发展匿名算法,来完善现有的产权束拆分思路。在当前中、美、欧有关个人数据保护的相关法律法规中,都明确了匿名化的数据不在保护的范围之内,这也意味着匿名化的数据是可以自由流通的。在匿名化的基础上,可以探索一条完善产权束分拆的确权思路,即将平台数据划分成原始数据、匿名数据、衍生数据三类,分别将相应的权利划归不同的主体,以满足个人、政府与企业对平台数据的权利主张,实现整体的社会福利最大化。

图表9:通过大力发展匿名算法来完善平台数据确权思路

数据确权主要参与者大数据交易所(基于公共资源论的平台数据确权探讨)(11)

资料来源:中金研究院绘制

1、原始数据:强调隐私,但并非无条件归属于个人

原始数据是指平台直接从个人那里自动采集而来的海量底层数据,很多涉及到用户的个人隐私。除去前期的固定成本外(比如数据收集系统的开发),这类数据采集所需的边际成本几乎为零。同时,由于未投入大量的研发成本进行专门的数据清洗和处理,意味着这类数据的价值密度较低。

不过,原始数据的隐私负外部性[68]很高,一旦泄露,可能会给个人和社会带来的巨大损失,从这个角度出发,个人数据的所有权应界定给个人。这种界定的关键在于并非所有的个人数据都应无条件地归属于个人,只有一旦泄露会给个人和社会带来巨大损失、负外部性极强的个人数据才需要界定给个人。

如果有些个人数据本来就是公开可获得、不存在隐私泄露问题,或者是关乎公共利益的,则相关权利应更多划归社会集体所有。比如用户主动在公开网站上发布和留存的数据不存在隐私问题,因为隐私本质上是不愿意让他人知晓的内容;再比如在公共卫生事件期间,个人的医疗或者出行数据的相关权利也无法完全界定给个人。总之,如何划定原始数据的具体范围是个复杂、动态的问题,理想情况是由消费者、企业、政府多方共同决策。而且即便明确具体范围后,如果没有匿名算法的参与,企业在使用这些数据时依旧需要通过“选择加入”或者“选择拒绝”的模式与消费者进行逐个沟通,这也意味着可能带来较高的谈判和交易成本,不利于数据的流通及其生产力的发挥。

2、匿名数据:强调公平,参考准公共品供给机制以促进流通

匿名数据指的是对个人原始数据进行匿名化之后的平台数据。经过匿名化处理后,原始数据的个人可识别性显著降低,数据确权的目标从保护个人隐私,转向促进数据流通,以最大限度地发挥平台数据的非竞争性优势,最大限度地实现平台数据在企业间以及企业与政府等社会机构间的共享。

如果从尽可能地促进数据流通的角度出发,我们认为匿名数据的确权应像对待电网等自然垄断行业一样,突出其准公共品属性。就具体方式而言,可以采用“政府监管下的企业所有”模式,由骨干平台企业作为经营主体向市场出售匿名数据,由政府监管其销售行为和销售价格,保证其销售行为符合“公平、合理、无歧视”原则,并且价格和利润都在合理范围之内。

另外,如果数据的匿名化处理成为数据流通前的必要环节,匿名算法就会成为数据交易中的一项“基础设施”,匿名数据也将成为平台数据公共资源属性的主要载体。更重要的是,由于匿名算法可以显著降低个人可识别性,这意味着如果原始数据是通过匿名算法加工后才进入到使用和流通的,则最终使用者无需再与自然人进行成本高昂的逐个交易,有助于极大节约数据流通的交易成本,充分发挥大数据作为非竞争性生产要素的优势,以促进生产力发展。

更重要的是,匿名算法的开发不只有利于平台向全社会分享数据,也有助于推动政府数据向全社会分享。事实上,政府作为全社会拥有数据最多的主体[69],政府数据开放对于促进全社会数据的流通至关重要。目前各类基于公共数据的应用不断涌现,例如上海组织各政府部门将数据资源对社会企业有条件开放,参与试点的银行利用公共数据提升了风控能力,降低了中小微企业信贷业务成本,推动了普惠金融的发展,有效挖掘了公共数据的潜在经济价值[70]。未来,要落实政府数据“共享为原则,不共享为例外”[71]的思路,推动政府数据的进一步开放与共享,这需要有效的匿名算法保障,以避免隐私负外部性问题。

3、衍生数据:强调效率,保护企业的数据知识产权

衍生数据是指研发投入成本较高的数据,是在匿名数据的基础上进一步加工和分析得到的。这里衍生数据的研发主要指数据的加工(数据清洗、融合处理等)和分析(统计分析、算法分析等),这些加工和分析大大提升了平台数据的价值含量。衍生性也是平台数据重要的技术特征,凸显了算法等研发投入在平台数据价值创造过程中的重要角色,因为算法开发前,数据的价值密度往往很低,需要通过算法才能凝练出有价值的信息,而且随着数据量爆炸式增长,算法扮演的重要性将越来越大。

在衍生数据的创造过程中,企业对于算法模型的研发投入扮演着关键角色。不同质量的算法会产出不同质量的衍生数据。例如同样基于公开媒体数据,有的数据产品只能做报道摘要,有的数据产品可以帮助企业挖掘市场舆情,不同数字产品价值的高低取决于产品背后各类算法模型的含金量。也就是说,数据之所以能够成为生产要素,很大程度上应该归功于算法模型对于数据内在价值的挖掘,这是海量数据转换为实际价值的关键。因此,衍生数据的确权应更侧重效率,重点在于鼓励算法等创新。也就是说,按照生产关系安排应当服务于生产力发展的确权原则,衍生数据的权利配置给平台企业,有利于鼓励各平台企业持续投入研发资源做算法开发与数据挖掘。

(三)匿名算法大发展的障碍:技术可行性,还是法律可行性?

前文展示了匿名算法在平台数据确权的潜在价值。问题是,技术上能够做到彻底的匿名么?从过往的诸多案例来看,是比较困难的。以1997年美国马萨诸塞州医疗数据隐私泄露事件为例,该州保险委员会为推动医学研究公布了政府雇员的医疗数据,在数据发布前,该委员会为防范隐私泄露风险进行了匿名化处理,但保留了当时看来不具有可识别性的三个关键字段:性别、出生日期和邮编。在数据公布后,MIT研究人员发现如果用一份公开的投票人数据库与此数据库进行匹配,可以识别到诸多公民的身份。后续的研究进一步表明,根据1990年的人口普查数据,87%的美国人都可以通过五位数邮政编码、出生日期和性别组合来进行唯一识别[72]。类似地,个人的搜索关键词、IP地址、cookie等看似不具有可识别性的数据,但只要使用足够先进的再识别技术去匹配其他公开数据,这些数据同样有可能具有可识别性。

如果说上述案例中的隐私泄露尚可归咎于美国数据主管部门对于技术不够了解,那么网飞公司(Netflix)的隐私泄露案则表明,即便是作为世界上最先进的互联网公司之一,也不一定总能满足完全匿名化的苛刻要求。2006年,网飞公司为提高在线推荐的效果发起了一项公开竞赛,邀请全球的算法开发人员基于匿名化处理后的用户对于不同电影的影评信息,预测用户对于未评分电影是否感兴趣。该数据发布不久后,两位美国德州的研究人员就发现可以通过使用外部数据(比如IMDB影评数据)进行撞库分析和交叉比对,从而确定一定比例的用户身份,甚至可以得到一些用户极为私密的隐私信息。这一事件最终导致四位网飞用户提起诉讼,网飞也不得不取消了该项竞赛[73]。这一案例再次表明,匿名化算法在技术上似乎并不是牢不可破的。

但这并不意味着匿名算法的思路不值得尝试。事实上,无论是在数字经济领域,还是在其他领域,从来都不存在绝对的安全。自计算机软件诞生之日起,以攻击软件漏洞为获利手段的黑客攻击就从未停止过,但这并没有成为抑制软件大发展的理由,而是通过软件补丁、安全软件等不断迭代,并配合着打击黑客的法律手段,最终实现软件安全风险的动态控制。因此,面对着匿名算法在平台数据确权和流通方面的巨大潜在价值,即便无法实现技术上的绝对匿名化,也值得尝试推进匿名算法的研发工作。或者说,技术上无法实现绝对的匿名化,并非阻碍匿名算法开发的主要障碍,而在于规则层面对于匿名算法意义的认知。

在这方面,欧盟GDPR所体现的严格保护理念,实际上是值得商榷的。根据GDPR,所谓的匿名化应当是绝对的“无法再识别”[74]。如前所述,这在技术上是不现实的。如果严格按照GDPR的规则来监管匿名算法,结果将会是没有企业愿意开发一个根本不可能实现的技术,会导致匿名算法成为一种停留在法条中的信仰[75],而无法发挥它在平台数据确权与流通中的巨大价值。相较而言,美国对待匿名算法的态度更有弹性、更务实,虽然加州CCPA和CPRA中并未明确使用匿名数据的概念,而是使用了“去标识化”数据的说法,但将其定义为“无法合理地”推断出特定消费者的信息[76],并明确规定“去标识化”数据不受该法案保护,为平台企业研发匿名算法留下了空间。

目前匿名化技术发展迅速,近年来涌入大批技术型的初创企业,相关产品服务大量增长,一些数据的匿名化处理也已经可以初步做到由第三方提供,比如当前阿里[77]、腾讯[78]也都在快速发展相关技术产品。由于相关发展方兴未艾,有关规则的取向可能对匿名算法未来的技术路线形成重要影响。例如,为了尽可能降低因匿名算法在技术上无法实现彻底匿名而可能产生的法律风险,隐私计算技术[79]近来获得了较快发展,这种技术旨在实现“底层数据不流通、数据可用不可见”。这种匿名算法思路虽然在一定程度上有利于规避法律风险,但无法充分发挥平台数据的非竞争性优势,也无法充分体现平台数据的公共资源属性,甚至有可能增强现有数据控制方的市场势力,存在效率损失风险。

因此,可以考虑将匿名算法纳入数据交易的基础设施,作为数据交易和流通的底层保障,由公共部门和私人部门合作,共同提供相关服务。也就是说,在将原始数据通过匿名算法加工形成匿名数据的环节,适合通过政府的介入来体现公共资源属性。这涉及到两个具体问题:一是如何确定匿名算法和匿名数据做到了“无法合理识别”?二是匿名数据的供给具体采用哪种模式?

对于前一个问题,可以参考专利中的标准必要专利模式[80],通过引入专家委员会,基于“公平、合理、无歧视”原则(FRAND原则)来进行决策和监管。标准必要专利指的是为实施某一标准而必须使用的专利,如果一项专利成为了标准必要专利,企业为了使用该标准将不得不向专利权人支付许可费。这与匿名算法和匿名数据有点类似,标准必要专利也具有较强的公共品属性。在目前的实践中,一个专利要成为标准必要专利,需要经过全国专业标准化技术委员会或者归口单位的审批[81]。这类机制也可以被借鉴在匿名算法认定及匿名数据界定中,由政府牵头组织平台、专家、消费者同组建专业委员会,并由政府引导下的专业委员会来设立“无法合理识别”的匿名算法标准,以降低一旦匿名数据被恶意识别后的平台责任风险,增强平台投入匿名算法开发的积极性。

对于后一个问题,考虑到匿名数据的研发投入虽然低于衍生数据,但仍然远高于原始数据,因此还是应该以平台企业为匿名算法和数据的开发主体,可考虑通过“政府监管下的平台企业”的方式来组织匿名算法研发和匿名数据的供给,以解决持续的研发投入激励问题。具体而言,可以参考电信基础服务运营商的模式,在骨干平台企业中,由政府选择若干家来承担匿名算法的开发工作,并要求这些公司成立独立子公司来运营这项业务,并在政府引导下的匿名算法认定委员会对算法合理性进行认定后,允许这些企业广泛使用包括政府掌握的个人数据在内的各类原始数据,以加工成匿名数据,并以管制性的合理低价向全社会无歧视性地广泛供给匿名数据。

五、思考与启示

综上所述,平台数据作为一种公共资源,个人、平台企业与政府均有主张权利的合理性:如果不保障个人对相关数据的权利,不但个人与平台之间没有自由交易的基础,而且数据一旦泄露可能会对个人造成较大伤害;如果不保障平台企业对相关数据的权利,则平台没有足够积极性投入资源去从事算法开发等研发活动,平台数据难以成为真正的生产要素;如果不保障政府对相关数据的权利,则公权力与准公权力之间可能发生边界重叠,既不利于充分发挥数据的非竞争性优势,也不利于平台经济的可持续稳健发展。

这些问题的复杂性导致很难在短期内得到一个普遍适用的最佳确权方案。也意味着,在平台数据确权方案的制定过程中,需要辩证地借鉴欧、美的经验教训,尤其是考虑到当前的国际竞争形势后,应慎重对待“政策理念比市场先进”[82]的欧式数据保护思路,可以重点从有助于生产力发展的角度,探索生产关系的安排。结合全文探讨,具体的思考与启示总结如下。

1、生产关系应服务于生产力的发展,可以作为平台数据确权的基本原则。权利安排并非外生天然的,而是作为一种基本的生产关系,内生于生产力的发展需要。从历史发展规律看,是生产力发展决定了人格权归属于个人。也是技术进步决定了平台数据人格权应归属于个人,这是个人与平台之间实现有效交易的基础。例如,如果个人没有知情权,也就不存在个人数据的自由交易,自然也就谈不上所谓个人数据的有效配置问题。

平台数据作为个人与平台企业的联合创造,还具有研发密集型特点,是平台企业通过算法等研究开发活动,才使得低价值密度的数据“转化”为高价值密度的生产要素。与此同时,平台数据虽然在物理上具有非竞争性,但所产生的商业利益仍具有竞争性。参考美国对政府资助所产生的专利的界定经验,对于平台数据这种具有研发密集型特点的非竞争性公共资源,更适宜界定给企业,以激励平台企业加大算法等研发投入。

2、在充分考虑平台数据公共资源属性的前提下,推动个人相关数据的多方审慎监管。关于个人数据保护,目前各国监管框架仍在探索完善中,欧、美也在保护范围、匿名数据界定等问题上存在明显分歧。个人相关数据虽是平台数据的基础,但“个人数据保护越严格,数据监管理念越先进”的观点值得商榷。因为平台数据更是一种公共资源,除了个人权利之外,还应该统筹兼顾平台、政府等社会主体的权利,以平衡地推动个人相关数据的保护工作。

在具体执行中,可考虑司法机关与行政机关在平台数据确权等数字治理方面形成更良好的互动关系,以审慎探明合理的监管边界。例如,美国司法部在1969年对IBM发起反垄断诉讼,1982年该指控被撤销。这场持续了13年的反垄断官司并非不了了之,IBM在受到指控的1969年就宣布解绑软件服务与硬件销售,成为美国软件服务业发展的助推器。多方参与的审慎监管思路,既有效震慑了被指控对象、维护了竞争,又维护了全社会的创新意愿,避免了过度抑制市场主体积极性。

3、消费者保护虽然是个人数据保护的重点,但不应忽视平台劳动者的个人数据保护问题。数字技术的广泛应用,降低了运用市场机制的交易成本,“劳动者—企业—消费者”的传统商业模式逐渐被“劳动者—平台—消费者”的双边市场模式所取代,出现了以自然人为生产者的个体经济“回归”现象,忽视了这部分平台劳动者的数据保护,有可能形成所谓的“算法剥削”问题。算法之所以能够极限地使用劳动力,得益于平台对于平台劳动者数据的详细占有。

这种数据优势是单向的,就像平台对于消费者具有绝对数据优势一样,平台对于另一侧的小生产者也拥有绝对的数据优势。赋予消费者以个人数据的人格权并进行保护,不只是消费者与平台之间自由交易的基础,也有利于改善消费者的数据劣势地位,以提升对平台的谈判能力。同样的道理,对平台劳动者的个人数据进行某种程度的保护,有助于改善平台劳动者与平台企业之间的数据不平等,进而提升平台劳动者的谈判地位,以提升资源配置的效率。

4、将匿名算法作为平台数据确权和流通的基础设施,通过加大匿名算法开发力度来完善平台数据确权和保护框架。由于个人、企业与政府均有主张平台数据权利的合理性,以完全排他性为特点的传统确权思路难以完全适用于平台数据,而是采取了类似于产权束拆分的思路,将人格权和财产权分开,以兼顾各方的产权共享需要,但这也意味着数据流转难免遭遇一些落地挑战,可以考虑在匿名算法的基础上,完善现有的产权束拆分确权思路。

具体而言,可以将平台数据划分成注重隐私的原始数据、强调公平的匿名数据、以及聚焦效率的衍生数据三类,分别将相应的权利划归个人、政府与企平台业所有。具体可考虑:组织政府引导、多方共建的专业委员会,来界定匿名算法及数据分类标准;依托骨干平台企业的数据及算法积累,来推动匿名算法开发以及个人数据、政府数据向匿名数据的转化;以公平、合理、非歧视原则推动匿名数据共享,以管制性定价推动平台企业向社会各界共享匿名数据。

资料来源

[1] 共产党员网,12371/2019/11/05/ARTI1572948516253457.shtml。

[2] 中国政府网,gov/zhengce/2020-04/09/content_5500622.htm。

[3] 中国裁判文书网,案号:(2021)京0491民初33100号等。本案被告《中国学术期刊(光盘版)》电子杂志社有限公司是知网的主办单位。

[4] 中国裁判文书网,案号:(2022)京73民终36号等。

[5] 中国新闻周刊,zgxwzk.chinanews/viewpoint/2022-04-29/15593.shtml。

[6] 国家市场监督管理总局,samr.gov/xw/zj/202205/t20220513_344850.html。

[7] 谢超、李瑾、彭文生:《企业边界、萨伊定律与平台反垄断》,2021年2月19日。

[8] 如无特殊说明,本文对数字经济领域的数据确权讨论主要聚焦平台数据确权问题。

[9] 图表1介绍了中国与数据确权问题有关的知识产权保护政策框架。与中国的政策框架相比,欧盟还在《关于数据库法律保护的指令》针对不符合独创性标准、无法受到著作权法保护的数据库设计了数据库特殊权利,但要求数据库制作人在内容收集、核准和呈现等方面有实质性投入,而且该权利针对的是对已存在数据的收集和校正,而不能是之前不存在的新生成数据,比如新产生的航班时刻表数据。

[10] 华劼:欧盟数据生产者权利质疑——以知识产权制度安排为视角[J].《知识产权》,2020(01):72-78。

[11] 徐美玲.网络链接的版权法规制综述[J].电子知识产权,2014(08):39-43.

[12] (2010)海民初字第4253号。

[13] 欧盟网站,eur-lex.europa.eu/legal-content/EN/TXT/?uri=COM:2017:9:FIN。

[14] 深圳市司法局,sf.sz.gov/xxgk/xxgkml/gsgg/content/post_7892072.html.

[15] Jones CI, Tonetti C. Nonrivalry and the Economics of Data. American Economic Review. 2020.

[16] Acquisti A, Taylor C, Wagman L. The economics of privacy. Journal of economic Literature. 2016.

[17] 人格权是指民事主体享有的以人格利益为客体、为维护其独立人格所必需的权利。按照《民法典》第九百九十条规定:人格权是民事主体享有的生命权、身体权、健康权、姓名权、名称权、肖像权、名誉权、荣誉权、隐私权等权利。

[18] 从法律术语的角度看,人格权与财产权、隐私权与公开权等概念之间存在联系但法律内涵又不尽相同,但从经济学的角度看,无论是尊严等非货币化效用,还是财产收益等货币化效用,本质上都是人类效用最大化的组成,本文主要从经济学角度对这些概念展开讨论。

[19] 深圳市人大常委会,szrd.gov/szrd_zlda/szrd_zlda_flfg/flfg_szfg/content/post_706636.html.

[20] 欧盟委员会,digital-strategy.ec.europa.eu/en/policies/strategy-data.

[21] 南方都市报,2021年9月15日,epaper.oeeee/epaper/A/html/2021-09/15/content_18911.htm。

[22] 谢超、李瑾、彭文生:《企业边界、萨伊定律与平台反垄断》,2021年2月19日。

[23] 裁判文书网,杭州铁路运输法院(2017)浙8601民初4034号。wenshu.court.gov/website/wenshu/181107ANFZ0BXSK4/index.html?docId=52bffab9fe774da69d5aab0200a272f0.

[24] 2019年7月2日,美国国会众议院金融服务委员会4名民主党议员联名向Facebook高管致函,要求Facebook立即中止开发数字货币Libra及数字钱包Calibra。

[25] 中国政府网,gov/zwgk/2013-01/29/content_2322231.htm。

[26] 目前,花呗、微粒贷、京东白条等互联网信贷产品均已接入中国人民银行征信系统,原由各大互联网金融公司分别占有的信用数据实现了更加开放、互通的流动。

[27] 在法律术语中,权利和权力是两个内涵不同但又存在紧密联系的概念,但在本文经济学角度的讨论中,无需刻意强调两者之间的差别。

[28] 拉古拉迈·拉詹、路易吉·津加莱斯著:《从资本家手中拯救资本主义》,中信出版社2004年。

[29] Forrester Consulting and Dell, Unveiling Data Challenges Afflicting Businesses Around The World, 2021.

[30] 中国政府网,gov/zhengce/zhengceku/2020-08/29/content_5538299.htm。

[31] Investigation of Government Patent Practices and Policies, Report and Recommendations of the Attorney General to the President.

Report of the U. S. Attorney General on government patent policies and practices.

[32] Berman, E. P. (2006). Why do universities patent? The role of the Federal Government in creating modern technology transfer practice. UC Berkeley.

[33] U.S. Government Accounting Office (GAO). GAO report to Congressional Committees: Technology transfer, administration of the Bayh-Dole Act by research universities[EB/OL]. (2019-05-06)[2020-01-06]. nvlpubs.nist.gov/nistpubs/SpecialPublications/NIST. SP.1234.pdf.

[34] 有一些另行规定的情况。

[35] 原文参见科斯在1991年接受诺贝尔经济学奖时发表的演讲:It is obviously desirable that these rights should be assigned to those who can use them most productively and with incentives that lead them to do so…,详见诺贝尔奖官网。

[36] 《马克思恩格斯文集》第9卷第188页,人民出版社2009年版。

[37] 《马克思恩格斯文集》第9卷第189页,人民出版社2009年版。

[38] 谢超、吴云杰:《跨越“新人口陷阱”的可能路径》,2022年5月15日。

[39] enforcementtracker/?insights, 最后一次访问是2022年5月25日。

[40] 谢超、李瑾、彭文生:《企业边界、萨伊定律与平台反垄断》,2021年2月19日。

[41] 《人物》官方mp.weixin.qq/s/Mes1RqIOdp48CMw4pXTwXw。

[42] 刘云.欧洲个人信息保护法的发展历程及其改革创新[J].暨南学报(哲学社会科学版),2017,39(02):72-84.

[43] 欧洲委员会,coe.int/en/web/human-rights-convention。

[44] OECD, Guidelines on the Protection of Privacy and Transborder Flows of Personal Data,oecd/sti/ieconomy/oecdguidelinesontheprotectionofprivacyandtransborderflowsofpersonaldata.htm.

[45] 欧洲委员会,Convention for the Protection of Individuals with regard to Automatic Processing of Personal Data, coe.int/en/web/data-protection/convention108-and-protocol。

[46] 八项基础原则分别是:collection limitation principle(收集限制),data quality principle(信息质量),purpose specification principle(目的限定),use limitation principle(利用限制),security safeguards principle(安全维护),openness principle(公开透明),individual participation principle(个人参与),accountability principle(责任明确)。

[47] O. Lynskey, the Foundations of EU Data Protection Law, Oxford University Press, 2015.

[48] O. Lynskey, the Foundations of EU Data Protection Law, Oxford University Press, 2015. 原文是the fact that the EU had no competence to enact fundamental rights legislation (in 1995)。

[49] 波兰国家个人数据保护办公室,uodo.gov.pl/en/553/1097.

[50] UODO对本案中涉及的公共注册资料做了举例说明,包括:the National Court Register, the Central Registration and Information on Business, the Registry of National Economy

[51] LinkedIn网站上用户可以选择不同的隐私保护登记,按最严到最宽松分别是仅联系人可见、人脉圈可见、网站注册会员可见、全网公开可见。HiQ爬取的是无须注册会员、全网公开可见的个人资料。

[52] cdn.ca9.uscourts.gov/datastore/opinions/2022/04/18/17-16783.pdf.

[53] 加州CCPA于2018年通过,2020年生效;加州CPRA于2020年通过,并将于2023年生效取代CCPA。

[54] CCPA第1798.150条:any consumer whose nonencrypted or nonredacted personal information is subject to an unauthorized access and exfiltration, theft, or disclosure as a result of the business’ violation of the duty…

[55] GDPR第79条:Without prejudice to any available administrative or non-judicial remedy.... each data subject shall have the right to an effective judicial remedy where he or she considers that his or her rights under this Regulation have been infringed as a result of the processing of his or her personal data …

[56] CCPA第1798.150条:if within the 30 days the business actually cures the noticed violation and provides the consumer an express written statement that the violations have been cured and that no further violations shall occur, no action for individual statutory damages or class-wide statutory damages may be initiated …

[57] 谢超、李瑾、彭文生:《企业边界、萨伊定律与平台反垄断》,2021年2月19日。

[58] 2019年之前的数据来自于IMF;2021年的中国实际GDP增速预测来自于中金公司研究部宏观组;2020-2035年美国实际GDP增速预测来自于美国CBO;2022-2035年中国实际GDP增速估算自于《A股十年不涨,未来十年会涨吗?》(谢超等,2019年8月)。

[59] 中金公司研究部、中金研究院著:“第一章 科技创新促进产业链安全与效率”,《创新:不灭的火炬》,中信出版社2022年版。

[60] 《经济参考报》整理了App用户协议中存在“不同意则不能用”、“非明示方式征求同意”、“先收集再征求同意”、“一次同意、次次同意”、“个人信息转送第三方”等条款。xinhuanet/techpro/20220317/677f6df0639c447d85ed863a115b0d9f/c.html。

[61] 比如2019年公布的《数据安全管理办法(征求意见稿)》要求“数据收集使用规则应当明确具体、简单通俗、易于访问”,2021年通过的《深圳经济特区数据条例》要求“数据处理者不得以自然人不同意处理个人数据为由,拒绝向其提供相关核心功能或者服务”。

[62] samr.gov/xw/mtjj/202201/t20220104_338828.html。

[63] 《光明日报》:epaper.gmw/gmrb/html/2022-04/07/nw.D110000gmrb_20220407_1-07.htm

[64] 中国经济网:views.ce/view/ent/202203/16/t20220316_37405410.shtml。

[65] 抖音(进入方式:设置à通用设置à管理个性化内容推荐),最后一次访问日期是2022年5月31日。

[66] datatransferproject.dev/.

[67] 我们梳理了美国FTC过去四年间(2018年5月25日到2022年5月25日)总共64个关于隐私保护的案件,其中有41个案件涉及信息收集中的欺诈行为,22个案件涉及隐私信息泄露,12个案件涉及非法收集信息。ftc.gov/enforcement/cases-proceedings/terms/1420。

[68] 隐私负外部性的概念参考了IMF报告中关于privacy externalities的相关表述,隐私负外部性主要有两个影响机制,一是违背了消费者对于私密性的偏好,二是企业可能会利用消费者隐私信息对消费者进行价格歧视。Carriere-Swallow M Y, Haksar M V. The economics and implications of data: an integrated perspective[M]. International Monetary Fund, 2019.

[69] 国家工业信息安全发展研究中心,2021:《中国数据要素市场发展报告(2020-2021)》。

[70] 普华永道《开放数据资产估值白皮书》。

[71] 《深圳经济特区数据条例》,该《条例》于2021年通过,2022年起施行。

[72] cac.gov/2015-06/01/c_1115473995.htm。

[73] cac.gov/2015-06/01/c_1115473995.htm.

[74] 根据欧盟GDPR定义,anonymous information, namely information which does not relate to an identified or identifiable natural person or to personal data rendered anonymous in such a manner that the data subject is not or no longer identifiable。欧盟Article 29 Working Party也在Opinion 05/2014 on Anonymisation Techniques中指出,the outcome of anonymisation as a technique applied to personal data should be, in the current state of technology, as permanent as erasure, i.e. making it impossible to process personal data.

[75] Paul Ohm, Broken Promises of Privacy: Responding to the Surprising Failure of Anonymization. papers.ssrn/sol3/papers.cfm?abstract_id=1450006.

[76] 根据加州CCPA定义,“Deidentified” means information that cannot reasonably identify, relate to, describe, be capable of being associated with, or be linked, directly or indirectly, to a particular consumer…

[77] aliyun/product/applicationservice/antppc.

[78] sandbox.cloud.tencent/#/.

[79] 隐私计算是指在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合。主要的技术路线有,基于密码学协议的安全多方计算(SMPC);不移动数据移动模型的联邦学习(FL);基于硬件的可信执行环境(TEE)。

[80] 《广东省高级人民法院关于审理标准必要专利纠纷案件的工作指引(试行)》。

[81] chinacourt/law/detail/2013/12/id/147467.shtml。

[82] 根据World Economic Forum官网2019年3月文章“Europe is no longer an innovation leader. Here's how it can get ahead”,When it comes to technological innovation, Europe is now lagging behind not only the US and Japan, but also China…Today, of the world’s 15 largest digital firms, not one is European.

文章来源

本文参考:2022年6月13日中金研究院已发布的《基于公共资源论的平台数据确权探讨》,作者信息为:

谢超 SAC 执业证书编号:S0080520100001

李根 SAC 执业证书编号:S0080121040127

法律声明

向上滑动参见完整法律声明

本公众号不是中国国际金融股份有限公司(下称“中金公司”)研究报告的发布平台。本公众号仅是转发、摘编中金公司研究院或其他专业人士/机构撰写制作的相关研究成果的部分观点,订阅者若使用本公众号所载资料,有可能会因缺乏对完整报告的了解或缺乏相关的解读而对资料中的信息、观点、判断等内容产生理解上的歧义。订阅者如使用本资料,须寻求专业顾问的指导及解读。

订阅本公众号不构成任何合同或承诺的基础,中金公司不因任何单纯订阅本公众号的行为而将订阅人视为中金公司的客户。

本公众号所载信息、意见不构成对买卖任何证券或其他金融工具的出价或征价或提供任何投资决策建议的服务。该等信息、意见在任何时候均不构成对任何人的具有针对性的、指导具体投资的操作意见,订阅者应当对本公众号中的信息和意见进行评估,根据自身情况自主做出决策并自行承担风险。

中金公司对本公众号所载资料的准确性、可靠性、时效性及完整性不作任何明示或暗示的保证。对依据或者使用本公众号所载资料所造成的任何后果,中金公司及/或其关联机构、关联人员均不承担任何形式的责任。

本公众号相关资料所载意见、评估及预测仅为该资料出具日的观点和判断。该等意见、评估及预测无需通知即可随时更改。在不同时期,中金公司研究部可能会发出与本资料所载意见、评估及预测不一致的研究报告。中金公司的销售人员、交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本资料意见不一致的市场评论和/或观点。本公众号可能会转发、摘编其他专业人士/或机构撰写制作的相关研究成果,相关研究观点仅代表其本人/该机构的分析判断,不代表中金公司的观点,中金公司对其中的信息及其观点不做任何形式的确认或保证。

本订阅号是由中金研究院建立并维护的官方订阅号。除非另有说明,本订阅号中所有资料的版权均为中金公司所有。未经书面许可任何机构和个人不得以任何形式转发、转载、翻版、复制、刊登、发表、修改、仿制或引用本订阅号中的内容。

,