申晨
武汉大学法学院特聘副研究员
2022年12月,中共中央、国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”),其中“建立保障权益、合规使用的数据产权制度”被列为首要制度。本文拟以经济学中的交易成本理论为基础,勾勒数据要素的产权形态。并在此基础上,回答数据产权规范中的一个核心性问题:“新型”数据产权的构成要件是什么?
一、对数据产权规范方案的争议总结
数据要素,是指参与到社会生产经营活动、为使用者或所有者带来经济效益、以电子方式记录的数据资源。据此,下文所称的“数据产权”,不针对缺乏效用的数据和不以电子方式记录的数据,也不包含学者提出的以数据基础设施为实现形式的“架构财产权”。当前,我国法学界围绕数据产权的以下三个议题存在重大争议:
第一,数据产权采用何种规范模式?对此,学界首先形成了“非定型化产权”和“定型化产权”的分歧方案。“非定型化产权”方案,是指不需要对数据构建一项民事权利,而仅需按照具体的行为规则、以法律关系的视角对其进行调整。“非定型化产权”方案的核心理由是数据不符合传统民事权利客体的特征,将其固化为“财产权”会破坏数据的流通利用,造成“反公地悲剧”等。其主张通过整合合同法和竞争法规范,采用行为责任的产权规制模式,形成数据利用中界定主体行为合法性的规则体系。“定型化产权”方案则主张,行为责任模式会增加数据交易中的不确定性,故应对数据设立一项定型的民事权利。其中,有观点分别主张以物权、知识产权、商业秘密权等作为规范原型;更多观点则主张,应当对数据设立一种新型的财产权利。
第二,数据产权的归属如何确定?学界存在三种立场:一是“无归属论”,即“归属式”产权仅针对的是私用品(private
goods),即同时具有排他性(exclusive)和竞争性(rival)的资源。而数据可以为不特定多数主体享有,因此属于一种“公共产品”。二是“数据生产论”,即根据劳动赋权理论,或基于数据处理能力,认为对数据投入劳动的数据生产者应当享有数据产权。三是“数据持有论”,即需基于当前由哪个主体合法持有数据以确定产权。例如认为,数据持有权包含了权利主体对数据进行支配、管理和获取数据利益的权利。
第三,公共数据、企业数据、个人数据的分类如何影响数据产权规范?“数据二十条”提出了公共数据、企业数据、个人数据的分类。虽然有学者认为这一分类存在瑕疵,但多数观点对该分类表示了认同。对于这一分类将如何影响数据产权,第一种理解是,公共数据、企业数据、个人数据涉及不同的法律关系,应当在不同产权规范路径下展开规制。第二种理解是,可采用“权利束”,将公共数据、企业数据、个人数据中的不同法益均包含在一种综合性的“确权”方案中。第三种理解是,数据产权规范应被纯化为对企业数据的调整;个人数据、公共数据规范应反映为数据产权的外部限制规范。
应当认为,以上分歧并未彻底回应几个关键的逻辑问题:第一,为什么传统社会没有普遍意义上的数据产权,而数字经济时代却需要独立的数据产权制度?第二,数据产权相较于物权、知识产权等传统产权到底“新”在何处?第三,数据在任何条件下都能够形成产权吗?或谓,数据产权的构成要件是什么?
二、交易成本理论视角下的数据产权
数据产权的共识是建立在对数据的资源价值的确认上。但“资源”并不等于“产权”——社会生活中,大量具有资源价值的对象,例如空气、太阳能、非记录式的信息等,立法者并未对其设立产权。在立法史上,物权、知识产权等传统产权的规范构建,主要是基于社会实践经验和商业惯例的积累,因此理论上并未纠结“为什么需要产权规范”。而及至20世纪,产权经济学理论尝试给出了对这一问题的回答。
根据产权经济学理论,产权的存在,主要是为了解决存在交易成本时,如何通过初始权利配置提高资源利用效率的问题。交易成本(transaction
cost),是指市场中转让和保护财产所需要支付的成本。科斯(Ronald H.
Coase)认为,当交易成本为零,依靠自由市场即可实现资源配置效率的最优,其与初始的权利分配无关;但由于交易成本的存在,前述理想情况往往难以出现。因此,初始权利配置将会实际影响市场效率。就产权如何影响市场效率的实例,可以参考哈丁(Garrett
Hardin)所举的“公地悲剧”(tragedy of commons)。
由此,巴泽尔(Yoram
Barzel)进一步指出,产权可以理解为“经济权利”和“法律权利”两个层面。“经济权利”指在考虑交易成本时,主体在市场中能够实际期望得到的利益。即,由于交易成本的存在,主体在支付一定的额外费用后,所能真正享有的财产交换价值。“法律权利”则指在市场中,法律所明确承认和保障的主体的财产利益,其作用在于使“经济权利”得到公权力的有效保障。此即本文所研讨的规范层面的“产权”。
很显然,在产权理论中,交易成本是影响市场资源配置的核心因素。交易成本一旦高于财产交易的潜在收益,就无法通过财产交易消化交易成本本身,交易就不会发生。此时,“法律权利”的设置并无意义——无论将产权配置给交易的哪一方,都不会促成交易的达成。但如果交易成本可以被控制在交易的潜在收益之下,那么“法律权利”的设置就有了提高市场效率的作用:第一,如果交易双方可以协商一致,且一方已经为交易成本支付了特定费用,则法律应当肯认其对消除交易成本的贡献,赋予其相应范围的权利,从而促进交易达成;第二,如果交易双方无法协商一致,则法律可以通过将产权配置给对财产评价更高的一方,从而避免协商,使得交易成本不再需要被支付。此即法经济学理论中的“规范的科斯定理”和“规范的霍布斯定理”。
据此,“法律权利”的制度功能,在于使产权规范尽可能地通过以上两种途径促成“经济权利”的实现,防止由于法律预期的错误或法律保护的不足,导致市场主体已支付的交易费用白费,或不合理地增加市场主体的交易成本。在数据场景,生产要素,是指用于生产物品和劳务的投入。根据“生产总成本=要素成本+制度成本”这一公式,数据产权的规范设计即是在承担确定的制度成本的前提下,尽量使该制度之下的数据要素成本降低。而这有“优化存量”和“扩大增量”两种途径:第一,如土地、资本、劳动等生产要素,数据可以在自由市场中通过交易提高其利用效率。第二,不同于土地、资本、劳动等生产要素,数据具有衍生属性,即原始数据经过加工,可以产生具有新效用的衍生数据。因此,如果利用衍生数据的收益高于获取原始数据的成本,即可以激励数据衍生,提高要素供给量。
当前,已有不少学者关注到交易成本理论在数据产权规范中的论证作用。本文拟首先微观分析数据在市场交易中存在的各种交易成本,再据此确定作为数据产权规范核心内容的数据产权构成要件。
三、基于市场分类的数据产权构成要件分析
(一)数据要素特性导致的特殊交易成本
数据产权的独立调整需求来源于数据要素的独特属性。在既有研究中,不少文献均指出了数据要素的诸多特性,例如数据随主体行为附随产生、数据利用关注场景、数据具有非竞争性等,亦有学者围绕这些特性对数据产权规范产生的影响进行了分析。本文认为,数据要素的特性中,对产权规范有重要影响的是以下两项:
1.可复制性
可复制性是指数据突破了物质层面的有限性,可以对自身进行复制,且复制所得的数据与原数据具有客体同一性。据此,将数据作为生产要素投入市场时,会发生如下现象:①由于数据的复制并不会损耗原数据的效用,因此市场中可以有多个主体同时利用数据,进而导致非排他式的资源配置状态广泛存在。②主体复制数据,即增加数据产量的边际成本,往往为零或接近于零。由此,随着数据的复制流转行为,市场中该数据的供给量将不断增大,数据的交易价值会不断降低。③主体欲持续实现数据交易的获利,则需寻求对数据后续流通的限制,以防止交易对象对数据进行任意复制流转,这会导致数据权利的排他性需求。④如果数据被赋予排他性权利,则会使市场中的其他主体无法通过成本更低的渠道获取该数据,进而抬高数据利用和衍生的成本,乃至阻碍交易的发生。
综上所述,我们可以根据可复制性,概括出数据交易中存在的两项特殊交易成本:
第一,“监督成本”。“监督成本”是由数据权利主体承担的成本。当权利主体试图通过限制数据后续流通的方式扩大其获利时,其必须采用一定的手段,确保交易对象不会在完成交易后自行复制和流转该数据。数据交易中常见的监督途径是:对数据采取“保密措施”,即在技术层面维持数据的秘密状态;通过法律责任限制交易对象的流通行为。而上述措施,必然会带来构建保密系统、监督交易对象违约或侵权等的成本。
第二,“阻碍成本”。“阻碍成本”是在数据交易中,由交易对象潜在承担的成本。当数据被赋予排他性权利时,其将阻碍市场中的主体通过其他渠道获得该数据,而使其只能接受与排他权主体磋商形成的数据定价。该定价如果高于通过其他渠道获得该数据的价格,则其差价实际是交易对象所需额外支付的成本。“阻碍成本”是信息客体所特有的交易成本,对于有体物财产一般并不成立。但也并非一切数据均具有“阻碍成本”:如果该数据只有获取的“唯一渠道”,则不会产生“阻碍成本”,因为交易对象并没有通过其他渠道获取该数据的可能。
2.效用不确定
在传统的有体物市场中,物品效用往往被视为是固定的。这是因为:首先,有体物中的人为产物,如工业产品等,本就是按一定的功能效用设计的;其次,有体物基于物质有限性,客观上只能在一时发挥一项效用。但数据作为一种信息,其性质有所不同:首先,信息是一种多级多质的客观存在,其社会效用取决于其对客观世界的有序化表达程度,即为人类消除不确定性的程度。因此不同主体可以对数据进行主观化、差异化的解读,从而形成不同的数据效用。其次,数据的可复制性,决定了数据的不同效用可以在市场中同时发挥,互不影响。因此如果数据存在多重效用,就不能将其视为固定效用的分析对象。最后,数据还具有所谓的“自生性”和“协同性”。即A数据本身可能不具备效用,但A数据衍生出的B数据则具有效用;或A数据和B数据本身均不具有效用,但二者结合却能产生效用。由此,数据的效用具有高度的不确定性。
对于效用不明确的数据,由于其供求信号不明,将导致两种特殊交易成本的产生:
第一,“匹配成本”。有体物市场基于供需均衡达成交易匹配和形成价格。但对于效用不确定的数据而言,其需求无法确定,这就导致其难以通过一般的供求信号匹配交易对象和价格。由此,交易主体就需要支付额外的“匹配成本”以达成数据交易。实践中,主体有两种可选择的交易匹配方式:一是在市场中努力寻找潜在交易对象,并与之逐一磋商寻求交易撮合;二是将数据置于某个公开交易场所,让潜在的不特定交易对象主动上门寻求交易。其中,前者需要主体承担寻找交易对象的成本;后者需要主体承担建设公开交易场所的成本。
第二,“加工成本”。数据的效用不确定性来源于数据的“无序”,因此,主体为了更能够吸引数据的交易对象,会选择对数据进行一定的收集、整理、清洗和加工等行为,增加数据的有序化程度以提高其需求。但是上述行为往往伴随着主体劳动力、创造力或其他金钱、时间成本的付出,因此这种数据的“加工成本”也构成一种潜在的数据交易成本。
(二)四种数据市场中的数据产权构成要件
有学者根据实践经验将数据交易的模式概括为以下几种:①直接交易模式,即数据提供者通过自行寻找或个体中介,匹配到数据需求者,进而通过双边协商、以合同直接从事买卖;②交易所模式,即双方通过数据流通集散场所,进行数据供需的匹配和交易;③资源互换模式,如网络平台以提供网络服务的方式,交换获取用户数据;④会员模式,即由数据提供者构建数据存储中心,不特定需求者注册会员后,即可获得数据访问权限;⑤数据接口模式,即由数据提供者提供数据访问接口(API),控制需求者的数据访问权限;⑥加密交易模式,即通过技术手段,将已加密的数据交易给数据需求者;⑦知识产权交易模式,如交易数据形态的著作权、专利权、商业秘密客体等。在实践中,交易者会根据自身禀赋,选择交易成本对自身有利的模式进行交易。这就导致最具市场效率的产权配置状态,也可能呈现出不同的结果。下文按照以下两个与数据特殊交易成本相关的线索,对以上模式进行了重新分类:
第一,公开交易还是非公开交易。非公开交易,是指在出卖人和买受人之间一对一展开的数据交易;公开交易,是指出卖人将数据置于公开交易场所(如交易所、会员中心等),使有需求的买受人前来与之交易。公开/非公开交易模式的区分,主要是基于数据交易中“匹配成本”的不同。非公开交易,交易者所需支付的“匹配成本”,是寻找一对一交易对象的成本。这一成本的特征在于:一方面其没有支付成本的门槛,任何主体只要愿意在市场中询购,均有可能达成交易。另一方面其具有高度的或然性,即交易者可能“运气好”,仅支付少量成本即匹配到交易对象;也可能“运气差”,支付大量成本仍然无法匹配到交易对象。而在公开交易中,交易者所需支付的“匹配成本”,是建设公开交易场所的成本。即权利主体需要通过某种方式公示其持有特定的数据,并设置一定的交易程序以供不特定对象前来与之交易。这一“匹配成本”是一种固定成本投入,且通常需要借助相应的技术或设施,其支付具有一定的门槛。
第二,交易是否对数据的后续流通进行限制。对数据后续的复制流通进行限制和监督,往往需要高昂的“监督成本”。在非限制交易中,权利主体选择不支付“监督成本”,从而降低交易的整体成本,促成交易的达成;其劣势在于,权利主体无法控制数据后续流通对数据交易价值的贬损。而在限制交易中,权利主体选择限制数据的后续流通,以达成对数据交易价值的垄断,但“监督成本”的支付一方面会提高交易的整体成本;另一方面还可能基于“阿罗信息悖论”,而进一步提高“匹配成本”。所谓的“阿罗信息悖论”,是指由于对数据采取“保密措施”,使得潜在的交易对象无法知悉数据内容,进而无法确定是否要达成交易。
根据以上两条区分线索,我们可以将数据市场划分为四个象限:
图1 数据市场分类象限图
1.“一般买卖”市场
数据交易可通过非公开、非限制的方式,即交易主体从事一对一、不附加后续限制条件的模式展开。由于这种模式跟一般买卖合同比较相似,故可称为“一般买卖”市场。
“一般买卖”市场是最没有门槛的数据市场,也是传统社会中信息的主要交易模式:主体在生产和社会交往中会产生大量信息,但这些信息是否可以被用作生产要素,多数情况下并不确定。由于潜在收益不明,主体往往会采用在市场中“碰运气”的方式,试图寻找对信息有需求的交易对象。当主体判断寻找交易对象的成本高于潜在收益时,交易努力将终止,信息处于不发生流通或因主体免费分享信息而使其流通的配置状态;当主体在支付超额成本之前寻找到交易对象时,交易则会发生。这一市场模式下的资源配置表现,就是传统社会中,信息大多数情况下处于免费流通的状态,仅在少数情形下产生零星交易,且存在大量未能流通的信息。
当前,“一般买卖”市场也广泛存在。例如,直接交易模式中,交易双方通过一对一渠道匹配供需,并进行双边协商式的非加密数据包交易,即典型的“一般买卖”。又如,资源互换模式中,广大网络用户选择将个人操作数据(非个人信息数据,因为其受到额外的法律保护),以“新人福利”、提供附加服务等形式“交换”给网络服务商,本质上也属于“一般买卖”。上述交易均符合两个特征:第一,由于是非公开交易,交易的达成并未经过充分的市场博弈;第二,由于是非限制交易,作为交易客体的数据很可能由于复制行为而丧失稀缺性。
在“一般买卖”市场中,对数据赋予排他性产权缺乏效率意义,这是因为:第一,由于数据的后续流通未受限制,其“监督成本”极大,即使赋予主体排他性产权,也难以阻止后手从交易相对人手中复制该数据,权利实现极为受限。第二,在“一般买卖”中,主体所需支付的额外费用,是寻找一对一交易对象的“匹配成本”。而该成本处在一种或然性的支出状态——主体基于对数据价值的主观考量来决定支出多少费用;且支出与否还受主体是否勤勉、是否愿意雇佣中介等主观因素的影响。因此,对其权利赋予排他性以使其独享交易收益,未必会显著提升交易效率。第三,排他权意味着市场中的其他主体需要支付“阻碍成本”,而非限制交易的数据本身可能由于被复制而并不稀缺。此时,如果主体对数据进行高额定价,或从事交易不够勤勉,其权利反而会阻碍其他主体以更低的成本、通过其他渠道获得该数据。
由此,“一般买卖”市场中的数据产权,处于“法律权利”无意义状态:首先,过高的交易成本难以确定性地被交易收益所覆盖。其次,由于主体支付“匹配成本”费用的或然性,不能依据“规范的科斯定理”,认为赋权一定有利于促进交易。最后,若赋权给数据主体,则其未必是对财产评价最高的一方,且将导致“阻碍成本”的产生;若赋权给交易对象(即排除数据主体的权利),则数据主体可能选择继续隐藏数据,同样会产生效率损失。由此,也不能根据“规范的霍布斯定理”,认为赋权一定能减少协商失败带来的损失。此时,“法律权利”并不会确定性地提高市场效率——这也是传统社会中信息未被普遍赋予产权的根本原因。
据此,在“一般买卖”市场中,主体虽然基于对数据的持有事实而享有对数据的支配权,但这种权利却不应当被法律赋予排他性的产权保护。在经济学中,这种有支配性而无排他性的商品被称为“公共品”(public goods)。
2.“付费访问”市场
这一市场以公开、非限制的交易方式开展,权利主体设置一个公开交易场所吸引不特定对象前来交易,且不限制数据的后续流转。其往往表现为不特定对象支付一定费用即可访问数据,故可称其为“付费访问”市场。前述的会员模式即典型的“付费访问”。
虽然理论上,一切数据都可以通过“付费访问”市场进行交易,但实践中,该市场中的数据通常不是能被轻易复制传播的单一、简单数据,而是被大量收集、整理后形成的集合性数据。其原因在于:在“付费访问”模式下,数据可供不特定对象访问,且主体无法阻止数据的后续复制,故数据一旦开始不受限制地流转,主体将很可能因数据的传播而丧失交易机会。而该模式的获利逻辑,是通过多次交易摊薄、消化其固定成本,交易机会的丧失会导致固定支出的公开交易场所建设、数据收集等成本难以被消化,进而导致交易模式的失败。举例而言,尽管主体可以对一条单一数据设置付费访问的链接,但在有交易对象复制该数据后,交易对象即可向外扩散该数据。此时,由于交易对象复制数据的边际成本,明显小于数据主体支出的固定成本,故交易对象可以以更低的价格(甚至免费)流转该数据,从而导致原链接的访问需求不断减少——只要交易对象足够多,大概率会有试图套利的主体出现,进而导致原主体的交易模式失败。但是,如果付费访问数据本身是一项数据集合,则“付费访问”模式仍有成功可能。这是因为:首先,交易对象要取代原主体的市场地位,则需要复制、存储整个数据集合,但复制、存储大量数据本身需要额外的固定成本支出;其次,如果交易对象仅复制数据集合中的某一些数据,则由于市场中其他主体对集合中单一数据的需求并不明确、统一,交易对象的传播行为并不会导致原数据集合的市场需求完全消失;最后,数据集合本身规模越大、特征越特殊,原主体举证证明数据集合的复制源就越容易,其越有可能利用法律工具进行反制。
在“付费访问”模式中,仍然存在如“一般买卖”模式中的“监督成本”和“阻碍成本”问题,因此从效率角度分析,主体同样不应被赋予绝对排他权。也就是说,交易对象对所访问的数据进行进一步使用、加工或非经营性流转时,权利主体也不应能够主张排他性保护。但是,主体支付的以下费用,应当构成法律对其赋予部分排他保护的理由:其一是建设公开交易场所,如租用服务器、建设和维护网站、进行广告宣传等的费用。公开交易场所的存在,使得数据交易中的供需匹配有了支点,“匹配成本”得以大大降低。其二是对数据资源进行收集、整理、清洗和加工,以形成“有序”的集合性数据的费用,此即前文所述的“加工成本”。
主体支付的上述费用,使得法律应当通过产权保护的方式,确保其交易模式的有效性。而能够使“付费访问”模式失效的行为是:将数据集合进行全部或大量复制,再对所复制的数据从事经营性交易;或将数据进行大范围传播,导致原主体丧失经营性交易的机会。很显然,如果其他市场主体实施了上述行为,则原主体的交易机会将被分流,且其预先支付的“加工成本”会被“搭便车”。由此,“付费访问”中,主体应当获得对该数据集合进行公开交易的排他性权利。由于这种排他性权利具有专营属性,因此本文将这种产权形态称为“专营排他”产权。
但是,这种“专营排他”产权还应当具有如下豁免机制:如果其他主体持有的相同或类似数据,并非复制于“专营排他”权主体,而是由其自己收集、加工所得,即自己支付了“加工成本”,那么该主体仍有权对该数据实施经营性交易。这一豁免机制的原理在于“阻碍成本”的存在。即,如果权利主体支付“加工成本”就能够获得完全的“专营排他”产权,那么市场中的其他主体,就只能接受该权利主体的定价,这就阻碍了交易对象通过其他支付“加工成本”的主体而以更低价格获取该数据的可能。因此,其他主体如果以自己支付“加工成本”的方式取得该数据,亦得享有“专营排他”产权。此时,两项产权得相互对抗竞争。
综上所述,对于“付费访问”市场中的数据,当其满足作为支付了“加工成本”的集合性数据的条件时,可以获得“专营排他”产权的保护。这类产权在实证法上的实例,即当前被广泛讨论的数据库权利。学者主张,这类权利的构成要件应当包括:第一,数据集合的条目处于公开状态;第二,具有实质量的数据条目;第三,收集者付出实质性的收集成本。这一认知与前述通过交易成本分析得出的结论基本一致。学者也将其称为“有限排他权”。
3.“保密授权”市场
这一市场以非公开、限制的交易方式开展,数据持有主体为数据设置“保密措施”,以限制他人对其进行复制流转;同时以授权使用的方式允许交易对象在一定权限内使用该数据。当前实践中的API交易、加密数据交易、商业秘密数据交易等,均属于这一模式。
“保密授权”市场中,权利主体一方面对数据进行了保密的技术处理;另一方面又以违约、侵权等法律责任的追究限制对外泄露数据。通过保密和追责费用的付出,其能够有效限制数据的后续流通,一定程度上克服了“监督成本”问题。此外,主体还隐形承担了由于“阿罗信息悖论”带来的“匹配成本”损失。由此,法律应当赋予主体排他性的产权保护,以防止主体已支付的费用落空。
但是,“保密排他”产权也应具有相应的豁免机制:如果其他主体能够证明,其所获得的数据并不是来源于对保密机制的破坏,而是通过自我搜集、反向工程、权利人自行披露等合法方式,则其仍能享有对数据的合法权利。这一豁免机制的存在也是基于“阻碍成本”,即当市场中存在保密机制以外的其他渠道能够获取该数据时,则权利主体已经支付的费用,并不足以成为要求其他主体承担额外“阻碍成本”的有效理由。因此,“保密排他”产权并不是一种针对所有市场主体的绝对排他权。
据此,当数据主体对数据设置了“保密措施”,并通过“保密授权”市场交易数据时,其应当享有这样一种法定的“保密排他”产权:凡是在技术或法律层面破坏“保密措施”,致使市场中的其他主体绕过保密机制而获取数据的,则该主体不得享有该数据的利用权限。“保密排他”产权在实证法上的实例,即是已经被广泛承认的商业秘密权。
4.“公开许可”市场
“公开许可”市场是以公开、限制的交易方式开展,权利主体向不特定的潜在交易对象公开其持有的数据;同时主张未经其许可,任何主体不得擅自对该数据进行流通利用。
很显然,“公开许可”这一交易模式对于数据而言通常难以实施。因为数据已经向公众暴露,其他主体可以任意复制和流转该数据,原主体欲主张排他性地获取交易收益,其“监督成本”将无限大。由此,“公开许可”模式的成立有两项先决条件:第一,主体需要以一种可行的公示方式,在数据客体与权利主体间形成唯一的对应关系,并使市场中的其他主体均认可该对应关系。由此,非恶意主体即可以避开权利主体主张的权利范围;而恶意主体实施了权利侵犯行为,权利主体也可以通过被“唯一化公示”的关系主张侵权责任。第二,主体所主张的数据客体与权利主体间的排他关系,还需要得到立法者的认可,获得立法者给予的保护优待。也就是说,绝对排他的“法律权利”的存在,本身就是“公开许可”模式可行的前提之一。
然而,前已述及,对于数据客体,立法者并不会平白无故地给予产权保护优待。当主体单纯主张“公开许可”交易时,正常的做法显然是否定其排他主张的法律效力:“公开许可”意味着对数据利用权限的垄断,将为其他主体带来“阻碍成本”;且越是获取难度低的数据,被主张“公开许可”时带来的“阻碍成本”越大。因此,“公开许可”主张获得立法者认可的途径仅可能在于,该数据的获取来源具有独特性和困难性,以至于使立法者相信,如果不赋予权利主体以绝对排他保护,将无法激励这种创新性成果的产生——“阻碍成本”的考量,显然以数据客体已经产生为前提。换言之,此时立法者认为,对这类数据赋予绝对排他权保护所带来的相对收益,要高于“阻碍成本”对市场效率的破坏。
由此,在“公开许可”市场中,如果数据能够完成“唯一化公示”,且具有足以获得法律认可的创新性,法律应当例外为其设置一项绝对排他性产权。此种通过“公开许可”方式对公开性信息进行产权交易和保护的模式,就是实证法中著作权、专利权等知识产权的规范模式:著作权、专利权系通过作品发表、专利授予等方式,完成客体与主体间的“唯一化公示”;且其获得排他性保护的实质理由即在于鼓励创新。换言之,对于数据形态的作品、软件、技术方案等,权利主体可以主张绝对排他权,申请将其纳入著作权、专利权的保护范围。
综上,基于市场分类,数据在符合相应构成要件时,将形成四种不同的产权形态:
表1 基于市场分类的四种数据产权形态
四、“新型”数据产权的构成要件
以上对四种数据产权形态的梳理,可能会带来如下质疑,既然数据产权问题已经可以借由数据库权、商业秘密权、著作权、专利权等既有或正在讨论成熟的产权规范予以解决,那么是否还有必要讨论一种“新型”的数据产权规范?笔者认为,对这一问题的回答,需要结合数字经济时代到来后数据交易成本的新变化来分析。
(一)“新型”数据产权的产生条件
进入数字经济时代,数据的经济价值得到了进一步开发和利用。而数据交易基础设施的形成,以及新型数据技术的应用,也导致了数据市场中的交易成本变化:
第一,中心化数据交易场所的形成。数字经济时代,在数据平台基础之上形成的数据交易所,可以为数据交易提供了中心化的场所,使数据交易的“匹配成本”因规模化效应而大幅降低:首先,对于原先采用非公开交易形式进行数据交易的主体,其不再需要支付一对一寻找交易对象的不确定的“匹配成本”,而是可以较低的固定成本(支付入场费)进入公开数据市场。其次,对于原先采用“付费访问”形式参与数据市场的主体,交易所可以为该场所内的所有数据主体搭建统一的数据系统,并在系统内标记其数据权利。由此,主体将不再需要单独支付构建场所的“匹配成本”,而只需占用统一交易场所中的一个“摊位”。很显然,数据交易所的存在,大大降低了市场主体以公开交易形式参与数据交易的门槛和代价。
第二,保密数据公开交易的实现。在数据市场中,主体之所以选择“保密授权”市场,是因为数据持有者往往无法解决“保密”与“公开”之间的矛盾,即如何让数据既处于公开交易场所,又使其内容不被不特定对象知悉。随着技术进步,数据的“保密措施”可以通过计算机系统的操作权限来实现。由此,通过数据访问控制技术的设置,可以形成使数据入口公开可获得,但交易对象无权限复制数据的权限状态。而使保密数据公开交易实现的另一种方式,则是对数据采用同态加密、差分隐私、联邦学习、安全多方计算等加密技术,使得主体能够在不暴露原始数据的前提下,仍然能够将数据本身或数据效用流转给交易对象。基于技术进步导致的保密数据公开交易的可实现,尤其是数据交易的“可用不可见”,使得数据交易的“监督成本”得以显著优化。
第三,数据权利“唯一化公示”方式的创新。著作权、专利权产权形态基于数据权利的“唯一化公示”,其实现是通过作品发表所形成的作者身份与作品独创性的对应关系,或专利审查授予。但对于缺乏高度创新性的数据,其并不存在上述公示方法。在交易实践中,诸如“数据水印”技术的应用,由于缺乏权利公示所需要的公信力,也无法完全达成公示效果。随着数字技术的发展,以区块链技术为代表的技术手段,已经可以实现数据权利在群体中的“唯一化公示”。通过数据“上链”的方式,数据的权利人将被链上的全部主体有效识别。并且,区块链技术还可以有效记录一项被公开交易数据的后续流通的全部过程,并可通过智能合约等技术手段强制后续交易对象向前手权利人付费。在这一模式下,数据交易的“监督成本”将被极大减少。并且,区块链技术还可以与数据产权登记制度相结合。
综上,数字经济时代的技术和制度进步,导致数据交易中的各种成本降低。而这些现象又指向了同一实践发展方向。即,由于原先的非公开市场主体面临的“匹配成本”问题,以及非限制市场主体面临的“监督成本”问题,都得到了相当程度的优化,实施既“公开”又“限制”的数据交易的门槛开始不断降低。由此,原先存在于“一般买卖”“付费访问”“保密授权”市场的交易数据,均出现了向“公开许可”市场集中的趋势。
但另一方面,在传统“公开许可”市场中,只有满足法定创新要求的数据才能够得到产权保护。由此,在数字经济时代,当大量不满足法定创新要求的数据涌入“公开许可”市场时,其能否以及在何种条件下能够获得排他性的产权保护,不无疑问。
(二)“新型”数据产权的实质和形式要件
“公开许可”市场中,主体自我主张的是一种绝对排他的产权保护,该主张是否能够获得法律的认可,依然可以通过交易成本分析、进而考察“法律权利”的设置能否提高市场效率予以验证。试以其他三个市场象限向“公开许可”市场象限的集中为线索,分别予以分析:
第一,就“保密授权”市场向“公开许可”市场的转移。在数字经济时代,保密技术的改进使得采取“保密措施”的数据可以参与公开市场交易,但其“保密排他”的产权效力依旧成立:由于权利主体支付了采取“保密措施”的费用以克服“监督成本”,立法应当明确,其他主体不得破坏保密机制获得该数据的使用权限,以确保主体支付的费用不会白费。但与传统市场一样,基于“阻碍成本”的考量,当其他主体并非通过破坏保密机制、而是通过其他渠道获取该数据时,数据权利主体不享有排他性保护。换言之,此时主体主张绝对排他产权保护的前提,除对数据采取“保密措施”外,还在于市场中只有其掌握了该数据的获取渠道。
第二,就“付费访问”市场向“公开许可”市场的转移。在数字经济时代,支付了“加工成本”的集合性数据欲实施“公开许可”交易,则应当首先对数据采取“保密措施”,或实施数据权利“唯一化公示”。否则,权利主体无法对数据的后续流转进行监督,也就没有主张绝对排他保护的可能。事实上,“保密措施”或“唯一化公示”实施成本的降低,正是此类数据进入“公开许可”市场的前提。此外,对于“专营排他”是否足以升级为“绝对排他”,立法者需要考量,赋予权利主体绝对排他保护是否能够提高市场效率。很显然,支付“加工成本”,相较于数据知识产权所要求的创新性,其门槛相对较低。但一方面,权利主体支付“加工成本”,毕竟为市场提供了新的数据资源,如果不给予其排他性保护,将使得其他主体可以“搭便车”,不利于激励数据要素供给;另一方面,赋予权利主体排他性保护,虽然有使其过分垄断数据交易利益的嫌疑,但也会促进规模化“加工成本”的付出,使得数据加工不会由于获利空间的有限而始终处于初级加工阶段。但是,为防止绝对排他壁垒对市场效率的破坏,该产权形态基于“阻碍成本”考量的豁免机制依然存在。即,如果其他主体也是通过支付“加工成本”来获得该数据,则对该数据同样享有产权,二者得相互对抗。
第三,就“一般买卖”市场向“公开许可”市场的转移。“一般买卖”市场中的数据欲在“公开许可”市场中寻求产权保护,则同样需要在采取“保密措施”或实施数据权利“唯一化公示”之间择一为之。并且,基于“阻碍成本”的考量,即使数据持有者进行了保密或公示,立法者也并无理由当然赋予其绝对排他保护,否则市场中的其他主体无疑将随时随地、承担巨额的“阻碍成本”。此时,权利主体可以通过证明“阻碍成本”考量的不必要性,来获得绝对排他保护的法理支持。其途径有二:第一,如果权利主体能够证明该数据只能通过其掌握的“唯一渠道”获取,则将不存在“阻碍成本”;第二,如果该数据为支付了“加工成本”的集合性数据,则虽然存在“阻碍成本”,但根据前文结论,赋予其绝对排他权仍有效率。
综上所述,通过合并同类项,我们可以发现,在数字经济时代,尽管各类数据均有进入“公开许可”市场的可能,但只有符合一定构成要件的数据,才能在“公开许可”市场形成绝对排他产权。而由于此时数据所需满足的要件,与传统“公开许可”市场中的著作权、专利权等产权的要件并不一致,因此在实证法层面,其无疑应当构成一项“新型”的数据产权。具体而言,这种“新型”数据产权应当同时符合以下的实质要件和形式要件:
首先,在数据的实质内容层面,其需选择性满足以下二者之一:①数据具有获取的“唯一渠道”;②权利主体单独为集合性数据支付了“加工成本”。“唯一渠道”或“加工成本”作为实质构成要件的原理在于,绝对排他权的成立需要克服数据利用的“阻碍成本”。“唯一渠道”要件的法理基础,是证明“阻碍成本”并不存在。当数据仅能通过特定个人、企业或政府的特定行为而收集、计算或附随产生时,权利主体即有了主张绝对排他权的正当基础。但“唯一渠道”要件的要求,显然低于著作权、专利权的创新性要求。“加工成本”要件的法理基础,则如前所述,在于赋予权利主体绝对排他权的效率收益,总体大于“阻碍成本”带来的效率损失。
需要注意的是,上述两项实质要件,均有被其他主体“破解”的可能。如果有主体证明数据获取渠道并非唯一,而从其他合法渠道获取了该数据,或证明以生产要素的作用而言,某种唯一渠道的数据并不具有不可替代性;以及如果有主体同样支付了“加工成本”,进而获取了该集合性数据,则该数据产权的排他效力将受到限制。此时,权利主体虽然仍能对不特定第三人主张产权,但无法排除“权利破解者”对数据的权利。换言之,此时将出现复数主体同时对一项数据享有产权,彼此间得相互对抗、保持竞争的局面。
其次,在数据的处理形式层面,其需选择性满足以下二者之一:①已采取“保密措施”;②已实施数据权利的“唯一化公示”。基于数据的可复制性,必须对数据进行“保密措施”或“唯一化公示”的形式处理,使其能与特定主体形成对应关系,才能控制“监督成本”,保证权利实现。“保密措施”是通过技术措施,以秘密控制方式确保权利主体与特定数据间的对应关系;“唯一化公示”则是借助具有公信力的公示系统,向市场中的其他主体公示权利主体与特定数据间的唯一对应关系。当其他主体越过“保密措施”或公示系统对特定数据实施利用时,权利主体即可有效识别其行为,并追究其侵权责任。
应当认为,在产权构成要件中区分实质要件和形式要件,在传统产权规范中亦已有之:知识产权自不必论;物权所要求的公示条件,即可视为其形式要件,只不过立法者没有选择“形式要件”这一表述而已。同时,“新型”数据产权构成要件的特色还在于,其实质要件和形式要件不仅要同时满足,还均处于“二选一”的状态,这将使得其存在多种排列组合的权利类型。
仍需说明的是,虽然“新型”数据产权将通过“规范的科斯定理”促进数据的市场化配置,但这并不意味着,该产权立法即足以实现数据市场的全面繁荣。“新型”数据产权涉及的交易成本改良,主要源于数据的可复制性和效用不确定。而数据市场中,财产交易涉及的其他成本问题依然广泛存在。例如,数据交易可能涉及国家安全、公共利益、个人隐私等,产生负外部性,进而由于公法管制、在先权利等的存在而阻碍其交易发展;又如,数据定价难,反映的是要素效用的调查和投资风险成本,这是财产交易中常见的交易成本,也是阻碍数据交易发生的重要原因;再如,“禀赋效应”和社会习惯是交易现实偏离经济分析结论的常见原因,在新型市场发展的初期,这些市场主体的主观因素也会影响交易的达成。但以上问题并不能通过产权议题予以解决,因此本文暂不予延伸。
五、数据产权构成要件理论的应用
以前述“新型”数据产权构成要件结论为依据,当前数据产权实务与理论中的一些争议问题将得到解决:
(一)公开数据是否受产权保护
在不存在当事人合意时,互联网公开数据能否被合法地通过爬虫软件自动化获取,这在实务领域是一个全球共性话题。这取决于公开数据是否受产权保护。目前,学界在价值判断层面的多数观点是:适当的公开数据爬取应当被数据持有人容忍。其理由包括:应根据数据性质,基于场景化的利益衡量,类型化确定数据是否可以被正当爬取;数据公开是一种产权人的自我设限,因而其必须容忍其他主体的爬取行为;公开数据受合理使用制度的约束,故在合理范围内,权利主体应容忍爬取行为。
应当认为,上述理由均指向同一立场,即认为公开数据亦享有产权保护,只是由于公共利益等理由,其产权受到限制。但这一结论有违反逻辑之嫌:既然在多数场景下,公开数据都可以被自由爬取,那么称其为有“产权”是否具有意义?并且,名不副实的“产权”,还可能导致对数据产权排他性的误解,甚至演化为反对数据产权规范的潜在理由。
按照本文的结论,则公开数据是否受产权保护的问题,可以通过数据产权的构成要件得以解释。数据产权的形式要件是“保密措施”或“唯一化公示”,单纯的互联网公开数据,由于既未保密也未进行“唯一化公示”,显然不符合数据产权的形式要件,因而无法获得排他性保护。相应地,单方实施的权利声明,如“禁止爬虫程序”的协议或警告,由于未获得与潜在爬取者的共识,也并不构成具有法律效力的“保密措施”,或具有公信力的“公示”。但是,如果互联网运营者已经以系统操作权限等技术手段限制了数据爬取;或运营者与特定对象达成了禁止爬取协议;或运营商将数据通过“上链”等形式进行了“唯一化公示”,则此时数据产权构成要件已经达成,爬取行为原则上构成侵权。
(二)个人是否享有对个人数据的产权
就个人是否享有对个人数据的产权问题,理论界处于一种矛盾的立场。一方面,学者普遍认为,基于个人的特征、行为产生的数据,与个人信息保护法律关系存在纠葛,其经济性权利亦应受到保护。但另一方面,多数观点又认为,数据产权应当归属于进行数据处理的企业,而非作为数据来源的个人。持企业归属论的观点主要基于两项理由:第一,个人产生的数据经济效用较低,只有经企业处理的集合化数据,才具有产权保护的必要;第二,基于劳动价值论,企业对数据投入了劳动,应当获得作为劳动成果的数据产权。
然而,上述两项解释理由均存在潜在矛盾:就第一项理由,个人既然享有是否授权企业处理其个人数据的权利,那么无论该授权是收费还是免费,均是就该数据是否进入流通领域行使决定权,是一种产权行使的典型表现。并且,即使不存在企业处理行为,个人就其产生的个人数据进行经营收益,立法上也并无任何理由予以禁止。就第二项理由,基于数字劳动理论,网络用户在使用互联网产品时,也付出了时间精力,因此并不能排除其系通过“劳动”产生了个人数据,且其理应对这类数据享有产权。部分学者为了反驳这一结论,论证了用户的时间精力付出不属于“劳动”。但事实上,劳动价值论并不区分劳动付出的主体。
按照本文的结论,个人能够享有对个人数据的产权,并无疑问。而当前实务中,个人之所以往往不享有对其个人数据的产权,是因为其没有能力完成数据产权的形式要件,即其无法对数据采取“保密措施”或实施“唯一化公示”。相应地,如果个人有能力完成数据产权的形式要件,则由于个人数据天然满足“唯一渠道”这一实质要件,其自然可以享有产权。例如基于技术设想,区块链技术的普及应用,可以使用户享有“个人数据金库”,将个人数据进行链上存储,这就可以实现个人数据的产权化。
而就劳动价值论的争议。尽管以支付“加工成本”作为实质要件的数据产权,其法理基础的确与劳动价值论存在着内在联系。但细究数据产权与“劳动”二者,其间的逻辑关系实呈现为既不必要也不充分:一方面,“劳动”并不必然导致数据产权的形成,因为如果不完成数据产权的形式要件,产权无法形成;另一方面,数据产权的形成也并不必然需要“劳动”,因为“唯一渠道”这一实质要件并不以“劳动”参与为必要。此外,劳动价值论在数据产权中的另一项论证作用,反而在于揭示现实存在的数据权益分配的不合理:当实质付出劳动的个人用户,基于技术能力原因而无法获得产权时,其某种程度上正体现的是一种“劳动剥削”的分配状态。
(三)登记对数据产权效力的影响
当前,实务界已开始广泛探索数据产权登记;相关研究也受到了学界的高度重视。数据产权登记制度首先需要回应的问题是,登记对数据产权的效力有何影响:是登记生效?还是登记对抗?抑或仅仅具有证据证明功能?此外,登记究竟采类似于专利的专家实质审查?还是仅由登记员作形式审查?是否需要采用区块链等特殊技术手段?这些问题均会影响数据登记的制度构建。
目前,学界对数据产权的登记效力认知存在重大分歧。有观点认为,数据产权登记应属自愿登记,登记仅具有证明功能,不影响产权变动的法律效力,其理由是强制登记必然面临实质审查问题,成本过高。也有观点认为,数据产权的变动登记应采登记生效模式,其理由是有利于产权的明细化和制度的规范化。
本文认为,登记生效模式下的产权登记,具有产权的形式要件意义。具体而言,数据登记与数据产权效力间存在如下关系:
第一,登记并非数据产权发生法律效力的必要条件。登记是一种数据权利“唯一化公示”的方式。但数据产权亦可通过“保密措施”实现;且即使实施“唯一化公示”,也未必需要借助数据登记机关来实现。据此,数据产权的设立登记应当采自愿主义,不能因为产权未作登记,而不承认其法律效力。但是,如果数据产权已经进入登记系统,则产权主体既然已经选择以登记作为其“唯一化公示”的方式,那么后续的产权变动就应当采强制登记。
第二,登记必须满足“唯一化公示”的要求,才能形成对数据产权法律效力的影响。因此,即使是由国家或大型数据交易中心设立数据登记机关,也宜借用“区块链”等具有技术公信力的手段构建登记系统。
第三,登记至少应当完成一定程度的实质审查。数据产权的实质要件要求“加工成本”或“唯一渠道”。据此,数据产权登记不能是纯粹的形式审查登记,需要登记员对数据的实质内容进行一定程度的鉴别认定。
第四,对于已进入登记系统的数据,宜采登记对抗的效力模式。其原因是:第一,在登记之前,数据产权可能已经具备了完整的构成要件,发生了产权效力;第二,数据产权并非长期、稳定存在,其排他性有其限制,后续权利人得通过“破解”其实质要件以对抗在先权利人,因此登记并不导致权利的绝对确定性效力。
六、结论
在数字经济时代,数据要素蕴含财产权益,需要法律予以调整,这一共识已经深入人心。本文从交易成本理论入手,分析确定数据产权构成要件的尝试,即是这一意识的产物。根据本文的论证,数据客体存在不同的产权形态和构成要件。而“新型”数据产权的立法需求,是数字经济时代数据市场统一化的结果,其构成要件以“实质要件+形式要件”以及要件“二选一”的规范结构为特色,有异于物权、知识产权等传统产权。
回到文首的三项争议,本文亦可有如下回应:第一,数据产权规范是适宜定型化的。因为其构成要件显示,其权利确认的系统性成本基本可控,权利定型化所带来的边际社会收益大于其边际社会成本。第二,数据产权的归属确定宜以“数据持有论”为基础。因为“无归属论”和“数据生产论”各有一定的片面性,而“数据持有论”更能包容数据产权归属的复杂状态。第三,公共数据、企业数据、个人数据的区分,并不会导致产权类型的不同,只是不同主体基于不同的市场禀赋,其享有产权的现实条件有所差异。无论是政府、企业还是个人,其适用的数据产权规则应为一致,方符合市场主体的平等原则。
(原文刊载于《中外法学》2024年第2期)
《数字法治》专题由上海市法学会数字法学研究会特约供稿,专题统筹:秦前松。