申卫星
中国法学会民法学研究会常务理事、清华大学人工智能国际治理研究院人工智能法律法规方向首席专家
“
近日,第526期民商法前沿论坛在中国人民大学立德楼403教室线下举行。在本场讲座中,清华大学法学院申卫星教授以“数据产权:从两权分离到三权分置”为主题发表报告,北京大学法学院王锡锌教授,中国人民大学法学院石佳友教授,中国社会科学院法学研究所姚佳教授出席论坛并参与讨论。
申卫星教授首先介绍了《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)这一重要政策文件。“数据二十条”确立了数据产权流通、交易、收益分配和安全治理四大板块的数据基础制度,提出了数据资源持有权、数据加工使用权和数据产品经营权三权分置的新模式。“数据二十条”在学界引发了大量讨论,有反对意见认为这三项权利缺乏现行法依据,难以找到将政策上的新型权利落实为现实法律的途径。围绕着学界提出的各种质疑,申卫星教授表示本次报告将从是否赋权、如何赋权、赋权给谁、赋权界限共四个方面对数据产权进行讨论。
第一方面,关于是否赋权。
首先,申卫星教授指出目前的实践中存在立法“留白”与司法“造法”,国家立法的“守正”与地方立法的“创新”两组悖论。一方面,在立法上,仅有《民法典》第127条“法律对数据、网络虚拟财产的保护有规定的依照其规定”的留白条款,体现出保守的态度。但司法中却出现了日益活跃的法官造法现象,法官在判决中创造了诸如“竞争性财产权益”等在现行法中缺乏依据的新概念。另一方面,国家立法表现出守正态度的同时地方立法却日益创新。据不完全统计,已有31个省市出台了与数据相关的条例。但地方立法面临着立法权限不足的问题。此外,中央政策的连续出台、司法实践中关于数据权属纠纷的不断涌现都表明数据确权问题已经发展到了必须正面回应、着力解决的阶段。
其次,申卫星教授总结了反对数据赋权的主要理由。其一,经济上的理由:第一,互联网强调互联互通、共享共用,数据应被界定为公共物品,若对其确权会阻碍数字经济的发展;第二,确权意味着获取数据需要得到权利主体的授权,交易成本将提高,容易导致数据壁垒,带来反公地悲剧;第三,有观点认为数据自身的特性决定了其无法被确权,如数据具有无体性、非独占性、排他性和非消耗性,缺乏独立性和特定性,生成复杂但利用成本低等特性。
申卫星教授对这些理由进行了反驳。针对无体性的理由,申卫星教授表示“物必有体”的概念对应着物权与债权的区分,是为了将物权客体与作为债权客体的“作为给付的行为”相区分而存在。随着时代的发展,物权客体早已不再局限于有体物,无线电频谱资源等无体物已被物权法所囊括,客体的无体性并不当然地排除物权法的适用。物权法及民法虽为古老的制度,但其具有包容性和扩张性,可以将新事物纳入其统辖的范围内。缺乏独立性、特定性等问题可以通过登记制度解决。数据亦不是完全“非独占的”,大量主体在不同环节为数据的形成付出了资本、技术、劳动力等贡献,若对此贡献不给予任何保护将极大地损伤相关主体的积极性。其二,从法律技术上而言,有观点认为可以采用责任规则而非财产规则进行规制。换言之,仅在发生大规模机器爬取侵犯数据采集者或数据储存者利益时,才有必要赋予相关主体阻止他人不当获取行为、要求对方承担侵权责任的权利。申卫星教授指出,数据确权的意义不仅在于保护,更在于促进交易和利用。只有明确数据权属,权利人才拥有通过许可、转让、入股、信托、质押融资等方式对数据进行利用的法律基础。
最后,申卫星教授提出了支持数据确权的理由。从程序角度而言,其一,《民法典》第127条和《数据安全法》第7条作为引致条款都表明了立法者对数据予以保护的立场,需要进一步落实。《民法典》第127条的位置处于数项财产权规定之后,且条文将“数据”与“网络虚拟财产”并列,据此可以得出数据的保护路径可以采用财产权路径的结论。其二,现有立法无法解决数据确权问题。在目前的司法实践中,法院通常采用商业秘密或反不正当竞争法的相关规定处理数据权属纠纷。前者较为牵强,而后者在适用时通常使用一般条款,其中涉及的“诚信原则”“商业道德”等判断标准弹性较大,在认定时容易产生分歧。其三,各地立法权限缺失,立法创新表述不一,违反了财产权法定原则。从实体角度而言,数据赋权有利于避免公地悲剧,促使企业走出丛林法则,鼓励技术创新创造,在数据产业贯彻“有恒产有恒心”的原则。
第二方面,关于如何赋权。
首先,申卫星教授提出了数据赋权的方法论。第一,建立由点到线、由线及体的层级化思维。层级化思维不同于非此即彼的分类思维,它强调概念之间的流动性。由点到线是指要将数据、信息、隐私这三“点”加以区分;同时又要注意三者之间的联系,数据作为载体可以分为内容层和符号层,信息即为数据的内容层,其中可能包含构成隐私的私密信息,由此得将三点拉成一条线进行理解。由线及体是指数据、信息、隐私三者有次序,存在着“隐私权>个人信息>数据权利”的位阶,彼此之间互不相同又共同构成一个连续整体。第二,采取“三分离、三阶段”数据确权法。三分离是指客体上要将信息和数据相分离;主体上要将为数据产生提供来源的数据来源者和对数据进行采集、存储、加工、分析等的数据处理者相分离;权利上要将数据来源者的合法权益和数据处理者对依法依规持有的数据进行自主管控的权益相分离。三阶段是指区分数据采集阶段、数据加工阶段和数据产品阶段。“数据二十条”中规定的“三权”是数据用益权在三个不同阶段的不同表现形式。
其次,申卫星教授指出在路径选择上存在信息与数据是否需要分别赋权的重大分歧。一类观点主张,用户仅对个人信息享有人格权,平台对数据享有全部产权;另一类观点认为信息和数据之间联系紧密,作为数据来源的用户当然地对数据享有所有权,但其是弱所有权。申卫星教授通过几个经典案例展示了我国司法实践中法院对用户与平台之间权利分配问题的处理。在大众点评诉百度案中,百度抓取了大众点评储存的用户点评,大众点评主张百度利用这些用户点评将实质性替代其市场地位且属“不劳而获”,最终法院根据反不正当竞争法而非侵权的规定判决大众点评胜诉。此案的问题在于,法院在适用反不正当竞争法时,对于“是否遵守商业道德”的判断存在模糊性和不确定性。在新浪诉脉脉案中,法院指出第三方获取用户信息应坚持“三重授权”原则,即“用户授权+平台授权+用户授权”,其中平台权利基础的来源问题值得思考。在淘宝诉安徽美景公司案中,淘宝对数据进行加工从而形成了数据产品,法院认定淘宝享有“竞争性财产利益”。上述案例皆为平台与平台之间对数据权属的争议,其本质实为平台与用户对数据的权属分配之争。
第三,关于赋权给谁。
有观点认为平台为数据的采集、存储、加工、分析等投入了相当的劳动,适用洛克的劳动财产权理论,其应获得数据的财产权。申卫星教授则指出“劳动创造产权”的原则仅适用于无主物,他通过乌木之争、王老吉与加多宝之争、Pierson诉Post案三个经典案例对此进行了论证。据此,申卫星教授认为个人不仅对个人信息享有人格权,也对储存个人信息的个人数据享有财产权。
现有理论中存在三种数据赋权的模式。其一为“非此即彼”,要么将数据所有权一律分配给个人,要么一律分配给企业。此种模式未遵循根据数据的来源和数据生成的贡献合理分配产权的原则。其二为共有,此模式缺乏效率。其三为借鉴权利分割理论,个人享有数据所有权,平台企业对其合法依规控制的数据享有数据用益权。权利分割的思想在民法中有许多应用。例如,所有权保留的分期付款买卖中,出卖人和买受人即对所有权进行了分割;土地作为生产要素实现市场化的过程中也发生了所有权与使用权的分割。事实上,任何要素进入市场时都面临着权利的分化与制度的改革,作为第五大生产要素的数据也不例外。申卫星教授赞同第三种模式,其理由在于:其一,个人实现了数据的从无到有,平台企业为数据生成作出了贡献,如此分配既符合逻辑又符合事实。其二,与既有的概念体系相衔接,两权分离借鉴了“自物权与他物权”、“著作权和邻接权”这样传统民法制度上的“权利分离”。此外,申卫星教授还论证了个人数据所有权的正当性。其一,数据所有权是数据使用权的基础,没有作为母权利的数据所有权便没有作为子权力的数据使用权;其二,依据层级化思维,数据承载着信息,对数据的控制保障着对信息的控制,赋予个人数据所有权才能确保作为数据内容层的个人信息得到充分保护。进一步的,为了避免权利主体过于分散带来的弊端,可以通过设立个人数据资产账户的方式行使个人数据所有权。
数据用益权的提出有三重意义:第一,实现了用户和企业之间的权限分配;第二,调和了不同数据企业之间的利益冲突;第三,确保了平台企业对数据的支配权能和独立的权利机能。更为重要的是,数据用益权可以作为将数据资源持有权、数据加工使用权、数据产品经营权“三权”的政策性规定转换为法律权利的转换接口。“三权”是数据用益权在不同阶段的权能表现形态。在数据采集阶段,数据来源者使用设备产生数据,其为数据所有人;企业经许可对数据进行采集、处理,从而享有数据资源持有权。以数据资源持有权为基础,企业在数据元件阶段拥有数据加工使用权,可以对数据进行加工使用,将其制作为数据元件。第三阶段中企业可以将数据元件自行制作或交易给二级开发商制作为数据产品,从而享有数据产品经营权。
两权分离的制度构造之下,数据所有权应为弱所有权,包括许可、收益、访问和可携带四项权能。有观点认为后两项权能应属于个人信息权而非数据所有权。申卫星教授指出,携带的客体应为数据,数据的转移必然引起以其为载体的信息一并转移,故将其作为数据所有权的权能并无问题。数据用益权则包括控制、开发、许可、变价、转让五项权能。
第四,关于赋权的界限。
第一,数据产权应受到必要的限制。其一,数据和信息一体两面,有区分又不可割裂,对数据产权的保护应以保护个人信息、商业秘密、隐私和国家公共利益为前提。其二,可以类比知识产权,建立数据产权的合理使用制度、法定许可制度、强制许可制度和FRAND协议。
第二,数据应分类分级确权授权。数据应分为“公共数据、企业数据和个人数据”三种类型,“一般数据、重要数据和核心数据”三种级别。“数据二十条”第4条规定,对不承载个人信息和不影响公共安全的公共数据应按照用途加大供给;对用于公共治理、公共事业的数据应有条件无偿使用;对用于产业发展和行业发展的公共数据应有条件有偿使用。“数据二十条”第5条规定,国有企业、行业龙头企业、互联网平台企业应发挥带头作用,加强与中小微企业双向公平授权。企业既可以是数据的源发者又可以是数据的处理者,要鼓励其探索数据授权使用新模式。“数据二十条”第6条规定,个人数据承载着个人信息,应规范对个人信息的处理活动,不得采取一揽子授权、强制同意等方式过度收集个人信息。同时还应推动个人信息匿名化处理,建立个人数据资产账户,促进个人信息数据的利用。
最后,申卫星教授对本次报告进行了总结。将用户的数据所有权与企业的数据用益权相分离,为政策规定与法律语言找到了转化的接口:以数据用益权为“底座”,其在数据采集阶段表现为数据资源持有权,在数据加工阶段表现为数据加工使用权,制作为产品后表现为数据产品经营权。三权分置就是数据两权分离框架中的数据用益权在三个不同阶段的具体权能之表现形式。
与谈环节,与谈嘉宾与申卫星教授进行更深入的探讨。
王锡锌教授认为民法学界就数据产权展开了丰富的讨论,体现出了高度的包容与开放,而申卫星教授的报告涉及此领域的许多关键性问题,极具有启发性。同时,王锡锌教授也抛出一些疑惑:首先,报告中同时使用了“确权”和“赋权”两个词语,但二者存在法律意义上的差别,后续的研究或许需要在“确权”和“赋权”的语意上作出更为精准的界定和区分。其次,财产所有权和财产权益是不同的概念,财产权益基于财产所有权而产生,而“数据二十条”中却并未对数据的财产所有权作出有效的回应和规定。此外,王锡锌教授还提出了产权的结构性分置中的“结构性”应当如何理解的问题。如果“数据加工使用权、数据资源持有权、数据产品经营权”这三个概念指向的权利客体不相同,可能就无法形成实质意义上完整的权利结构性构造。
对此,申卫星教授作出如下回应:数据资源持有权与数据资源、数据产品经营权与数据产品之间的对应关系较为明确清晰,但囿于现行法律规定,确实较难解释和确定数据加工使用权的客体指向。数据产权的结构性主要体现于数据用益权在不同阶段的一些表现形式,即在经数据所有权人许可而获得数据资源持有权的基础上,衍生出数据加工使用权与数据产品经营权。
最后,王锡锌教授还从行政法的角度出发,谈及国家政府部门等公权力机关究竟基于何种基础调取个人的信息数据,并期待申卫星教授在这一领域上创造更多学术成果。
石佳友教授认为,尽管从宏观的立法角度上看,将政策语言转换成法律语言还有相当长的一段距离要走,但申卫星教授却已然对专业化和复杂程度较高的数据产权概念作出了非常精辟而细致的解读,巧妙地将宏大的数据议题嵌入到现有法教义学的基本范畴中。例如,将数据信息的源发者理解为数据的所有权人,将数据信息的采集者称为数据资源持有权人。与此同时,石佳友教授指出,“旧瓶装新酒”的解释路径下,传统的法学概念是否足以对数据这一新兴领域提供足够充足的解释力,也许值得更多的思考。同时,也应当警惕“话语范式的陷阱”,关注传统教义学范式如何影响乃至框定我们对新现象的理解。例如,在对数据产品经营权中的理解中,许可第三方经营数据也是处分权的表现形式之一,那为何不借助处分权这一概念用以概括许可第三方经营数据的法律关系?“用益权”的概念如果以过于宽泛的方式使用,反而可能冲淡这一概念最核心的内容。
石佳友教授还谈到,除了 “三分法”之外,可能需要对非公开数据进行更为细致的分类。有些数据采集者收集到的个人信息并不是基于个人身份开展的采集工作。例如,在智能汽车驾驶的测试过程中,驾驶系统采集到的是海量测试者群体的驾驶数据,并不存在对所谓个别的、特定的驾驶者作出个人驾驶习惯分析。此类数据兼具企业数据和个人数据的特征。因此,有鉴于数据本身的种类多样性和高度异质性,以及数据使用场景的复杂性,也许需要对数据进行更为复杂、细致的分类。
申卫星教授作出回应表示,自己更倾向于以“改良主义者”的立场对这一领域的法律问题作出研究,尽可能将新兴的社会事物贴近于既有的法律理论与制度,不希望提出一个全新的概念,所以借用了传统的所有权与用益权两权分离的理论解释数据产权领域中的诸多现象。申卫星教授还补充,数据资源持有权、数据加工使用权与数据产品经营权的三权分置只是结构性、阶段性的构造划分,数据产权还存在收益、处分、质押等其他非主要权能。
姚佳教授首先就“如何看待信息和数据之间的关系”“何为数据权利”及“如何看待数据产权”这几个前提性问题分享了自己的思考。尤其是对于数据产权本身的认识上,国内外学界关于是否需要采取财产法规则的视角对定义数据产权存在争论。姚佳教授指出数据和信息各自的概念及两者之间的关系不再是关注的重点,更多学者开始思考如何分配数据背后的经济利益。所谓经济利益并非对原始数据本身所携带的经济利益,而是数据通过一定的决策模型被使用之后衍生出的经济利益。
姚佳教授还认为数据资源持有权、数据加工使用权与数据产品经营权并非法律规范上的评价,而更接近于对事实的确认。数据产权的一大关键问题在于如何判断这一强势权利的边界所在:这一权利的控制力是否强势到与“所有权”概念齐平的程度?如果控制力尚未强势到这一程度,又应当替代性地使用哪一法律概念?换言之,该如何命名这一权利?按照姚佳教授的理解,这一权利的控制力可能弱于所有权。在申卫星教授的讨论中,数据的所有权与用益权是以个人权利为核心而辐射出的一个权利体系,但姚佳教授不完全赞同数据产权领域下的所有权与用益权全然构成传统法律中所有权与用益权之间“母权”与“子权”的关系。例如,个人在网络社交平台上的独创性作品自然被归入著作权保护的范畴,但并非所有个人用户通过网络平台创作的内容都能形成一个同样的权利,那么个人用户和网络平台之间构成产生何种法律关系仍然值得更多思考。最后,姚佳教授对申卫星教授所提出的“有产权才有激励、有激励才有行为、有行为才有秩序”的观点深表赞同。
在最后的提问环节,现场同学提问能否借鉴土地承包经营权三权分置的逻辑以理解数据产权中的数据处理环节,即能否认为数据处理者在获得研发者的第一次授权后保留数据资源持有权,并以委托的形式为后续的其他数据处理者式设立加工使用权或者产品经营权。针对这一提问,申卫星教授首先明确了数据的来源者缺乏与数据平台进行谈判的专业能力,此时需授权第三方专业机构与平台对接以使后者获取数据资源的持有权。数据来源者与平台之间由此建立了合同关系,但这一合同关系的边界在于不能侵害数据所承载的个人信息上的人格权。作为来源者的数据主体获取数据使用权后,以此为基础再相应地授权后续的数据开发商提供各种数据的衍生服务,并最终形成产品。
此外,还有同学就“政府掌握的公共数据的所有权是否归国家所有”提出了疑问。申卫星教授从“数据二十条”中第四条对公共数据的界定出发,指出公共数据可能包括各级党政机关、企事业单位在依法履职过程中产生的政务数据和收集的个人数据。政务数据为政务主体履行公共职能过程中收集并形成的公共性数据,例如气象数据、公共交通数据,自然归政务主体所有,即归国家所有。而个人数据是政务系统收集到的被管理主体的个人数据,尽管政务主体不经授权即可取得用益权,但不能直接获取个人数据的所有权。
清华大学人工智能国际治理研究院(Institute for AI International Governance, Tsinghua University,THU I-AIIG)是2020年4月由清华大学成立的校级科研机构。依托清华大学在人工智能与国际治理方面的已有积累和跨学科优势,研究院面向人工智能国际治理重大理论问题及政策需求开展研究,致力于提升清华在该领域的全球学术影响力和政策引领作用,为中国积极参与人工智能国际治理提供智力支撑。
新浪微博:@清华大学人工智能国际治理研究院
微信视频号:THU-AIIG
Bilibili:清华大学AIIG