刘晓春,中国社会科学院大学法学院副教授
随着数据抓取不正当竞争司法实践的发展,目前理论和实践上已经就一些争议的核心问题逐渐达成共识。例如,针对数据的利用构成实质性替代效果的数据抓取行为,较易被认定为不正当竞争行为,如大众点评诉百度地图案;数据抓取过程中涉及用户数据而未经用户同意的,也会被作为行为不具有正当性的重要考虑因素之一,如微博诉脉脉案。但是,数据抓取中涉及多重利益冲突的处理规则,尚缺共识,特别是涉及用户数据抓取中用户同意的情形,亦即,如果跨平台抓取的数据已经获得用户同意,是否还需要经过平台同意,如果未能获得平台同意,是否必然构成不正当竞争行为,目前依然是实践中的未决问题。
就此问题的讨论,通常以“微博诉脉脉”案判决确立“三重授权”原则为基础。但是,这一通过个案确立的原则是否可以具备更为宽泛的适用效力,值得更为细致的考察。在用户同意其他平台对其用户数据进行抓取或“搬运”的前提下,在多重主体的利益冲突中,用户同意在法律考察中意味着什么,需要区分用户数据的不同情形分别考察价值取舍。尽管目前司法实践中尚未给出明确认定,但可以依据现有立法和理论,对用户同意优先于平台同意的场景作出体系化考量和界定。
“三重授权原则”的适用及其边界
“微博诉脉脉”确立的三重授权原则,指的是,针对平台上用户数据进行抓取的行为,确认其合法性需要经过“用户授权”+“平台授权”+“用户授权”的三重授权,该案中被告未经用户同意且未经开放平台授权,获取并使用平台用户信息的行为,构成不正当竞争行为。但要注意,三重授权原则的适用,需要充分考虑到案件事实本身的限定,超越案件具体事实的推广应用,都需要论证其合理性。
首先,由于该案涉及的数据是个人信息,而且该案的数据抓取未经用户同意,通过这一事实认定数据抓取行为的不正当性,较为顺理成章,亦即未经用户同意且未经平台同意的个人信息抓取和处理行为具有违法性,这实际上一定意义是确立在个人信息保护这一规则共识基础之上的结论。但是,未经用户和平台同意的处理行为不具有正当性,是否意味着经过用户同意但未经平台同意的数据抓取行为必然不具备正当性?该案实际上是没有明确给出这个问题的回答的。如果把“三重授权”里面的“平台授权”进行一般性的推广,认定不论用户同意与否,平台对于针对其数据的抓取行为一般性地拥有排他性权益,则相当于以个案裁判确立了数据权属的立法规则,显然与以反不正当竞争法原则条款为基础的个案裁判的定位并不符合。
其次,微博诉脉脉案的案件事实还存在两方面的限定,一是针对数据交换接口即Open API这一技术形态,二是案件所涉的个人信息包含相当部分非公开数据,因此,如果把三重授权原则推广适用到并非通过API端口获取数据、以及抓取公开数据的场景,亦应当慎重论证其合理性。特别是,网络上公开数据的抓取和获取已经成为当下数据流动和共享的重要途径,并成为人工智能训练等新型生产模式所需要的重要数据来源,平台是否有权针对其公开数据主张较强的排他性权益,有待谨慎论证,不可一概而论。
第三,微博诉脉脉案及“三重授权”指向的是数据获取环节未经授权导致的违法性判断,并不涉及获取环节已经授权、但后续数据利用行为存在争议的情形。实践中,存在第三方产品通过开放平台合法获取用户数据之后,相关数据的后续使用脱离原数据控制平台和开放平台的情形,对这种后续使用的正当性判断,已经与“三重授权”指向的事实存在重要的区别,不适宜进行简单的类推使用,如“微信诉抖音多闪”案,即为此例。
“用户同意”意味着什么?
用户数据从一个平台转移到另一个平台,涉及通过数据抓取实施的转移行为的法律评价,可以从两个维度来展开考虑。一是数据上承载之法益的先后顺序,亦即,如果平台和用户都可以针对数据主张权益,两者冲突之时是否存在先后位阶次序,具体而言,就实践中的冲突样态而言,用户对其数据是否可以拥有优先于平台的支配性权益,经过用户同意甚至授权的数据转移,是否可以不必再取得平台同意。二是数据抓取行为本身的正当性评价,是否因其已经取得用户授权而取得正当性,从而作为针对主张其行为违反商业道德的有效抗辩。
按照目前司法实践中的一些观点,似乎认为,数据之上的用户权益和平台权益应当并行不悖,用户无权直接授权他人以“侵害”平台竞争利益的方式实施数据抓取行为。但这一观点对于平台利益的证成,缺乏令人信服的论证过程。实际上,针对个人信息这一类型,个人信息保护法已经通过立法明确了数据转移中权益冲突的价值取向,通过对于个人信息可携权的立法设定,规定用户可以针对个人数据的转移具有支配性权益,而平台则需要承担配合义务(个人信息保护法第45条第3款)。
个人信息是用户数据产生争议的一种类型,在涉及用户头像、昵称类型的案件中有所体现,例如“微信诉抖音多闪”案。而在其他类型的用户数据争议中,还包括用户生成内容(如点评、微博)、经营性数据(如销售数据、粉丝数、网店装修等)。由于不同类型的数据功能和特点各有差异,用户权益和平台权益之间的优先位阶,并无既定规则,需要分别权衡考量。
目前对于平台数据权益的证成,主要基于激励理论,亦即,如若任由他人搭便车式利用平台数据,会造成对于平台针对数据投入的激励不足,产生负外部性。但是,基于成本收益分析的激励理论,并非基于全有或全无的分析逻辑,判断激励理论的适用和边界,还需要考虑其他因素。例如,允许数据抓取行为导致的数据流动利用带来的收益;是否存在针对平台的替代性激励,如先发优势等情况;设置的权益范围是否过于宽泛从而构成了过度激励;针对企业数据权益的激励,需要和其他激励机制和价值维度进行比较和权衡,比如,用户的激励以及用户的人格利益等。经过用户同意的数据抓取行为,相对于未经用户同意的行为,有可能使得激励机制的效果产生动态变化,这正是反不正当竞争分析这一事后分析路径,相对于事前的法定权利模式,需要重点关注的对象。
现有司法实践中常见的“实质性替代”效果分析思路,即为针对激励效果评价的一种方法。一方面,“用户同意”可能在实施数据抓取的行为主体和对象两个方面,对限制了数据利用构成“实质性替代”的可能性,未经用户同意的数据抓取,可能为市场上任何经营者所为,抓取范围也不受限制,从而更容易构成搭便车意义上的实质性替代。而取得用户同意具有相当成本,使得此类数据转移行为通常只有少数经营者能够实施,而用于转移的用户数据范围也囿于成本所限,不一定能够大规模扩展,从数据的数量和质量上,构成实质性替代的可能性,会远小于未经用户同意的数据抓取行为。
另一方面,用户同意甚或授权转移的数据,在后续利用上可能呈现不同的功能,用于身份识别和验证(如个人信息)、证明信用声誉(如经营数据)等功能辅助类数据,更多为个人用户的跨平台生产和消费提供了便利,并为基于数据的平台生态培育提供整体收益,而很难认为具有平台商业利益意义上的“实质性替代”效果,从而也不会对平台针对数据的经营投入产生实质性的激励抑制效果。
“用户同意”优先于“平台同意”的应用场景
数据跨平台转移中,针对经过用户同意的数据抓取行为之正当性认定,涉及多元数据权益主体之间的价值位阶冲突,也涉及平台激励、用户人格权益和激励、数据流动对平台经济整体带来的收益等多重价值的考量和权衡,不宜通过单一维度的思路做出简单概括的回答。
个人信息领域的价值冲突,已经有立法做出较为清晰的指引和回答,因此,司法裁判中有必要遵循立法的要求,尊重用户针对个人信息跨平台移转的支配性权益,在获得用户同意甚或主动指令的情况下,通过自动化抓取方式将用户数据实施跨平台转移的行为,应认定为正当合法,而无需经过平台的同意。
在涉及经营性、声誉性数据的情况下,基于两点原因,原则上也应当尊重用户同意,未经平台同意,不应被认定为构成不正当数据抓取行为的理由。一是如前文所述,此类数据的利用和展示通常不涉及平台的核心商业模式,如电商平台交易功能或媒体平台的内容展示,不构成实质性替代,对平台的激励抑制效果不明显。二是此类辅助功能性数据,通常起到辅助性的证明和识别作用,对用户个体的跨平台发展较为重要,尤其是对于中小经营商家而言,能够有效促进其跨平台迁移和流动,因此对于用户和平台经济生态的整体培育具有重要价值。
司法实践中,还存在针对微博、点评、短视频等用户生成内容(UGC)的争议,对这类争议的个案判断,亦需要考虑多重因素。一是此类内容中包含大量个人信息,尤其是在个人信息界定的“关联说”之下,UGC可以剔除在个人信息范围之外的并不确定,因此相当一部分可以作为个人信息依法处理。
二是UGC中相当一部分包括具有独创性的作品,经过作者同意进行跨平台自动化转移,体现了用户对其作品的人格权益,原则上不应通过司法判决赋予平台阻碍此种转移的一般性权利,此种权利类似于著作权法上的邻接权,其一般性的设定应当通过立法来进行。
三是针对UGC中既不构成个人信息亦不构成作品的内容,讨论其中用户同意和平台权益的冲突时,需要充分权衡此种转移行为对于平台激励是否存在实质性抑制,并且充分考虑用户在其UGC中体现的人格和激励性利益的重要价值。同时需要注意,就操作层面看,将用户UGC根据其法律属性分别区分并给出不同规则的做法,有可能不符合裁判经济原则,增加了规则适用的成本和不确定性。