作者简介:姚佳,法学博士,中国社会科学院大学法学院教授、博士生导师,中国社会科学院法学研究所研究员。
文章来源:《法律适用》2026年第4期。
摘要:最高人民法院发布的指导性案例 264 号,对不同主体间数据权益的界分、数据处理者依法采集数据形成数据产品,以及该采集行为是否侵害数据来源主体权益等关键问题进行了论证。该案例进一步揭示,数据是一种用于形成社会关系网络的资源性存在,具有工具要素与治理对象的双重属性与定位。数据来源的合法性是数据得以被合法利用的前提,而数据来源的多源性与外源性又是其融合创新的基础,因此数据来源者权益与数据处理者权益之间存在一定冲突且有必要平衡。数据产品作为对原始数据进行加工后形成的 “加工品”,具有非标准化、独创性要求低以及权利结构具有整体性与不可分性等特点,从而区别于非独创性的数据集合或数据库。对于数据权益的侵害,在现有侵权责任法框架下可寻求停止侵害、赔偿损失等救济;若涉及竞争性利益的损害,则可诉诸反不正当竞争法予以规制。
关键词:数据权益 数据来源 数据产品 数据利用 损害赔偿
引言
随着网络化、数字化和智能化的不断发展,数据作为信息的载体,逐渐成为数字时代的重要发展引擎。数据具有工具要素和治理对象的双重属性和定位。作为工具要素,“数据是在一定背景下对现实世界中的事物定性或定量的记录”,通过运用数据,可实现类比分析、逻辑推理和规律发现等目标,增强人们的洞察力和决策力。作为治理对象,主要是从安全保障与风险预防双重维度,将数据作为“对象”进行治理,涉及个人信息保护、数据安全、人工智能安全等监管透明度。近年来的全球数字经济发展中,我国在构建网络安全、数据安全和个人信息保护等制度的基础上,进一步通过要素市场化配置体制机制、构建数据基础制度以更好发挥数据要素作用等制度建构,推动数字经济发展,并实现数字经济发展与数据安全保护的“双驱动模式”。
现行法律规范体系内,除《网络安全法》《数据安全法》《个人信息保护法》等法律之外,在《民法典》《反不正当竞争法》中仅对“数据”规定了个别条款,而且相关条款的法律适用仍值得细化探讨。由此可见,尽管我国在数据治理方面的法律规定相对充沛,但在数据权益保护、数据主体的经济行为等问题的法律调整等方面还有待完善,这就导致涉数据权益纠纷方面的相关法条解释和法律适用理论分歧较多,相关研究也以立法论居多。这一方面的纾解亟需充足的理论供给以及对实践经验的充分总结。
《数据安全法》第3条第1款规定,“本法所称数据,是指任何以电子或者其他方式对信息的记录。”该款对数据的定义,基本上是从数据科学角度对数据的基本形态进行规定,即数据是信息的记录。然而,在社会关系或市场视角,人们所称之“数据”实际上具有不同指代和含义,即已将对数据的解释预先嵌入市场经济与社会关系之中。在国家数据局2024年12月发布的《数据领域常用名词解释(第一批)》中就指出,“数据,是指任何以电子或其他方式对信息的记录。数据在不同视角下被称为原始数据、衍生数据、数据资源、数据产品和服务、数据资产、数据要素等。”这一名词解释也表明,当人们提及“数据”之时,可能是在不同类型和不同语境之下,指向数据外在的不同表现形态。
司法实践中,近年来数据权益纠纷案件不在少数,如何界定数据权益、合法利用数据,如何认定不正当竞争行为以及相应法律责任等也逐步通过具体案件予以类型化,树立了相关裁判规则。本文主要聚焦最高人民法院2025年8月发布的指导性案例264号,该案适用的法律依据是《民法典》第1165条规定的过错责任原则和《数据安全法》第7条规定的数据权益保护与数据要素发展并重的核心原则条款。通过对该案的讨论,拟进一步探讨数据利用的合法性来源、数据产品的界定及其特征、数据产品的权益归属以及侵害数据权益的责任承担等问题,以期在现行法体系内更好解释相关条款,并进一步为数据领域纠纷的法律适用提供些许思考。
一、指导性案例264号的基本案情与主要问题
最高人民法院于2025年8月发布第47批指导性案例,这是最高人民法院首次发布数据权益司法保护专题指导性案例。这些案例主要涉及数据权属认定、数据产品利用、个人信息保护和网络平台账号交付等社会高度关注的问题,旨在统一类案裁判尺度。
指导性案例264号某钢铁有限公司诉某电子商务股份有限公司侵权责任纠纷案,是关于编制、发布钢材价格指数而引发的侵权责任纠纷案件。该案例明确数据处理者依法采集企业数据,经符合有关标准的编制方法加工形成数据产品并合理利用,未对企业权益造成损害,相关企业要求数据处理者承担侵权责任的,人民法院不予支持。
(一)基本案情
某钢铁公司主营特种钢材生产与经销,通过微信群(含无资格限制客户群及厂商、一级代理商群)、电话告知两种方式发布出厂价格。某电子公司作为具备互联网数据服务等资质的“商贸流通业典型统计调查企业”,组建信息采集团队,通过公众号/微信群采集、电话询问、合同披露等方式收集钢材价格信息,同步提供市场行情分析服务,经算法加工编制成反映区域市场综合价格水平的价格指数(获“上海标准”认证),以会员制模式在其网站及APP发布。2019年起,某电子公司已在平台发布某钢铁公司相关钢材品名、价格及涨跌信息。2020年11月18日,双方签订合作协议,约定某电子公司采集并及时公布某钢铁公司价格信息,为其提供数据服务与品牌推广,某钢铁公司支付服务费。2021年5月24日起,某钢铁公司以自身产品价格在电子公司指数中与同区域同档次企业差异过大为由,多次要求下架相关数据。同年11月30日,双方解除合作协议,但某电子公司仍继续公布相关价格数据。某钢铁公司遂以侵权责任纠纷起诉,主张某电子公司未经同意擅自采集、加工或编造数据,采集加工过程不规范不公允,发布数据不真实,侵害其合法权益,请求法院判令某电子公司立即删除网站及APP中所有涉及其公司的信息。
该案的裁判结果为,上海市宝山区人民法院一审驳回某钢铁公司的诉讼请求,上海市第二中级人民法院二审驳回上诉、维持原判。
(二)裁判理由
本案争议焦点为某电子公司采集发布案涉数据的行为是否侵害某钢铁公司合法权益,法院认为未构成侵权,裁判理由包括:
1.双方数据权益依法界分,互不冲突。某钢铁公司对其经营中产生的钢材出厂价格享有持有、使用权益,但该价格已通过无资格限制的数百人微信群公开发布,未采取保密措施,不属于受法律保护的商业秘密,不能禁止他人合法合理采集使用。代理商价格产生于下游交易链条,无证据表明某钢铁公司参与该数据的产生与发布,故其对该类数据不具有限制他人采集使用的权益。某电子公司作为具备合法资质的市场主体,有权依据国家发展和改革委员会相关规定编制发布价格指数,其通过采集原始数据经算法加工形成的价格指数,属于独立数据产品,依法享有经营性利益,二者权益边界清晰。
2.某电子公司数据采集加工行为具有充分正当性。首先,案涉出厂价格不构成商业秘密。根据反不正当竞争法及相关司法解释,商业秘密需满足不为公众所知悉、具有商业价值、采取保密措施等要件,而某钢铁公司在开放微信群中公开价格且未限制传播,不符合“不为公众所知悉”和“采取保密措施”的要求,其关于商业秘密的主张不能成立。其次,双方合作协议的解除不影响采集行为的合法性,该协议系某钢铁公司购买数据服务与品牌推广的约定,并非电子公司采集价格数据的合法前提。最后,某电子公司通过公众号、微信群采集,电话询问,合同披露等合法方式独立采集数据,未采取误导、欺诈、窃取等不正当手段,数据来源与采集方式均符合法律规定。
3.无证据证明某钢铁公司数据权益受到损害。某电子公司的正当采集使用行为未影响某钢铁公司对自身出厂价格数据的持有与使用,亦未造成其经济损失。某电子公司的价格指数编制方法获“上海标准”认证,基础数据与加工流程均无违法情形。某钢铁公司主张数据产品不真实、不公允,但未提供充分证据予以佐证,其关于数据质量存在问题的抗辩缺乏事实依据。
综上,某电子公司的行为符合《民法典》第1165条、《数据安全法》第7条等法律规定,数据采集加工具有正当性,未侵害某钢铁公司合法权益,且无证据证明数据产品存在质量问题,故法院对某钢铁公司的诉讼请求,依法不予支持。
(三)核心问题与法律适用
基于以上案情,该案涉及的核心问题主要包括四项:一是企业公开经营数据的权益边界,即已公开数据能否禁止他人合法采集利用;二是数据产品的法律属性以及数据处理者的合法权益保护;三是一定范围内传播的企业价格数据是否还能以商业秘密方式保护;四是数据采集、加工、发布的正当性标准,包括采集、编制方式等。
从法律适用来看,该案并未适用《民法典》第127条和修订前的《反不正当竞争法》第2条和第12条,而主要适用《民法典》第1165条和《数据安全法》第7条。诚如前述,在无特别条款规定数据权利的前提下,《民法典》第127条并非将数据权益作为绝对权保护的法律依据,理论上以及已有案例均对此有所述及。故此,即便不讨论《民法典》第127条,也不会影响该案核心问题的判断。另外,由于该案原告与被告之间不存在竞争关系,故未适用反不正当竞争法的相关规定。
该案适用的法律依据为《民法典》第1165条和《数据安全法》第7条。之所以适用这两条规定,主要是因为现有关于数据的法律规定存在待完善的空间,所以法律适用需回归一般规则,并且侵权法的一般规则仍可解释大多数情形下的过错责任承担问题。至于《数据安全法》第7条规定的“鼓励数据依法合理有效利用”,在本案中有一定解释空间。当然,本案最主要的案情是并不存在违法采集、违法利用以及因数据质量瑕疵而导致的损害等情形,故而在不考虑这些问题的基础上,可从促进数据流通利用的角度适用《数据安全法》第7条加强说理。换言之,该条在说理上属于“加分项”,而非“决定项”。
法院对本案的核心问题作出的裁判值得赞同,但进一步延伸思考,如下问题仍有进一步讨论的必要:如何认定数据利用的合法性来源以及如何界定合理利用,同时数据来源者是否应享有相应权益;企业数据的不同类型,如公开数据、半公开数据、商业秘密等数据是否应设定差异化保护规则;数据产品与相近形态的数据库、非独创性的数据集合如何区分,数据产品又具有何种法律意义上的特征;若数据产品存在质量瑕疵并给权利人造成损害,权利人如何请求损害赔偿。
二、数据利用的合法性来源
数据是一种用于形成社会关系网络的资源性存在。数据虽然是信息的记录,但并非仅停留于记录之上。数据通常具有三元结构属性:真实的存在、记录的数据和人类的理解。而从人类理解、数据所记录内容的主要功能角度而言,内容事实上并不是数码物的关键问题,真正重要的是关系。整个数码物网络本身也是一个关系网络,数码物的形式使内容呈现为不同的关系,内容的主要功能是形成用于产生关系的资源。数据是一种典型的数码物,其亦以形成关系网络为最终目标。欲形成此关系网络,如何利用数据就成为一个中枢,而如何获得数据的行为则是中介行为。在指导性案例264号中,某电子公司获得包括某钢铁公司的数据在内的数据进行统计并对外发布,市场主体可利用这些数据作出判断,之后再与某钢铁公司建立交易关系;市场主体与其他主体也可利用这些数据作出更为宏观的市场性判断或统计性判断,进而发挥其更重要的功能,这就形成了一个社会关系网络。在现行法律规范和政策体系内,数据利用的合法性来源是一个前置性的关键问题,其不仅关系如何获得数据,同时也关系数据来源者与数据利用者之间的利益平衡。
(一)数据来源合法性的法律与政策依据
数据来源的合法性贯穿于数据采集、持有、使用、加工、交易、流转等所有行为之中。在现行法律规范体系内,直接规定“数据来源”的内容甚少,更多情况下是将其置于数据收集、获取与使用等行为的规定之中,以确定数据来源的合法性界限。《网络安全法》规定了网络经营者收集、使用个人信息的原则、目的、方式和范围,以及不得窃取或者以其他非法方式获取个人信息;《数据安全法》规定了组织和个人收集数据的方式、目的和范围,以及数据交易中数据提供方应说明数据来源;《个人信息保护法》规定了处理个人信息的原则、目的、方式和范围等内容;《生成式人工智能服务管理暂行办法》规定了生成式人工智能服务提供者应当使用具有合法来源的数据开展预训练、优化训练等数据训练处理活动。这些规定主要在个人信息、数据的收集之中界定数据来源的合法性。
在政策层面,《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)中规定了“数据来源”和“数据来源者”。数据二十条中的主要内容包括“根据数据来源和数据生成特征,分别界定数据生产、流通、使用过程中各参与方享有的合法权利”“充分保护数据来源者合法权益,推动基于知情同意或存在法定事由的数据流通使用模式,保障数据来源者享有获取或复制转移由其促成产生数据的权益”“建立数据来源可确认、使用范围可界定、流通过程可追溯、安全风险可防范的数据可信流通体系”等等。可见,数据来源直接决定了数据处理在消极意义上的合法性基础,也构成了积极意义上数据来源者与各方权利义务分配的起点。
(二)实践中的数据来源途径
企业在生产经营实践中获取数据有多种途径,对于不同类型的数据存在不同的法律要求。企业主体持有和获取数据的来源一般包括以下途径:
1.企业自身历史积累的数据,数据的具体类型和质量取决于企业自身情况;
2.通过合同安排购买各类免费或付费的第三方数据库与数据集,例如CommonCrawl、各类高校以及企业科研机构所搜集和处理的开源数据集如QAWiki、EXEQ-300K、arXiv等;
3.经授权(付费或免费)调用应用程序编程接口(API)获取数据;
4.在公开渠道通过自动化程序或其他方式收集的数据。
这些数据来源中,前三种情形具有合法来源基础并无异议,而第四种情形中的自动化程序收集方式虽然属于企业数字化实践中的常用方式,但仍然会受到较为严格的限制,如不得非法侵入他人网络、不得干扰网络服务正常运行以及不得损害被收集方的合法权益等等。
因数据类型不同,企业应遵守的法律法规亦有不同。企业除遵守《网络安全法》《数据安全法》《个人信息保护法》之外,对于作品、个人信息等亦应遵守如《生成式人工智能服务管理暂行办法》第7条规定的“涉及知识产权的,不得侵害他人依法享有的知识产权”“涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形”等特别规范。对于已公开个人信息的采集,应依据《民法典》第1036条、《个人信息保护法》第13条第1款第6项、第27条等条文综合判断是否属于“在合理的范围内处理个人自行公开或者其他已经合法公开的个人信息”,并且个人有权依据《个人信息保护法》第27条、第44条和第47条行使拒绝权和删除权。至于数据的自动化收集是否涉及不正当竞争行为,则应根据反不正当竞争法的理论框架和法律规定判断,实践中此类案件不在少数。
(三)指导性案例264号中的数据来源
在指导性案例264号中,某电子公司与某钢铁公司先是签订了合作协议,由某电子公司为某钢铁公司提供数据服务、品牌推广等服务。后某钢铁公司认为某电子公司所公布钢材价格指数中涉及的某钢铁公司的价格,与同区域、同档次其他公司的产品价格差异太大,要求某电子公司将相关产品价格数据下架。后双方解除合作协议,但某电子公司仍继续公布某钢铁公司的上述价格指数数据。那么,结合上述企业数据来源的一般途径,在某钢铁公司与某电子公司之间存在合同关系时,某电子公司获取某钢铁公司的数据具有相应合法性基础。在双方合同解除后,某电子公司获取并持续公布某钢铁公司的价格指数数据的行为则有必要进一步判断。若某钢铁公司的价格数据属于公开数据,则属于上述第四种情形,即某电子公司可从公开渠道获取相关数据;若价格数据属于商业秘密等非公开数据的情形,则有可能并非属于合法获取;若属于中间情形,则有必要根据具体情形判断是否属于合法获取。这就需要回答如下问题:一是某电子公司如何持续获得某钢铁公司的价格数据?具体通过何种方式?二是某钢铁公司是如何持有和保管自身的数据的?其是否采取相应保密措施或者设置其他管控措施?
首先从第二个问题倒推回答,即某钢铁公司以何种方式持有和保管自身数据。从行为表现来看,某钢铁公司系以多种方式在各类渠道主动发布自身价格信息,其为生产经营需要,通常通过两种方式发布出厂价格信息:一是主动在微信群中发布,且无入群资格审核和身份限制,微信群内主要是客户、代理商等等;二是直接电话告知特定客户。假设某钢铁公司认为自身的价格数据属于经营信息,具有价值且其他人不得获得,就应采取一定的保密措施,按照修订前《反不正当竞争法》第9条第4款规定的商业秘密予以保护,即“本法所称的商业秘密,是指不为公众所知悉、具有商业价值并经权利人采取相应保密措施的技术信息、经营信息等商业信息。”而从某钢铁公司的行为来看,其在微信群中发布且微信群无入群资格限制等等,足可以说明其对价格等经营信息并未采取相应保密措施。《最高人民法院关于审理侵犯商业秘密民事案件适用法律若干问题的规定》第3条规定:“权利人请求保护的信息在被诉侵权行为发生时不为所属领域的相关人员普遍知悉和容易获得的,人民法院应当认定为反不正当竞争法第九条第四款所称的不为公众所知悉。”故此,法律上商业秘密的核心要件为“普遍知悉和容易获得”。而某钢铁公司将价格信息发送至无资格限制的微信群的行为已使价格信息为较多人知悉,并且无进群资格限制事实上也使得该信息为他人较为容易获得,故此这些信息无法认定为“不为所属领域的相关人员普遍知悉和容易获得”。相当程度上,这些价格信息已处于半公开甚至公开状态,因此无法将价格信息认定为商业秘密。
进一步延伸该问题,从数据本身的特性角度出发,其与传统的商业秘密认定的“秘密点”亦并不相同。传统的商业秘密总是会有特定秘密点,比如可口可乐的商业秘密构成要素在于其精准的配方比例、制作工艺和原料组合方式,而数据的商业秘密点却并不容易界定清晰,权利人不能笼统地认为自身所持有的数据属于商业秘密(除非该数据确属从未公开的原始数据集合),而是应当清晰界定哪些是秘密部分,如特定字段组合、算法参数,哪些是公开或通用部分,即应清晰确定秘密点。另外,数据集合的“普遍知悉和容易获得”与小数据或单个数据的“普遍知悉和容易获得”应进行区分,不能认为数据集合被普遍知悉和容易获得,经过算法编排的小数据或者单个数据就被普遍知悉和容易获得,反之亦然。故此,应当在个案中衡量小数据或单个数据是否被普遍知悉和容易获得,确定可能与之具有对应关系的数据集合是否投入了实质劳动,集合是否被普遍知悉和容易获得,同时也包括是否采取相应措施以达到相应保密程度和效果等。
进而判断该数据来源的合法性,再反过来回答第一个问题。理论上而言,即便某钢铁公司的价格数据无法认定为商业秘密,也不意味着某电子公司就完全可以获得该价格信息,或者是可以通过合法来源获得该类信息,这需要进一步讨论价格统计行为、行业惯例的定性等问题。在指导性案例264号中,某电子公司系专事互联网数据服务、大数据服务和数据处理服务的商贸流通业数据统计调查企业,其获得价格信息的途径包括向钢铁生产企业、贸易商等获得一系列价格,在对其所采集的各类价格经过算法技术加工后,编制价格指数进行发布。某电子公司发布的并非某钢铁公司的原始出厂价格,而是经测算、编排之后的价格指数。同时,其获得的价格数据来源于某钢铁公司和贸易商等不同主体。故此,某电子公司获取价格数据的渠道并不唯一,所编制的价格指数也具有实质性投入的特征。这一点也是数据统计调查企业的基本运营方式。同时,根据《重要商品和服务价格指数行为管理办法(试行)》的规定,价格指数系能够发挥信号作用,服务市场价格合理形成的数据。钢铁领域作为涉及国计民生的基础行业和国民经济的支柱性产业,其价格指数也能够发生一定信号作用与市场预测作用。故此,根据行业特性、行业惯例以及特定领域的价格统计行为特点,某电子公司能够有较为充分的数据来源获得一系列相关数据,同时根据自身业务特点,可以将编制的价格指数公开发布。总结而言,从来源上看,某电子公司获取的数据基本上属于公开数据或者半公开数据,根据行业惯例,均具有合法来源基础。
(四)数据来源者权益
数据来源关涉数据来源者权益。如前所述,数据本身就在不同视角下呈现为不同表现形式,在数据流转利用与多重来源融合创新中形成新的数据。比如,综合旅游统计数据可来自多源数据,诸如景区的入园游客量、运营商脱敏后的区域客流聚合数据、重点商圈(景区)的实时监控人数、天气数据(辅助分析客流变化关联因素),经去重、校准后形成全面的旅游流量与趋势统计结果。如果从简单的字面意思理解“数据来源者”这一概念,其可能涉及众多主体,比如形成旅游统计数据的主体覆盖面极广,那么这些主体理论上均可被称为数据来源者。但是在数据二十条中,数据来源者的范围却较为限缩,即“推动基于知情同意或存在法定事由的数据流通使用模式,保障数据来源者享有获取或复制转移由其促成产生数据的权益。”该规定意味着数据来源者具有一定权利,同时其应对于后续产生数据具有一定促成作用。
现实中,比如网上购物情形,基于个人用户数据,可能会形成海量的行为数据和交易数据,同时物联网设备可能会产生运行数据和环境数据等,平台可以利用这些数据优化营销与管理。相对而言,数据来源者较为直接地促成了相关数据的产生,后续其还能够使用这些数据。但在上述旅游综合统计数据中,游客个人数据实际上已经完全脱敏,与平台数据不同,这种统计数据对于个性化特征的要求较低,总结此种个性化特征也并无显著意义,若游客只是作为一个“数字”进行统计,而并非利用游客自身的数据形成一个生态系统,那么可以说,游客自身的数据对于促成统计部门形成相应统计数据的贡献度较低,故此就很难认定为数据二十条所指向的数据来源者。
数据来源者的权利范围直接影响数据处理者的权利范围。对于数据来源者的概念,主要包括以下观点:
1.提供信息主体说:该说认为,数据来源者是指对数据的产生提供一定信息的主体。在数据处理者与数据来源者没有特别约定的情形下,数据来源者应当享有公平访问权、合理利用权、可携带权和自然人个人数据大规模处理拒绝权等权利。对数据来源者权利的保护既不应当不当影响数据处理者对数据权利的合法行使,也不应当不当妨碍数据的合理流通与利用。
2.数据初始生成者说:该说认为,数据来源者是指数据初始生成者,即在数据生成过程中通过投入劳动和成本、引发数据从无到有的主体,包括自然人、法人、非法人组织、国家。数据来源者基于对数据生成的贡献享有数据所有权,具体包括数据访问权、使用权和收益权。
3.促成作用主体说:该说认为,数据来源者是指对于数据的产生起到促成作用的主体,而非单纯地向他人提供数据的主体。数据来源者权益是数据来源者对其促成产生的非个人数据的权益,主要包括知情权、获取与复制数据的权利以及转移数据的权利。
这些观点从不同角度对数据来源者进行了界定,但基本上都认为,数据来源者系指向对于数据的产生起到促成作用的主体,权利范围至少包括访问权、获取与复制权等权利。亦有论者提出,数据来源者与数据处理者负有不破坏和不恶意竞争义务,即数据来源者或者平行数据处理者除非有正当理由或约定,否则不能将所持共同生成的数据以转让、许可等方式对外流转给与数据处理者具有直接竞争关系的数据处理者,从而稀释其他数据处理者的商业利益。基于以上分析可知,广义上的作为数据来源的主体,并非数据二十条中所特定化的“数据来源者”这一主体,数据来源者应当对于后续数据的形成具有较为直接的作用。之所以提出这一特定类型主体,旨在保护此类主体的相关权益,同时从利益平衡角度,促进数据流通利用。
在数据流通利用的背景下,数据来源者的权利范围有必要进一步明确与限缩。一个无法避免的问题是,数据来源者可否事先明确禁止或拒绝他人采集或利用自身数据,尤其是在数据可能处于公开或者半公开的情形下。比如在指导性案例264号中,若某钢铁公司事先明确禁止他人采集自身数据,是否合理且可行。这一问题意在说明数据流通利用的限度和制度前提。一般而言,公开声明对“基于同意的采集”具有法律效力,但不能对抗法定例外与对公开信息的合理采集。
客观来讲,在现行法律规范体系内,数据流通利用制度并无强制公开或法定许可使用的规定,仅为鼓励性、导向性的规定,那么在法定例外与对公开信息的合理采集之外,绝大多数主体都不愿将自身数据对外提供、分享,供他人使用。然而,亦如前述,以数据为中介,最终将要形成的是一个社会关系网络,若每个节点都无法打通,则最终的社会关系网络也难以形成。在指导性案例264号中,假设某钢铁公司的价格指数不出现在公开平台上、市场主体无法获得的话,则将影响某钢铁公司自身的产品营销活动,从长远来看,某钢铁公司在市场上的竞争力也将被削弱;而钢铁领域本身属于涉及国计民生的重要领域,对于重要商品和服务价格指数,国家对此予以管理和规制,就是希望此类指数可以更好地发挥价格预期功能以及为经济发展带来预测性作用。故此,这一案件在特定领域也较好地解释了数据来源者的权利限度。笔者认为,除自然人可对自身的个人信息明确拒绝采集之外,对于企业等其他市场主体而言,对其公开数据的采集与利用,与市场透明度以及市场竞争紧密相关,并且已形成一定市场惯例,故此在判断其是否享有数据来源者权益之时,应予限缩。
三、数据产品的权利归属与权益侵害救济
数据作为一种生产要素,只有在充分流转利用的基础上,才能实现从数据资源到数据资产乃至数据资本的不断价值升级。在指导性案例264号中,某电子公司发布的价格指数系通过采集多源数据之后,经技术分析而成,属于数据产品。在该案的裁判理由中也明确指出,对于这一数据产品,某电子公司享有经营性利益。那么,如何定性经营性利益?当形成数据产品之时,是否可以理解为相关主体享有对这一产品的所有权?如何界定数据产品并理解其特征,以及如何界定数据产品的权利范围与权利归属,进一步地,对于侵害数据产品权益或者类似的数据集合权益问题,又将如何救济并确定相应损害赔偿。这些问题都需要深入分析。
(一)数据产品的界定
数据产品是数据在不同视角之下的具体表现形态之一。《数据领域常用名词解释(第一批)》指出,“数据产品和服务是指基于数据加工形成的,可满足特定需求的数据加工品和数据服务。”从数据产品的定义来看,数据产品是基于数据加工形成的,能够形成“加工品”的形态。《产品质量法》第2条第2款规定:“本法所称产品是指经过加工、制作,用于销售的产品。”尽管该法中规定的产品主要是指传统的工业制造产品、加工农产品及食品、建筑相关配套产品和其他加工类产品等等,但是数据产品的定义在一定程度上也与产品质量法中关于产品的定义具有相似性,即均为经过加工而形成的加工品。虽然数据产品未必都以销售为目的,但数据产品也基本上是以“满足特定需求”为目的,即包含一定面向市场的目的性要求。
1.与非独创性数据集合的区分
与数据产品相近的一个事物形态是非独创性的数据集合。非独创性的数据集合实际上是一个在实践中形成的概念。有观点认为,数据集合以非独创性方式呈现,内容能够单独检索,具有独立价值。具体表现为,权利人通过合法经营,投入巨大的人力、物力、财力,收集、存储、加工、传输短视频平台数据,形成了包括用户个人信息、短视频和用户评论在内的非独创性数据集合。数据集合通常是外源、多源、异构的数据聚集在一起的“一个集合”,这些多源数据本身通常并非由持有数据集合的主体生成,但是这个“数据集合”却是由持有数据集合的主体生成的。
顾名思义,既然被命名为“非独创性的数据集合”,其往往缺乏独创性,故此很难通过著作权法中的汇编作品予以保护。数据集合通常分为公开与非公开两种类型,若持有主体对该数据集合采取保密措施,则该数据集合可通过商业秘密予以保护,这种情形基本上不存在争议。存在争议的,通常为公开的非独创性的数据集合。实践中,数据集合无论是公开的还是非公开的,为了形成该数据集合,持有主体通常都会投入巨大或一定的人力、物力、财力等等。根据《最高人民法院关于适用〈中华人民共和国反不正当竞争法〉若干问题的解释》第1条规定,“经营者扰乱市场竞争秩序,损害其他经营者或者消费者合法权益,且属于违反反不正当竞争法第二章及专利法、商标法、著作权法等规定之外情形的,人民法院可以适用反不正当竞争法第二条予以认定。”通常而言,对于公开的非独创性的数据集合,虽然数据集合的持有主体很难就这些非独创性的数据集合获得所谓的绝对权,但是却能取得交易机会与竞争优势等商业利益,该商业利益本质上是一种竞争性权益,属于反不正当竞争法所保护的合法权益。实践中,对于爬取公开的非独创性的数据集合的行为是否构成不正当竞争行为,主要由《反不正当竞争法》第2条和第13条第3款予以调整和认定。
一个难点问题是,在公开的非独创性的数据集合中有时会包括个人信息,在爬取该数据集合之时,个人信息通常也被一并爬取,对此应如何认定或存争议。数据集合在某些情形下可能包含个人信息,但通常不会包含敏感个人信息。此时,爬取包括个人信息在内的数据集合是否合法?爬取数据集合之后,又在此基础上进一步形成了衍生数据集,该衍生数据集的权利归属如何判断?对于这两个问题,大致分析思路如下。事实上,对于公开可访问的数据,任何主体都可以按照互联网规则下载或者爬取,但一般不得存在破坏技术措施等情形。由于该数据集合包含个人信息,处理个人信息应按照个人信息保护法的规定履行相应义务,若该个人信息不符合公开信息的合理采集情形,爬取该个人信息应取得个人信息主体的同意或授权。
爬取主体通常对于爬取后的数据享有使用权,可就其生成的衍生数据享有相应权利。一般而言,只要不是非法获取的数据都可以加工利用形成衍生数据,未取得个人信息主体的同意或授权而存在数据处理合法性瑕疵并不影响数据产权的取得,数据加工利用者可就取得个人信息主体的同意或授权进行补救,并可就生成的衍生数据集合享有数据产权,相当于形成一个新的数据产品。
回到二者的对比上,数据产品与非独创性的数据集合有所不同,数据产品是基于“加工”而形成的新的数据集合,即形成了新的衍生数据,但不是所谓的占有他人数据(即外源数据)所形成的多源数据集合。故此,相关主体对数据产品可享有所有权,但是对于持有数据集合的主体而言,其只能对非独创性的数据集合本身享有竞争性利益,除非其对该数据集合进行了“加工”,形成新的数据产品或数据集合。
2.与数据库的区分
与数据产品相邻的另一个概念是数据库。欧盟1996年通过的《关于数据库法律保护的指令》(以下简称《指令》)中规定,数据库系指对独立的作品、数据或其他材料的汇集,这些作品、数据或其他材料以系统或有条理的方式编排,并可通过电子或其他方式单独获取。《指令》的保护对象,系指那些由于其内容的选取或编排而构成作者自身智力创作成果的数据库,应作为此类成果受到版权保护。就数据库权而言,相应主体获得该权利保护的要件为“数据库制作者在质量和/或数量上对获取、核实与呈现数据库内容作出了实质性投入”。但是在欧盟司法实践中,对于如何认定属于实质性投入、该投入或投资事项并非由其他事项的投资衍生而来,以及如何认定对非实质性内容的重复和系统提取等方面,也存在较多争议,导致数据库权的适用范围在事实上被大大限缩,减弱了对数据库制作者的保护限度。
是否在著作权法的体系内特别规定数据库权,主要是考虑将数据库与汇编作品相区分,但这一思路我国并未采纳。在我国著作权法上,数据库如果可认定为汇编作品的,可按照汇编作品予以保护。数据库属于广义的数据产品的范畴,但是二者性质和定位却并不相同。之所以讨论数据库的法律定性,主要还是在著作权法领域寻找合适的体系定位,讨论数据库是否属于著作权法上应予特别保护的对象;而数据产品则主要考虑其经济意义与权属价值,着重于如何利用数据产出一个新的产品意义上的数据。故此,二者在法律上的定性与功能定位也有必要明晰。
3.数据产品的核心法律特征
由上可见,数据产品的核心法律特征,直接决定了其法律客体资格及保护路径选择,大致包括以下方面:
-非标准化:不同于传统工业品的标准化生产,数据产品依特定场景、独特处理逻辑与分析模型构建形成差异化生产,呈现非标准化特征,如基于同一公共数据开发的交通预测与商圈价值评估产品,在维度、算法与形态上差异显著。这种非标准化是满足个性化需求的必然,且通过明确功能目的、处理规则与稳定信息结论,可实现法律层面的特定化,即当事人可在合同中清晰界定交易标的,使其区别于其他产品,成为独立的法律客体和交易标的的基础。
-独创性要求标准低:数据产品与著作权法上的作品本质不同,数据产品的核心价值在于数据本身的价值,而非表达的独创性。数据产品属于功能导向型的智力成果,保护的必要性根源于其财产价值。在价值判定上,其价值依赖于使用者场景、知识与需求,同一产品对不同使用者的价值差异极大,与上述非标准化的特性紧密相连。可见,数据产品虽然也属于智力成果,但其独创性要求低,经济价值取决于场景与需求判断,同时其又不同于非独创性的多源(外源)数据集合。
-权利结构的整体性与不可分性:数据产品是原始数据经加工并可视化呈现的深度融合的有机整体,其价值源于加工后所体现的系统性功能,具有不可分性。在法律层面,数据产品本身若具有独创性,能够构成作品的,当然可由著作权法保护,但是这并不妨碍将数据产品作为一个整体进行保护,甚至将数据产品作为一个整体保护,更符合当下构建数据产权或数据权利的思路。
(二)数据产品的权利归属
数据产品由依法依规对原始数据开展采集、分析等加工行为并投入资本与技术的处理主体享有所有权。若当事人另有约定,则从其约定。对于数据产品的权属争议一般包括所有权归属争议、权利行使边界争议、数据产品使用范围争议、流转权限争议和经营权限争议等。
对于数据产品的所有权归属争议,主要聚焦原始数据与衍生数据的权利分割,尤其围绕数据产品是否构成独立财产权客体、加工投入能否支持主张享有所有权等核心问题。这些问题通常产生于数据处理者与数据来源者之间的权利边界划分,如指导性案例264号中所阐明的作为数据来源者的某钢铁公司和作为数据处理者的某电子公司,分别享有不同的数据权益。一般认为,除非当事人之间存在事先约定,否则就应由开发创造衍生数据的主体享有衍生数据的所有权。至于数据来源者是否享有访问权、获取与复制权等权利,则是另外的问题,应由相应法律和政策确定。
在委托他人处理数据的法律关系中,受托方仅依委托合同约定履行数据处理义务,常见于委托方提供一定数量的数据由受托方进行加工等情形。委托方与受托方之间,争议焦点为缺少明确权属约定时应如何确定衍生数据产品的所有权归属。从委托合同的核心逻辑来看,其主要是受托人依约为委托人利益处理事务,委托他人处理数据的情形也不例外。在有的地方性法规中也规定,“数据处理者委托他人处理数据的,受托方对委托处理的原始数据、过程数据、结果数据等,均不享有数据持有、使用、经营权益。法律、行政法规另有规定或者合同另有约定的除外。”就权利源头与行为性质而言,原始数据的初始权益本归委托人,受托人仅提供技术性劳务且无对数据处理目的和方式的自主决定权,其劳动投入对应的是劳务报酬请求权,而非获取数据权利。故此,在双方并无约定时,相应权益归委托人所有,才符合权利与投入相匹配的原则。可见,在数据委托处理的情形下,哪一主体合法持有数据并主导和决定处理行为,哪一主体就享有相应合法权益,即应由委托方享有衍生数据产品的相关权益。
(三)数据产品的权益侵害救济
侵害数据产品权益的行为与救济方式,在现有侵权法框架下可系统适用。
1.侵害数据产品权益的主要行为
-非法获取行为:此为最源头的侵权形式,指未经权利人许可,通过技术手段(如利用网络爬虫技术绕过安全措施和管理措施、利用安全漏洞或通过API接口超限抓取等)或非技术手段,盗取他人投入大量智力与财力形成的完整或核心的数据集合。这些行为直接侵犯了权利人对数据产品的占有与控制权益,造成损害的,被侵权人有权请求侵权人承担停止侵害、排除妨碍、消除危险等民事责任,并有权就其所受损失主张损害赔偿。
-非法使用行为:该行为表现为侵权人在非法获取数据产品后,或在合法获取但超出授权范围的情况下,对其进行商业化利用或非法转让给他人使用,获取利益的行为。例如,将他人数据产品直接或经改头换面后集成到自己的应用或服务中,用于自身的算法模型训练,或作为商业决策的依据;再如,将非法获取的数据产品以出售、共享、开源或再许可等方式提供给第三方,这些行为侵害了本应属于权利人的商业机会和市场价值等利益,构成对数据产品财产权益的侵害。
2.责任承担方式
侵害数据权益的责任承担方式可适用民法典等法律规定。若该行为同时也对数据主体的名誉权、商业信誉、社会评价以及商品或服务的信誉造成了负面影响,被侵权人也有权请求侵权人承担消除影响等民事责任。比如在一个企业征信数据平台不正当竞争纠纷中,法院认定长某公司作为非上市企业的征信数据原始主体,对其持股信息享有受反不正当竞争法保护的竞争性利益。金某公司、天某公司作为数据使用方,在收到长某公司投诉及证明材料后,未履行合理核查与数据更新义务,违反数据质量保证责任,构成不正当竞争。尽管长某公司未证明实际损害,但错误持股信息可能误导交易决策,损害其市场竞争权益及行业秩序。故此法院认定金某公司、天某公司应履行相应行为义务,并在相关网站将长某公司的持股信息列入相关公司的股东信息页面,刊登声明消除影响,并赔偿相应损失。
与此略有类似,在指导性案例264号中,某钢铁公司多次提出某电子公司公布的钢材价格指数中涉及某钢铁公司的价格,与同区域、同档次其他公司的产品价格差异太大,要求将该产品价格指数数据下架。虽然从总体案情来看,某电子公司通常对外发布的是价格指数,即便与某电子公司自身认识的价格水平有所差距,但从证据和综合分析来看,该价格指数也并无不妥。但若跳开此案案情,若一方因故意或过失持续发布偏离某数据主体实际价格情况的价格指数,有证据证明可能损害相关数据主体财产权益和名誉权或商业信誉的,被侵权人亦可要求侵权人依法承担消除影响等民事责任。
3.损害赔偿的计算规则
对于数据产品权益的侵害,仍应遵循损害填补原则。填补损害系侵权法的基本机能,系基于公平正义的理念,使被侵权人的损害能获得实质、完整、迅速的填补。数据产品作为新型财产,其无形性、价值衍生性及损害难以量化等特点,使适用传统的财产损失计算规则具有一定难度。当然,在现行法体系内,对于企业数据产品权益侵害的救济,可依《著作权法》第54条确立的“受害人实际损失+侵权人获益+权利使用费+惩罚性赔偿+法院酌定”五元标准以及2025年新《反不正当竞争法》第22条确立的“受害人实际损失+侵权人获益+惩罚性赔偿+法院酌定”四元标准等特别法规范调整。若相应损害导致的财产损失不在前述特别法的调整范畴内,则可通过作为一般规定的《民法典》第1165条第1款和第1184条进行调整,如指导性案例264号适用的即《民法典》第1165条。对于损失的计算,大致可遵循以下思路:
1.以权利人的实际损失为计算依据:此处的“实际损失”包括直接损失与间接损失。它不仅包括为研发该数据产品而投入的、因侵权而无法通过正常经营获利的直接成本,还同时涵盖两类间接损失:一是预期许可费的损失,即如果有证据证明当事人本可与特定第三方达成许可协议,但因侵权行为的存在导致交易失败,该笔合理的许可费可计入损失;二是为应对侵权而增加的维权成本,包括为调查、取证及提起诉讼所支付的合理费用。
2.以侵权人的违法所得作为计算依据:当实际损失难以举证时,侵权人的非法获益则成为确定赔偿额的客观标准。即便无法精确计算,也可以根据侵权人的经营规模、侵权数据的使用方式,对其可能的获益情况进行评估。此计算方法尤其适合适用于侵权人将非法获取的数据产品直接集成于自身的生产经营或服务中,用于提升用户体验、吸引流量,并据此获得广告收入、用户付费或风险投资等获利情形。权利人可依法申请法院责令侵权人提供与侵权行为相关的财务账册、后台流量数据、服务器日志及利润报表等。
3.法院酌定赔偿:在损失与获益均难以精确量化时,可由法院酌定赔偿。这是数据权益侵权纠纷中常会采取的赔偿数额确定方式。法院应构建一个综合性的考量因素体系,比如数据产品的自身价值(包括其开发成本)、独创性(比如智力投入密度)、所处的行业领域以及其市场应用前景与稀缺性等。
结语
指导性案例264号最重要的启发在于,数据领域的纠纷并非仅与科技发展或者数据重资产企业与平台有关,其与传统的信息采集、发布、流转等相关行业领域都密切相关。在法律适用上,若数据专门条款因存在立法漏洞而无法适用,或因其规定模糊而难以调整具体纠纷,则可转而适用作为一般性规定的过错责任原则,该原则对多数侵权行为仍具有基础性的解释力。
延伸来看,本案的启示还在于,只要涉及数据的传递与流转,就涉及数据的要素作用发挥与促进社会关系网络形成功能。数据作为连接的中介,以数据流通利用为制度基础,当数据处于流动的闭环或者开放关系中,就涉及不同主体之间的利益平衡,当下尤以数据来源者与数据处理者之间的权益冲突与平衡最为显著。在充分发挥数据价值的目标引导下,数据来源者和数据处理者实际上都负有一定程度的容忍义务。然而,在尚未有数据强制开放或法定许可使用的现有制度前提下,不同主体享有的权利和应履行之义务,仍是对相关行为进行法律评价的重要基础。故此相关主体享有的权利不应是模糊不清的,其义务亦应清楚明了,基于此才能明晰数据权益被侵害时的责任认定与承担。总体来看,指导性案例264号见微知著,其揭示的法律适用挑战直指数据产权界定与流通利用的制度核心,对厘清合法性来源、界定数据产品权益与民事责任认定等根本问题,具有重要的参考价值和启发意义。