刘晓春：数据功能类型视角下数据污染的治理维度-中国社会科学院大学法学院

刘晓春：数据功能类型视角下数据污染的治理维度

发布日期：2024-05-06　　　点击量：

作者简介：刘晓春，中国社会科学院大学法学院副教授、互联网法治研究中心主任。

文章来源：《人民司法》2024年第10期。

内容提要 数据在数字生产和治理过程中，承担了声誉信用功能、匹配连接功能、内容展示功能，数据污染通过刷单炒信、流量造假、数据投毒等表现形式，阻碍和破坏数据功能的发挥。在治理机制上，须考虑数据污染对于整体生态、个体利益、公共利益等不同位阶利益的损害，从生产、交易、消费、治理等环节，分别考察治理对象和治理主体的问题。在消费者权益保护等领域，刷单炒信行为具有较为充分的治理必要性。司法机关在数据污染的治理体系中，应当通过个案裁判完善已经明确的规则和标准，谨慎拓展新型权益的保护规则，并对平台治理机制进行确认、评价和约束，在能动履职理念指导下提供有效司法救济和保障。

一、问题的提出

数据要素构成数字经济发展和壮大的生产要素并提供重要驱动，这在我国政策、理论和实践层面已成共识。在数字经济与实体经济融合、产业发展和社会治理的数字化转型、新质生产力的高质量发展等方面，数据也是重要而基础的连通和融合工具，对于推动新型生产方式的创新和生产关系的构建有重要作用。在这个意义上，围绕数据要素流通市场构建基础法律制度，保障数据质量，促进数据高效利用和流动，防范针对数据的失范行为，不仅能够维护具体数据应用场景下的各方合法利益，更具有促进经济和社会发展的长远基础价值。

数据污染是针对数据处理过程中出现的多种行为和现象进行的形象描述和概括，并由此产生了进行法律治理的需求。总体而言，可以将数据污染概括为“通过数据的污染”和“针对数据的污染”两种情况。前一种情况下，数据作为污染工具而导致有害后果；而后一种情况下，数据则作为被污染对象而存在。

在实践中，比较常见的是数据作为被污染对象的情况。数据作为被污染对象时，所谓的污染主要指向的是针对数据质量的损害，从而导致数据在数字经济生产、社会治理中发生要素作用时，出现效果的偏差甚至导致他人合法权益的损害。对于林林总总、各具特点的数据污染行为，须基于数据在不同应用场景下发挥的不同功能，对数据污染的具体样态、效果以及导致的利益冲突和法益损害进行类型化的观察，提炼出相应的行为特征，对于具有负外部性从而产生治理必要性的相关行为给予负面的法律评价，并分别考察其对应的治理方案，从市场、技术和法律不同层次考虑治理数据污染的可能性，在此基础上探讨通过司法途径规范某些数据污染行为的必要性和可行性。

二、数据功能类型化下的“污染”行为及其效果

针对数据质量的数据污染行为，主要指人为恶意干预，损害数据质量，破坏数据的真实性、一致性、完整性等状态，造成相关利益受损的行为。

针对数据质量的数据污染如何发生，在不同情形呈现出何种样态，会带来什么样的利益冲突，导致何种利益损害后果，对这些问题的回答，须结合数据在生产过程和社会治理中所发挥的不同功能，分别考察其过程和效果来给出回答。具体而言，数据在参与数字经济生产和数字平台治理的过程中，其功能可以分为3类，分别是：声誉信用功能、匹配连接功能、内容展示功能。

1.声誉信用功能

在经济生产和社会生活中，声誉和信用构成人们之间交易、交往、联结的重要参考因素，良好的声誉和信用可以为他人提供形成信任的基础信息。声誉通过公开的或者群体内披露的信息和评价发挥其功能，在熟人社会、陌生人社会、现实生活和网络空间中，声誉一旦遭到损害，可能会导致主体交易利益受损或尊严感受的损失，面临修复困境。例如，通过造谣、诽谤等方式侵害自然人名誉权，或者损害商业组织的信誉，都是对于声誉的损害，法律上对此类行为也都给出了否定评价，认定其为侵权或不正当竞争行为。

信用也可以为主体参与交易和交往提供让他人产生信任的基础，不过与声誉一般自发形成不同，信用评分、评级、记录等通常有赖于建立一套体系化的机制，例如银行征信体系、个人信用信息、企业信用记录、平台信用系统等。信用信息通过公示、查询等方式可以为他人所获取时，也会构成声誉机制的一部分。

在以电商平台为典型代表的数字经济中，数据成为建构平台内商家声誉和信用的重要资料。在消费者对购买商品和服务作出决策时，商品的销量、用户评价、商家的评分等商业数据，都是消费者对经营者和商品服务进行判断的重要参考依据。与此同时，电商平台还会针对商家的经营和行为数据给出综合性的信用评分，按照平台规则及其评分标准，对于平台认可的积极合规经营行为给予肯定，对于违规行为进行处罚或者扣分，这些信用评分数据有些对外公示或可供查询，从而构成声誉数据的一部分，有些以内部评价工具的形式存在，成为平台对于商家进行管理、激励、处罚的依据。积极正向的声誉、信用信息可以促进交易。

声誉和信用机制在平台经济中的有效运作，有赖于底层数据的真实性、准确性和完整性。数据污染可能带来的信息扭曲和数据错误，会导致形成的声誉和信用与实际不符，从而无法为平台经济的正常运作提供有效的信任基础。数据污染带来的信息扭曲有两种可能的维度：一是通过数据造假来确立虚假的积极声誉和信用，典型的如“刷单”“炒信”等虚假交易、虚假用户评价的现象和行为；二是通过人为增加负面数据造成竞争对手声誉和信用受损，典型的如组织恶意差评的“水军”行为等。

通过“刷单”“炒信”方式累积和展示虚假交易数量、虚构用户好评的商家，目的是通过虚假数据欺骗、误导消费者，对信以为真的消费者的购买决策造成影响，符合“虚假或者引人误解的商业宣传”的典型特征。在这种场景下，数据污染导致声誉数据造假，一方面侵害了消费者的知情权，另一方面也对累积真实声誉的商家构成了不正当竞争，同时也损害了整体平台经济的生态及竞争秩序。这类最为典型的数据污染行为，已经被明确的立法予以了否定评价，司法实践中比较常见的也是与此相关的案例。

针对商业主体信用数据的污染行为，例如人为干预、操纵、篡改和造假与信用评分相关的数据，会导致商家在平台上的信用评分与事实出现偏差，除了扭曲与交易相关的信任机制之外，也会影响到平台的管理，导致平台利益和平台生态受损，也可能导致与治理目标相关的公共利益遭到减损。

2.匹配连接功能

数据的第二个基本功能是为资源和信息的匹配和连接提供基础支撑，这一过程通过基于数据的处理和分析以及算法的匹配和推荐来完成，对资源、信息进行匹配连接是数字平台生态系统进行资源分配、协调、控制的基础模式。

具体而言，匹配连接功能包括以下方面：首先，在基于用户个性化特征进行内容和商品服务推荐的场景下，平台基于用户画像预测其偏好，并对可能符合其偏好的内容和商品服务实现精准推荐，在这个过程中，无论对于内容、商品、服务特征的判断，还是对用户画像标签的确定，都须对点击、浏览、销售数据、用户的行为数据等进行分析。其次，在内容排序的场景下，平台在对内容和商品服务进行展示和排序的时候，排序算法也须根据特定的规则、内容和商品服务的相关数据表现来决定呈现的优先次序，比如，浏览量、评论数等数据就会导致相关内容被判定为热点从而进入热搜榜单，进而获得更高的曝光量和关注度。最后，在平台治理的场景下，平台需要基于用户个人或者集体的行为数据以及生态中的环境数据，来判断是否存在介入治理干预的必要，以及启动何种干预机制，这在反电信网络诈骗、防范和打击网络犯罪、内容治理、网络暴力治理、数据安全维护、未成年人保护等典型的治理领域都广泛存在。

关于数据匹配连接功能下的数据污染，实践中比较典型的是流量造假行为。平台经济也被称为流量经济，亦即流量所代表的用户注意力存在实质性的商业价值，因此通过伪造数据形成虚假流量，可以通过以流量为导向的算法匹配和推荐机制，进一步攫取更高的曝光机会，迅速获得大量真实流量的匹配，例如通过刷出大量虚假点击、点赞、转发、评论等数据，上热搜榜单、增加直播间流量、增加内容推送机会，进而从而将流量转化为商业收益。

通过虚假流量增加曝光度的数据污染行为，与刷单炒信行为相比，虽然二者都跟内容传播相关，但在机理和功能上存在区别。虚假流量一般情况下主要的作用就是影响内容的匹配和连接，并不是直接通过捏造声誉和信用信息欺骗消费者，而是通过操纵数据来欺骗算法，使算法形成错误判断，达到高流量带来的高价值匹配，提高内容的商业价值。

针对数据匹配连接功能的数据污染行为会造成数字平台生态系统资源调配机制的失灵，本来不应获得推荐的内容被大量曝光，平台算法设定的本应优先推荐的内容无法被有效识别和筛选出来。如果不能区分真实流量数据和被人为操纵的流量数据，就相当于放纵大量作弊行为，这对诚信经营的商家是不公平的，同时对平台进行整体生态系统管控、协调和治理的利益也是严峻挑战。在司法实践中，针对这类数据污染行为，例如通过群控软件模拟和操控用户行为数据等，通常是援引反不正当竞争法的原则条款即行为人违反诚实信用原则和商业道德，给出否定评价。在这类案件里，法院通常认定遭到侵害的合法权益是平台的正常经营秩序和数据生态，这与声誉信用类数据污染案件有所不同，后者通常可以找到被具体数据欺骗和误导的消费者群体。

3.内容展示功能

数据的内容展示功能更多指向的是数据所承载的信息内容层面，例如用户对于视频、微博内容的浏览和体验，其价值体现在用户对于数据承载内容的直接认知，而并非通过为其他内容提供声誉、匹配等功能来实现。在数据提供内容展示的功能下来考察数据污染，可以从以下两个方面来考虑承载内容的数据质量控制问题：

首先，在用户人为认知的内容领域，数据污染体现在批量生成的虚假内容对于内容生态和舆论氛围的负面影响，例如通过人工智能技术生成深度合成、深度伪造的音视频内容，通过组织水军引导舆论热点等，生成式人工智能技术的发展使得此类行为成本明显降低。此处，水军现象虽然在技术手段和表现形式上与前述第二种流量造假行为中的模式有所重合，但是从功能上，此处讨论的水军造成的污染主要在内容层面而非流量层面。需要指出的是，从内容维度来看，有害和不良内容的生产和传播，在某种意义上也可以认为是对于内容质量的损害，构成广义上的污染，例如低俗内容、网络暴力等造成了对内容生态的污染。但是为了防止本文所讨论的数据污染范围过宽，且针对有害和不良内容质量进行评价的治理机制已经自成体系，故而并无必要将其纳入到数据污染的范畴中来。

数据内容展示功能下的第二个方面，是数据作为机器学习内容的场景下，通过数据投毒等行为造成的数据污染。这通常在数据训练和技术开发过程中出现，数据和人工智能技术领域所讨论的数据污染一般都是这种情形，并主要通过开发各种技术对抗方式来实现识别和防范。技术攻防上的数据投毒、污染行为的危害主要体现在企业开发成本的上升，但处理不当也会导致对外提供服务或者产品质量的受损，甚至导致合规层面的负面影响。实践中已经出现此类声称由于数据投毒而导致终端产品生成不良内容的现象。

三、数据污染治理的对象与主体

数据污染实际上是一个框架性的概念，在具有共同行为构成特征的前提下，由一组包括不同功能、效果、利益冲突的行为和现象组成。在考虑对数据污染进行治理的时候，须结合所涉领域、功能、效果、利益进行分别考察和处理，很难进行统一规则的设定。针对不同功能类型下的数据污染，要考虑谁来治理，治理哪些问题，以及如何治理等问题，形成清晰的治理层次。

（一）治理对象

数据污染行为因其对于数据质量的负面影响，导致的后果主要体现在经济秩序和平台治理秩序的运行之中。因此，数据污染治理对象也主要为这两类秩序中的数据污染。

1.经济秩序中的数据污染

在平台经济的运行过程中，数据的功能可能在从生产、交易到消费的各个环节都有所体现。一部分是在生产环节，如平台经济中通过数据和算法实现的匹配和连接，以及作为训练数据用于人工智能等技术开发过程，数据污染会导致正常生产秩序的破坏。一部分是在交易和消费环节，如通过“刷单”“炒信”形成的虚假声誉和信用数据，会导致对消费者的欺骗和误导，并进而导致消费者利益受损。在平台经济中，很多情况下会存在生产和消费过程合一的情况，例如，用户消费行为累积的数据经过处理之后，可以成为平台在生产过程中进行资源协调和匹配的依据，生产和消费的转化在平台生态系统内部通过数据和算法连接在一起。

现有的法律体系对生产、交易和消费各个环节采用了不同的治理和干预思路。消费环节由于历来存在信息不对称和力量不对等，因此以消费者权益保护为导向的法律体系比较发达，对于消费领域的刷单炒信、流量造假构成消费者欺诈的行为，给予了明确的否定评价，认定其构成对消费者权益的侵害行为。此外，刷单炒信行为的反不正当竞争法适用，在立法和司法实践中都已经比较明确，行政监管也有介入的依据。

在生产和商业交易环节，数据污染的法律评价则要相对复杂一些。生产和商业交易环节的数据污染，须结合其导致的后果和侵害的法益类型来分别考察。例如，虚假流量导致的具体交易中资源错配，可以由平台经济内部自治进行管理，只有在虚假流量导致明显的负外部性后果，例如通过组织水军将用户引流到电信诈骗，才会产生公权力干预的必要性。此外，如果生产过程中的数据污染导致了整体生态秩序的破坏，例如流量造假导致平台整体生态中的信息扭曲和失灵，给资源有效匹配造成了阻碍和成本增加，造成对平台内整体竞争秩序的破坏，有可能构成对于平台合法权益的侵害，有必要给出法律上的否定评价，在司法实践中，通过对于涉及“群控软件”系列案件的不正当竞争行为认定，实现了这一治理和保护目标。

2.平台治理秩序中的数据污染

与经济秩序不同，平台的治理秩序是平台通过对平台内主体的管理来实现治理目标，这些目标可能是公共治理目标，如数据安全、内容治理、犯罪防范、权益保护、未成年人保护等，也可能是平台自己的治理目标，包括平台对自有价值观、伦理的贯彻，内部社区规则的维护，有时也包括竞争性的考虑。

在涉及公共治理目标的领域，数据污染会给实现治理目标带来阻碍，因此通常是公权力介入治理的重点。例如，在内容治理、网络暴力、犯罪防范等领域，都出台了相关的法律文件要求对流量造假、水军引流等数据污染行为进行较为严厉地打击和管控。而在涉及平台自身目标的领域，一般由平台通过内部治理机制来实现其目标，只有在平台治理过程中存在明显侵害平台内主体合法权益的特定情形，才会出现公权力予以干预的必要性。

（二）治理主体

从须治理的数据污染的层次和结构来看，并非所有的数据污染都须公权力介入治理，一般来说，涉及对公共利益的损害时，须进行治理干预，在涉及个体利益时则须区分不同情形考虑公权力干预是否必要，在涉及平台整体生态时，也要判断哪些可以由市场或者平台进行调节，哪些则须公权力的介入和干预。

1.平台治理的角色和定位

无论从理论上论证，还是从实践中总结，平台都在数据污染治理过程中承担最为主要和基础的角色。平台通过制定规则、执行规则、纠纷解决等手段，将平台生态系统内部涉及生产、交易、消费等领域的数据污染治理纳入进来。一方面平台须履行相关法律文件要求其承担的公共治理和管理职责，在这个层面上，平台在治理过程中，须受到公权力较强的监管、约束和指导，确保公共利益和目标的实现，否则就要承担不合规的法律后果，在这个层面上，公共政策目标也是通过平台治理的微观运作来实现的。另一方面，平台基于自身生态治理的目标和需求，对于数据污染行为进行打击和防范，开发相应的技术攻防系统，建立有效的内部声誉、信用、匹配机制，这一过程并不必然与公权力发生联系，但是，平台在自有生态的正常运营遭到数据污染行为的严重破坏时，也会选择诉诸于寻求行政或司法的保护和救济，典型的如平台对于群控软件破坏平台流量生态的司法诉讼。

2.政府——平台的发包合作

在政府关切的公共政策治理领域，政府和平台之间会形成既有监管、制约、指导，又有发包式的分工合作关系。根据政府关切的具体领域优先级的不同，平台治理受到监督和制约的程度也有不同，在某些领域政府会通过行政手段直接对微观层面进行干预。例如，在流量造假、组织水军导致出现不良舆情导向或者引流到电信诈骗犯罪等场景，政府倾向于通过直接打击、目标量化、精细化指导等方式进行强化监管。而在其他一些场景，例如经济属性更强的“刷单”“炒信”场景，或者人工智能训练数据投毒等企业内部数据生产过程，政府倾向于不介入或者不主动介入，仅在出现特定后果时进行事后处理，而把治理的主动权交由平台来判断。

3.平台——司法的治理衔接

政府和平台之间的发包治理模式，更多强调的是针对数据污染行为事前事中的管控和干预，而对于数据污染行为的事后治理，一方面可以由平台建立内部的纠纷解决机制，对于数据污染导致的平台内利益冲突和争议进行裁决和处置，另一方面，相关的利益冲突也可以进入司法程序，由法院通过司法裁决来厘清利益关系，定分止争。在平台作为司法诉讼中一方主体的时候，可能有几种类型：一是平台作为原告主张其利益受到数据污染行为的侵害，通常体现为平台内部的生态秩序受损：二是平台作为被告，数据污染行为的受害者如消费者可能提出平台未能尽到治理责任，此种情况下法院须判断平台在数据污染治理上的责任；三是平台作为被告，被诉滥用其治理权力，对于数据污染行为的处置行为造成了相关主体的利益损失，此时法院须考察平台治理及其规则的合法性基础和行权边界。

四、数据污染治理中司法的能与不能

在数据污染治理中，平台治理、行政监管、司法诉讼互相衔接。由于数据治理涉及的功能、场景、利益冲突复杂多样，相关的公共政策和治理目标也各有不同，有必要厘清司法机关在数据污染治理中承担的角色，有所为有所不为，既发挥能动履职对于数字经济良性秩序的保证和促进作用，又能将司法权的行使保留在必要的范围内，形成精准的治理效果。

首先，对于立法上和实践中已经确定具有违法属性的数据污染行为类型，通过系列典型案例明确并且完善其适用规则。目前，法院已经针对虚假宣传类的“刷单”“炒信”等典型数据污染行为进行界定，适用反不正当竞争法的规定。在具体适用中，须进一步界定这些行为的构成要件，例如，通过小额红包诱导客户进行好评，是否构成虚假评价，这一问题在相关主管部门的立法修法过程中存在较多争议。对于此类行为的“恶意”“虚假”如何判断，须考虑哪些证据可以证明用户的主观状态。法院对于此类行为在何种情况下构成“恶意”“虚假”的判定，也可以反过来促进平台治理标准的明确和规则完善，能够起到以个案促规则建立和完善的效果。

其次，对于立法上尚不明确的新型法益，探索提供司法保护的范围和边界，并完善相应的认定标准规则体系。例如，在流量造假行为导致平台资源匹配和连接功能出现失灵时，平台基于其内部生态秩序遭到侵害而主张司法救济，这种法益类型并未在立法中明确规定，司法实践中，法院针对群控软件等行为造成的平台生态秩序损害，依据反不正当竞争法原则条款承认了平台的合法权益。但是这种基于原则性条款的裁判规则尚须细化，比如流量造假行为是否应达到一定的规模和数量，如何准确评估平台生态秩序受到影响的程度和损害后果，平台基于生态秩序的利益诉求是否存在较为清晰的边界等。此外，相关主体在受到虚假流量等数据污染行为影响后，是否可以主张司法救济，也是新型权益拓展保护的问题，比如，消费者在直播间下单后得知直播间流量造假虚高，在具体购买商品或服务本身没有虚假宣传的情况下，消费者是否可以主张流量造假意义上的权益受损，这些问题关涉新型权益的保护和适用，都是司法机关可以在个案中进行探索可能和拓展的领域。最后，在涉及公共政策和利益的数据污染领域，比如流量造假、深度伪造导致内容生态恶化、网络暴力频发等问题，此时数据污染不一定导致具体主体的直接受损，但是对于整体公共利益和生态造成了损害，在作为原告的私主体缺位的情形下，司法机关可以探索通过公益诉讼等方式，针对公益受损的数据污染行为进行能动治理，开拓司法机关参与国家治理的新领域。

最后，司法裁判可以与平台治理形成有效衔接，对于平台治理实践进行司法评价、提供规则指引。司法裁判与平台治理的关系可以分为3个层次来展开。第一，对于平台和企业可以通过技术对抗措施、市场调节机制等进行内部有效治理，且不涉及消费者权益保护、内容生态治理等公共政策目标的领域，由平台和企业自行治理。第二，对于诉讼纠纷中涉及的平台规则及其执行机制，由司法机关评价其是否合法、确认其自治范围，为平台治理数据污染行为的权限提供司法认可和保障，激励平台在合法范围内进行治理措施和机制的创新。第三，识别并界定平台治理权力的边界和限制，对平台在数据污染治理过程中适用的滥用平台处置机制的实体和程序规则作出评价，必要时可以为平台创设规则进行规制，或为平台内主体创设相关权利，如特定情形下的数据获取和接入权，协助相关主体对于数据污染及其后果获得知情以及取证的权利，通过司法机关对于平台治理机制的局部调整，实现各方利益的整体动态平衡。

论文文章

刘晓春：数据功能类型视角下数据污染的治理维度

友情链接