数字化浪潮席卷全球的当下,数据已成为经济社会发展新型生产要素。然而,随着数据爆炸式增长,数据污染问题日益凸显,成为制约数字时代健康发展的“绊脚石”。数据污染不仅损害数据价值固有的真实、完整与实用属性,也侵犯了数据主体的合法权益,包括隐私权、知情权和选择权等。因此,应当结合数据安全法、个人信息保护法、反不正当竞争法等法律和政策,构建数据治理框架,净化污染数据,营造数字时代守正创新的法治屏障。
一、数据污染的产生机理与表现形式
数据污染是指在抓取汇集、加工挖掘、传输流通、分配交易等环节,数据受到人为修改或不当干扰而导致元数据失真的质量损害。原始数据失真造成的直接后果体现为衍生信息的扭曲映射,数据完整性与真实性遭受污染使得数据无法发挥原有功能,且容易产生虚假误导。数据污染必定是人为主观能动造成的故意或偶然行为,污染危害可以事先预防并加控制。
在技术层面,数据污染主要表现为篡改、虚构和重复等投毒行为。数据篡改指出于恶意目的且未经授权的人为修改数据,通过破坏原有训练数据导致模型输出错误结果,引发决策偏差或失效,最终产生恶意攻击者所期待的结果。数据虚构指故意伪造或不真实的信息,利用算法漏洞生成虚假内容欺骗数据接收端,具体表现为刷单炒信、流量造假等。数据重复指在数据集中出现多次相同信息,冗杂与混乱的数字脏值在一定程度会加剧模型训练压力,影响计算的系统性能。
在权益层面,数据污染往往“寄生”于互联网不正当竞争中,表现为破坏他人持有数据的完整性、争夺对数据源的使用权以及不当抓取利用数据等形式。以刷单炒信、恶意评论为首的数据污染成本较低,且易形成黑灰产业对电商、短视频等数字平台的经营造成损害,相关纠纷频发。在自动驾驶、智慧家居等智能生活场景中,数据污染对核心模块产生的定向干扰会直接扩散到设备终端,侵害个人隐私与财产安全。
二、受污数据的风险危害与困境预警
数据污染的样态多元化、生成隐蔽化以及扩散连锁化特征加剧了司法实践中所涉事实认定与法律适用的争议性。因此,有必要厘清受污数据潜在的危害与困境,以此作为解决法益损害与利益冲突的基点。
个人隐私安全与信息保护危机。个人信息在被记录、追踪、传播过程中,大量数据伴随经济利益而产生。而个人信息一旦进入市场,其主体权益基本便处于不可控状态,数据污染更是加剧其负外部效应,扰乱经济生态与社会秩序。
受污数据侵害个人隐私与信息安全的权益已超出传统认知范围,不仅限于名誉权、肖像权等人格权益,经济损失、差别对待、人身攻击等危害也持续加剧。无授权篡取个人数据使隐私泄露,是经济、精神损害和人身威胁等多重侵害的叠加。涉嫌价格欺诈的“大数据杀熟”是差别化对待的典型例证,不良商家依托算法对个人数据污染,使不知情顾客对商品价格陷入误解而选择购买,严重损害消费者权益。
企业系统运营与不当竞争危机。受污数据会阻碍企业的运营发展。系统数据在企业数字化转型过程中发挥着至关重要的作用,数据质量决定系统效率。当企业内部系统数据受到污染时,会出现数据不一致的差异解释或者数据库结构的不统一,导致系统中心的数据抽取不稳定、运营成本增加且后续业务的决策异常困难。
同时,企业与企业之间、行业与行业之间利用数据污染扩张形成市场垄断的现象已初见苗头。如个别电商企业虚构交易数据,不正当地提升商誉牟取暴利;一些测评、宣传平台虚构评论数据,引导用户的消费选择等。数据污染下的不正当竞争严重破坏营商生态与网络秩序,同时增加了企业牵涉相关诉讼与赔偿的法律风险和负担。
三、数据清污的治理策略与实践探索
数据清污本质是数据质量治理问题。当数据源被大量劣质内容污染,数字生态将逐步崩溃,生成高品质数据以及维护数据权益都将无从谈起。故此亟须从源头预防、过程监管和末端救济三环节进行治理清污。
其一,源头防范污染数据生成。源头根除污染是保障数据质量的基础,根据数据安全法第二十一条的规定,国家建立数据分类分级保护制度,对数据实行分类分级保护。基于此法律框架,可对数据质量分类分级,建立相应的污染预警与风险评估机制。通过监管预警与风险评估,及时发现数据或操作异常,尽量避免受污数据的产生;明确针对不同类别数据要素的违法违规行为和相应的法律责任,为数据的安全管理与风险防范提供约束。
其二,过程阻断受污数据扩散。在迭代迅速的数字时代,数据污染是难以避免的,做到受污数据可证明、可追溯是防污染扩散的关键,因此要建立数据污染责任追究机制。秉持“谁出数谁负责、谁签字谁负责”的原则,追溯到数据出处与责任人,提高数据的可靠性。将“投毒”企业与个人纳入诚信黑名单,一旦传播受污数据,依法予以处罚震慑,涉嫌犯罪的,移交司法机关依法追究相关责任人的刑事责任。此外,升级算法与更迭技术以实现数据脱敏。减少敏感数据在加工、传输、使用等环节中的暴露风险,降低与受污数据接触所造成的连带污染风险。
其三,末端清洗与修复受污数据。定期对数据进行清洗与修复是纠正污染问题的必要措施。可依据法律法规与行业标准,制定数据清洗的具体规则。司法裁判可与平台治理形成有效衔接,对平台去污实践进行司法评价、提供规则指引,并在必要时对平台治理权力的边界和限制进行审查。在涉及公共利益的数据污染领域,可探索通过公益诉讼等方式,针对公益受损的数据污染行为进行治理。整体而言,逐步构建一个模块化、可监测、可扩展的数据治理框架,以实现数据的持续管理与质量控制。
(作者单位:天津铁路运输法院;天津财经大学法学院)