隐私计算概述

导读
近期一则新闻爆出，知名社交软件Twitter因安全漏洞被黑客入侵，有超过540万个账户的联系方式泄露。每年关于数据泄露的事件屡见不鲜，这仅仅是众多数据泄露新闻中具代表性的一条。
作者：蒲语彤
单位：中国移动智慧家庭运营中心
来源：移动Labs

随着移动互联网的迅猛发展，数据在当今数字经济时代发挥不可或缺的作用。互联网用户享受着大数据应用所提供的个性化服务，为生活带来了极大的便利。但由于数据本身具有敏感性、隐私性等特性，在数据的采集、存储、传输、使用和分析的过程中，随时面临着泄露风险。大数据采集的信息包括联系方式、地理位置、兴趣爱好、身份等敏感信息，这些个人隐私信息一旦泄露将带来不可估量的安全隐患。

因此，越来越多的政府、组织和企业开始重视隐私保护问题，如何从源头上防止隐私泄露，隐私计算的出现为数据安全提供了解决方案。

1什么是隐私计算

2016年，隐私计算概念在《隐私计算研究范畴及发展趋势》中被正式提出，其被定义为“面向隐私信息全生命周期保护的计算理论和方法，是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄漏代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。”

简单来说，隐私计算是指在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合，达到对数据“可用、不可见”的目的；在充分保护数据和隐私安全的前提下，实现数据价值的转化和释放。

2隐私计算的政策现状

数据安全是数据的基础性需求，数据隐私则是建立在数据安全基础之上的数据价值理念。

针对数据安全与隐私问题，国内外近几年已初步形成了由法律法规、规范性文件及技术标准等组成的多层次法律政策体系，为隐私计算技术发展提供了有利的政策背景，强化了数据安全保障。

近年来，我国的隐私问题也从理论上落地实现，相关话题从懵懂的意识、社会讨论、共识逐渐生成，最终到立法机构推动、行业标准形成、约束机制等方面落地。

如图2所示，我国陆续出台多部重要法律，逐步隐私保护的法律。其中，与数据隐私、数据安全相关的法律法规主要有三部：2017年生效的《网络安全法》、2021年9月生效的《数据安全法》和2021年11月开始实施的《个人信息保护法》。这三部法律全面构筑起了国内数据安全领域的法律框架，共同确立了国内数据隐私、数据安全的法律框架主题，分别在网络安全管理、数据安全与发展、个人信息处理权利义务等领域做了界定与规定，确保数据流转的安全、隐私有法可依。

3隐私计算技术

隐私计算是一个新兴的跨学科综合技术，涉及密码学、机器学习、硬件、BI 分析等。目前，隐私计算技术通常分为以下四种：安全多方计算、联邦学习、可信执行环境、多方中介计算。

3.1 安全多方计算（MPC）

安全多方计算（Secure Multi-party Computation）即在参与方不共享各自数据且没有可信第三方的情况下，仍可以进行协同计算，最终产生有价值的分析内容。

安全多方计算要确保输入数据的独立性、传递数据的准确性以及计算过程的正确性，同时不能把输入值泄露给参与计算的其他成员。此外，它在数字签名、电子拍卖、秘密共享、门限签名等场景中有着重要的作用。

3.2 联邦学习（FL）

联邦学习（Federated Learning）也被称为联邦机器学习、联合学习，是一种分布式机器学习技术或框架，最初是由谷歌提出的。

其实现了在本地原始数据不出库的情况下，通过对中间加密数据的流通和处理来完成多方联合的学习训练。目前联邦学习技术通常与安全多方计算技术以及区块链等技术相结合。

3.3 可信执行环境（TEE）

可信任执行环境（Trusted Execution Environment）是一种具有运算和储存功能，并且能提供安全性和完整性保护的独立处理环境。在该环境内的程序和数据，能够得到比操作系统层面更高级别的安全保护。

其实现原理是通过软硬件方法，在中央处理器中，构建出一个安全区域，计算过程执行代码TA（Trust Application）仅在安全区域分界中执行，外部攻击者无法通过常规手段获取和影响安全区的执行代码和逻辑，以此来实现敏感数据的隐私计算。

3.4 多方中介计算（MPIC）

多方中介计算(Multi-party Intermediary Computation)是由谭立、孔俊提出的一种新的隐私计算方法，是指多方数据在独立于数据方和用户的受监管中介计算环境内，通过安全可信的机制实现分析计算和匿名化输出的数据处理方式，是一个计算管理系统。在MPIC中，数据方的原始数据由其去标识化后输入中介计算环境或平台参与计算，完成计算后立即被删除，匿名化数据经审核后按指定路径输出。在MPIC的特定环境和规则下，信息数据的身份标识经过加密和标识化的处理，因其算法具有不可逆性，故无法恢复为原始数据，满足了匿名化的一个要求，即不能复原；同时，由于这些去标识化的信息数据被封闭在特定受监管环境或平台中，客观上达到了匿名化的另一个要求，即无法识别特定自然人。故被处理的数据实质可视同匿名化，不再属于个人信息，无需征得个人同意就可进入中介计算环境或平台参与计算。

不同技术往往组合使用，在保证原始数据安全和隐私性的同时，完成对数据的计算和分析任务。

4隐私计算的价值

互联网用户每时每刻都在产生数据，以及与数据打交道，数据已经与我们每个人乃至整个社会的方方面面都密切相关。保障数据的安全以及对于数据的隐私保护就成为了当下亟需解决的诉求。

对于个人来说，我们的个人信息与所产生的数据如果被泄露，可能会带来身份盗用，财产损失，亲友被骗，严重的甚至会威胁到生命安全。

对于企业来说，数据是企业的命脉之一。经营数据涉及到商业机密，一旦泄露对于企业的经营可能造成毁灭性的打击。而企业掌握的用户数据一旦泄露，同样会给企业带来巨额的损失。

对于国家来说，数据的安全是直接关系到国家的安全，没有数据安全，国家层面的数据主权就无从建立。

而隐私计算是数据安全与隐私保护的最优解决方案之一，它既可以从保证数据在行业的各个组织之间发生交互过程中的安全和隐私，又能打消个人或者组织对于数据安全性的担忧。通过引入隐私计算，保证关键数据能够在安全且保护隐私的环境下共享出来，高效地参与到更多的社会活动和商业活动中，让整个社会的运转能够降本增效，释放数据资产的价值，带动经济增长。