据英国《卫报》的最新报道,澳大利亚最大的医疗保险公司Medibank因黑客攻击泄露了390万条客户个人信息,可能造成2500万至3500万美元的损失。但就是这些记录了受害人账户密码、身份证复印件和联系方式等个人信息,在数据黑市的叫卖费用最低只要500美元。
对此,澳大利亚网络情报分析专家们也不无担忧,而如何解决数据泄露问题、最大限度的保障数据安全则成为了摆在全行业专家面前的棘手难题。这时,大家都将目光聚焦于一项“新”技术——隐私计算。
隐私计算是什么?
从名字就可以看出,隐私计算是一种保障用户隐私的计算方式,其中尤以安全多方计算(MPC)、联邦学习(FL)和可信任执行环境(TEE)三大要素最为突出,具体表现为“数据可用不可见”。
比如文章开头我们提到数据泄露的医疗与金融行业就是隐私计算应用的重点领域,因为这两个行业的数据与用户的个人隐私密切相关,是最核心、最隐秘的信息。但是就行业的服务特征来说,却是希望能够利用这些数据为每个人打造量身定制的方案,比如个人的医疗健康保障计划或者理财计划。
隐私计算的出现,保障了数据在安全使用的前提下通过第三方分析机构产生价值,进而推动应用的扩大与发展。据国家工业信息安全发展研究中心近期发布的《中国隐私计算产业发展报告(2020-2021)》显示,隐私计算产品市场规模约为10亿元,基于隐私计算的数据交易应用模式市场或将达到千亿级。
大数据隐私计算平台打造更安全的数据应用
也是为了应对数据安全与合规中的挑战,2022年初,浪潮电子信息产业股份有限公司携手北京可利邦信息技术股份有限公司(简称可利邦)等多家单位,共同成立了“大数据隐私计算联合实验室”,充分发挥各方资源优势,依法依规推动大数据隐私计算研究及应用,并共同开发面向银行、保险、大健康等行业的隐私计算平台、数据产品及智能应用。
这其中最重要的就是“大数据隐私计算平台”的推出。刚刚我们提到了隐私计算的三大要素,这其中安全多方计算(MPC)与联邦学习(FL)主要解决的是密码学与算法的问题,由可利邦负责实现算法调优;而可信任执行环境(TEE)则更多侧重于硬件层面的安全算力平台,这也正是浪潮信息所擅长的领域。按照规划,在双方共同的软硬件努力下,这套大数据隐私计算平台可以提供横向、纵向和迁移联邦学习,实现多种场景下数据源互联互通,确保原始数据不出域,数据输入、运算、结果输出全流程密态保护。
“我们实验室下研发的隐私计算平台,是基于多方安全计算、联邦学习、可信执行环境这三个技术方向不断进行开发完善,尤其是将多个技术路线融合,取长补短,优势互补,不断突破技术应用的瓶颈”。在谈到平台特性与应用优势的时候,可利邦副总经理万莉介绍说。
相对于业界其他解决方案来说,全新的“大数据隐私计算平台”在使用容器化架构的同时,通过资源池化实现了智能的算力分配,在联邦模型训练的时候能够支持DSL和Pipeline建模,并通过图形化界面极大简化了部署过程,降低了操作和使用门槛,更让运维变得更轻松。即便是没有算法和开发经验的人,这样图形化的界面也能轻松上手使用。正如可利邦总经理焦耀光所说:“大数据隐私计算平台确保了各参与机构在不泄露用户数据前提下,安全合规的进行数据合作,有效减低金融风险”。
安全与智能并举,以场景化发力精准营销
场景化也是该平台应用的特性之一。在平台的搭建实施过程中,可利邦研发团队就在银行、保险等各个应用场景中均做出了初步探索,涉及了诸如银行获客营销、存量客户运营、风险评估等等方面,形成围绕银行信用卡、个贷、小微、普惠、零售客户从风控到经营的数据协同网络。
该方案采用K8S做为底层的容器编排和微服务平台,集成包括FATE联邦学习框架,并结合AILake 人工智能服务平台中的容器自动化运维、监控告警、统一鉴权等能力,将隐私计算相关的功能部署在其之上,让两者在平台上完全融为一体,以供不同行业和多种业务提供必要的建模支持。
截至目前,可利邦已联合实验室各方共同研发了充分考虑金融场景特点的隐私计算平台,并结合可利邦公司自研的AILake人工智能服务平台,针对不同的应用场景、信任环境和客户需求,将不同技术、算法、服务集成在一个综合性平台中,打造出一套简单易用、多功能、符合业务建模人员使用逻辑的行业定制化隐私计算解决方案。
对此,浪潮信息渠道推进部总经理毛柏林也表示:“浪潮信息与可利邦及其他合作伙伴一道,基于元脑AIStore平台,拓宽合作空间、深化合作领域,推动各个行业数字化转型与智能化升级”。
由此看来,隐私计算发展到今天,并不是单打独斗,而是凝聚了以浪潮信息、可利邦为代表的等众多行业伙伴的技术与经验,并通过协同创新、优势互补,实现了针对金融、医疗等关键行业的解决方案,保障数据安全应用。面向未来,隐私计算在反洗钱、小额信贷等多个金融场景中都有用武之地,实验室也将打造面向不同应用环境和场景的多形态隐私计算一体机,这样无论是在数据中心还是办公室,都可以获得稳定、高效、安全的数据计算服务。
或许随着隐私计算的不断普及,每个人的数据都会变得更安全,到时候反诈APP可能都要“光荣下岗”了。
我期待这一天的早日到来。
*关于隐私计算:隐私计算的历史可以追溯到1999年成立的可信计算平台联盟(TCPA)与2003年更名的可信计算组织(TCG),但就这项技术本身的应用环境和普及程度来说,的确是最近几年才进入大众的视野。
就应用方式来说,隐私计算最大的特征就是在不泄露数据原始信息的前提下,对数据进行分析计算,将数据所有权和使用权分离,避免流通过程中的数据资产损失和隐私信息泄露,在业界同样用“数据可用不可见”、“数据不动模型动”来形容其运行的方式。
相对于传统区块链的“看得见拿不走”来说,隐私计算更进一步的实现了数据安全,同时也有助于打破数据孤岛、释放数据价值,并提供数据价值利用工具。*