DataFun · 2022年11月09日 · 北京市

基于隐私保护计算的金融科技创新探索

分享嘉宾:霍昱光 建信金科 资深算法研究员

编辑整理:松烨 博瑜科技

出品社区:DataFun


导读:本次分享主要聚焦于行业应用方面,介绍建信金科在隐私保护计算领域所做的一些探索和尝试。

--

01/背景介绍

image

随着数据规模持续上涨,根据中国大数据市场的预测,预计2025年的数据量会将从2018年的7.6ZB增至2025年的48.6ZB,超过美国同期的数据产生量约18ZB。同时带来的是数据泄露隐患逐渐提升,自2018年5月25日欧盟主导的数据保护法《通用数据保护条例》(GDPR)生效以来,监管机构总计对违反GDPR的行为处以2.725亿欧元罚款。中国人民银行也在2021年3月印发《金融业数据能力建设指引》行业标准。同时,对于数据的隐私保护已经得到国家的高度重视,发布了《个人信息保护法》和《数据安全保护法》等法律法规。

--

02/创新实践路径

image

在以上背景下,建信金科在隐私保护计算领域积累了一些创新实践。

银行是信息化程度非常高的行业,随着数字化进程的发展,银行每天也会产生大量的数据,也存在融合外部数据价值来提升业务性能的诉求。建信金科从2019年初开始涉足隐私计算领域,在创新实践过程中,我们一方面进行平台的研发,一方面通过应用场景和试点验证我们探索的方向。此外,我们也在同步参与行业标准以及一些规范的制定,并且向同行及科技公司学习,最终形成了平台+应用+标准的循环创新实践。

--

03/隐私保护计算平台

1. 建设原则和思想

image

隐私保护计算是一种融合多种技术的跨学科体系,底层基于密码学、数据科学、机器学习、经济学、人工智能、计算机、软件工程,未来还将引入基于经济学和运筹学的对于数据生态发展的顶层设计。我们在打造隐私保护计算平台时,秉承了建行集团企业架构的思想,融合了联邦学习、MPC(安全多方计算)、同态加密等底层技术。

image

从上层应用来讲,我们主要把隐私计算分为三大范式:联合查询、联合运算、联合建模。

联合查询,要做的是在整个过程中不仅要保护查询结果,还要保护查询条件,实现隐私信息查询(Private Information Retrieval,PIR,匿踪查询)。

联合运算,要达到的目是不仅保护各方运算的数据,还有运算过程中涉及的处理经验,例如数据运算方式等。

联合建模,希望保护各参与方的运算数据的情况下,大家能建立一个共有且保护各方隐私的机器学习模型。

2. 建信金科隐私保护计算平台

我们联合建模的场景主要包括联合风控、联合营销等。银行本身就是存在经营风险的一种机构,所涉及到的风险类别,除了反洗钱反欺诈,还有针对个人或者企业的风险零售及风险纠纷计量,尤其近年来国家出台反电信诈骗的政策,我们正在和外部的数据合作方联合探索如何通过多方数据实现电信诈骗的有效预测。

基于前面介绍的原则和思想,建信金科主导牵头研发了建行集团的隐私保护计算平台。平台底层基于FATE框架,增加了建信金科自研功能,包含顶层的管理功能、以及未来的数据运营生态的管理功能。此外,隐私保护计算平台的存证审计功能,通过结合区块链技术,对关键信息进行存证,实现对多方参与的建模全流程可追溯可审计功能,从而保证参与方的可靠性和可信度。

image

隐私计算平台为各方数据发现提供了交流的平台,是一个真正实现企业级应用的平台。

--

04/应用试点

接下来重点介绍我们的应用试点——集团一体化联合营销模型。该项目获得了2020年年度信通院“星河(Galaxy)”优秀案例,项目是由建设银行上海大数据智慧中心牵头、建信金科提供技术支持、联合子公司建信基金进行的联邦学习建模项目。

image

具体场景是针对某一款基金自营产品的营销模型,在联合建模的过程中,利用建设银行的销售数据,与建信基金产品系列特征,在真实业务数据上进行了纵向联邦建模,实现跨机构的特征维度数据融合,实现跨双方模型训练,定位目标客群,助力客户价值提升。

我们用到的是一个纵向树模型,融合了两方的数据,对样本做了特征维度上的扩充。最后达到的结果可以看到,不同客群均有营销效果的提升。最终所关注的评分前5%的客群的选择率,相对于单方数据本地的建模相对提升可以达到34%。

--

05/行业引领能力

image

在行业影响力构建方面我们也在积极布局。首先,建信金科积极深度参与了金标委等行业标准的制定,以及其它一些规范的编写工作。并且建信金科是第一家作为国有大行金融科技公司加入FATE-TSC,在其中参与技术发展决策及版本更新维护,提出金融领域的实际诉求,并不断优化迭代完善。基于此,建信金科在联合中国银联、微众银行、光大科技,牵头创建FATE金融行业分支,打造满足金融行业监管规范的联邦学习系统。同时建信金科已成为信通院隐私计算联盟成员单位。同时,积极参与北京市金融科技产业联盟研究专委会的课题研究,由建信金科牵头、光大科技公司参与的“基于隐私保护计算技术的金融领域数据融合应用研究”成为四项一类重点课题之一,由专委会进行专项跟踪管理,促进隐私保护计算技术研究成果的落地转化,最终评选为联盟良好课题。

image

最后介绍我们极速工场的运行机制。我们借鉴开放式创新理念,希望通过拉通金融科技市场的供需两端,打造产学研究的运行机制,通过聚合场景、人才、数据和技术的优势资本,进行金融领域的技术基础设施建设,攻克在金融行业所有瓶颈问题。最终的目的是确保国家金融领域的安全稳定,服务于人民的美好生活。未来也希望跟同行业、产业界一起在隐私保护计算领域继续协同共进,不断创新。


今天的分享就到这里,谢谢大家。

阅读更多技术干货文章,请关注微信公众号“DataFunTalk”。

下载大数据、人工智能领域免费资料,请关注微信公众号“DataFunSummit”。

分享嘉宾:
image

推荐阅读
关注数
3753
内容数
46
专注于人工智能和大数据领域技术应用案例分享,及行业峰会信息分享。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息