今年是隐私计算商业化落地元年。
这一市场正处于爆发的前夜。据KPMG《隐私计算行业研究报告》预测,隐私计算国内市场规模将快速发展,三年后技术服务营收有望触达100-200亿人民币的空间,甚至撬动千亿级的数据平台运营收入空间。
隐私计算诞生于数据保护这一背景,近年来数据安全与用户隐私日益受到重视,关于数据治理的法律法规不断出台,比如欧盟的GDPR、我国《个人信息保护法》(草案)。隐私计算融合了人工智能、密码学、区块链、计算芯片等一系列软硬件技术,在金融等场景落地应用,并成长为热门的投资赛道。
华泰创新总经理晋海博判断,“之前大家对隐私计算的名词进行定义,对各种技术方案进行论证,现在行业进入注重技术性能、安全统一的阶段,未来进入互联互通的阶段,隐私计算应用的市场空间是目前的百倍级别。”
不同玩家正在攻克金融场景
隐私计算赛道,三类玩家正在进入:独立创业公司,垂直行业的机构,大型互联网公司。
独立创业公司的优势在于中立性,以及根据客户需求开展定制化服务。不少投资机构已布局这一领域,包括红杉资本、IDG、基石资本等,相关创业公司的融资阶段从天使轮到A、B轮不等;垂直行业的机构主要为产业背景的公司,优势在于应用能力;互联网大厂则拥有丰富的数据生态和应用组件,微众银行、腾讯、蚂蚁、百度、字节跳动都已开发相关产品,应用于金融、电商等领域。
玩家竞争的本质在于:能否为客户带来足够的数据源,并提供完整的解决方案。因为市场对于隐私计算的诉求在不断提升。
各类玩家围绕着这一目标迭代产品。比如红杉资本投资的科创公司星云Clustar——孵化于香港科技大学算力加速技术,其创始人陈凯教授告诉钛媒体App:2019年,公司产品的重点是解决联邦学习的性能问题;2020年,则从底层的IaaS结合中间的PaaS层、上端的联邦数据层,做全栈解决方案。从数据来看,其协助微众银行进行联邦数据网络算力加速,通过异构加速技术,整体算力相较于CPU提升了50-70倍。
互联网大厂腾讯和顺德区政府建立了一套基于联邦学习的普惠金融平台,腾讯负责建模,融合政府政务数据、申请企业数据、银行业务数据,建立实时进件分析和风险控制模型。
金融行业是最早应用信息技术、*化数据价值的行业,从上世纪80年代的ATM机到近年的开放银行,金融行业在数据的收集、产生、积累中积累了大量经验,数据的价值贯穿于个人征信、公司估值等场景。
如今,隐私计算在金融场景的落地应用正不断丰富,就银行而言,重要场景包括精准营销、信贷风控、发现多头借贷、保险定价,等等。
在金融机构的交叉营销领域,隐私计算辅助进行各家机构的数据共享,在不传数据的情况下让各方信息透明,完成交叉营销。首先是客户的识别和筛选,对客户的风险进行识别和管理;其次是服务和运营,为金融客户提供精准的资管、风控产品。
香港人工智能与机器人学会理事长、香港科技大学讲席教授杨强表示:
“在营销和广告领域,针对轨迹数据、客户风险数据、营销数据、转化数据等不同数据,通过统一的联邦学习平台串联起来,可用作人群洞察、用户分层和推荐等等。联合不同的数据级,建立不同的服务机器人,比如语音机器人,内呼、外呼机器人,作息助手和智能培训。”
隐私计算解决数据孤岛、反洗钱等问题。
“早年因为数据孤岛,银行难以掌握中小企业的数据,对后者的贷款申请进行限制,导致大量企业主在市面上寻找高价格的贷款,隐私计算可以解决数据孤岛的问题。”招商银行分行信息技术部副总经理蔡毅介绍。
在反洗钱方面,银行可以与同业机构或互联网公司联合,通过交换加密参数,联合计算建模,从而解决样本少、数据质量低的问题。调用联合建立的模型,同时不集合各方数据,对于各家金融机构是刚需。
对于已经走过了信息化、智能化的大型银行机构,隐私计算可以拓宽其数据边界,进一步增强业务竞争力。
而中小机构的信息化过程尚未走完,面临的挑战更大,这类机构的数字化包含信息化、智能化和隐私计算的导入,以及数据合规、数据治理。微众银行人工智能事业部副总经理陈天健认为,未来将有专业的服务公司,帮助中小型金融机构在短时间内走完信息化、智能化和隐私计算技术导入的过程。
杨强介绍:隐私计算和联邦学习并不是单一的算法,而是一个完整的套餐,我们要考虑安全合规的法律问题,同时也要考虑防御攻击的安全问题,另外兼顾算法效率和行业应用,此外,还可以使用一种经济学的激励机制,来鼓励不同的参与方持续投入到生态里面。
比如建立不同的激励模型,让参与方持续的有收益,变成一个不断滚大的雪球,那么生态圈的数据将越来越丰富。
现阶段挑战:金融机构协同,数据监管
金融场景的数据安全与基础建设,是新基建的课题。通过隐私计算建立金融数据共享生态圈,一方面需要监管层的认可,另一方面,要在技术上实现互联互通。
在隐私计算领域,目前有三大技术流派:联邦学习,安全多方计算,以及TEE可信执行环境。其中联邦学习构建在同态加密技术之上,并能够严格确保数据不出域,并通过机器学习技术规避确定性计算本身安全性的不足,得到了金融行业的青睐。
联邦学习的核心是“数据不动模型动”,各个参与者不需要把数据整体移动到一个可信计算环境中,而是在本地使用本地的数据训练一个本地的模型,并通过场景使用半同态加密、秘密分享等隐私计算技术的方式来同步模型参数,从而进行模型的迭代训练。真正做到了数据可用不可见,数据不动模型动,从而实现了极高的安全性,合规性。
不过,联邦学习和已有金融机构业务的深度结合,依然面对一些挑战。
“在开放银行中,如果几万家银行同时进行联邦学习,这是一个非常重的事情,现阶段难以落地;如果在金融开放联盟中进行合作,涉及到金融、证券、保险等不同行业,面对的监管部门、政策也不相同。”浦发银行创新研究中心曹祥介绍。
机构协同难以推进,同时,监管问题无法回避。
“联邦学习的数据,哪些可以出去,哪些必须拿到授权,拿到什么层级的授权,需要符合什么样的法律条款?现在大家获取隐私的条款是极其模糊的,这些都需要落地的、明细的政策进行规范。”蔡毅举例。
此外,对于资源方、数据方的市场教育,还在推进中。目前,人民银行针对多方安全计算建立了一套金融领域的标准,但只适用于人民银行,海关、公积金、社保、电力等系统尚未参与。
当下,技术和解决方案还不够成熟,隐私计算技术效率有待提升,现有系统产品较复杂,工程化程度需要完善,模型可解释性还需提高。产业推广需要搭建多方协同的合作模式,这样的模式建立并不容易。
未来主要商业模式:平台分润
隐私计算往往涉及到3类角色:首先是使用数据的业务方,包括金融机构、政府机构,这类机构是隐私计算服务的客户;其次是作为数据源的数据方,包括大数据局、征信公司、拥有用户数据的互联网公司,等等;隐私计算技术服务商,则为客户搭建整个计算系统。
在金融等场景的商业化过程中,据KPMG《隐私计算行业研究报告》统计,主要有四种营收方式:
销售模式,收取一次性技术系统搭建费;
服务模式,收取年度系统维护和服务费用;
调用模式,收取数据使用费,这部分费用归属于数据方;
分润模式,根据业务运行的效果获取收益分成。
分润模式将是未来的主要模式,客户早期并不需要承担大笔技术系统搭建费,相当于技术服务商与客户联合运营业务,系统接入数据源,原有业务改善或进行开业务开展之后,双方根据业务实际效果分利润。
报告预测,国内个人短期消费金融市场在2024年将达到16万亿元的规模,按照贷款余额的1%作为平台技术服务费,金融科技服务商在消费信贷科技平台的分润规模为1,600亿。
陈天健表示:“市场正处于爆发前夜的状态,随着金融监管当局、政府等各方的参与,未来相关规制问题、标准制定问题也会迎刃而解。”