登录甲子光年
其他登录方式
登录即表示你已阅读并同意
《甲子光年用户注册协议隐私政策
找回密码
获取验证码
注册甲子光年
获取验证码
注册即表示你已阅读并同意
《甲子光年用户注册协议隐私政策
绑定手机号
获取验证码
登录即表示你已阅读并同意
《甲子光年用户注册协议隐私政策
完善资料
登录即表示你已阅读并同意
《甲子光年用户注册协议隐私政策
微信登录
扫描二维码 | 授权登录甲子光年
蚂蚁:隐私计算的下一个爆发点在医疗 | 甲子发现
作者:范文婧 2022-05-25

隐私计算的新赛场。

作者 | 范文婧 张怡

编辑 | 九月

2021年被称为隐私计算商业落地元年。甲子智库《2021年中国隐私计算市场研究报告》估计,2021年中国隐私计算市场规模约为7.4亿元,预计2025年将达到220.3亿元。

隐私计算出现于上世纪八十年代,2019年之后由于政策、技术和资本等各方投入,迅速受到关注。根据中国信通院的调查研究,截至2022年初,涉及隐私计算领域的公司已经超过100家。

随着技术趋于完善,隐私计算的商业化也正在被广泛探讨。去年开始,隐私计算相继在金融、政务、医疗、保险领域落地。其中,金融领域落地案例无疑最多、也最为成熟。但一年后,从业者更好奇:接下来,隐私计算又会在哪个领域爆发?

蚂蚁集团早在2016年开始布局隐私计算,见证了赛道从只有屈指可数的同行,到如今挤满各路玩家。对上述问题,这个年轻行业的老面孔给的答案是,生物医疗。在他们看来,“这是一条难而正确的道路”。

1.“软硬件一体机将是接下来的主流方案”

隐私计算从走出实验室,到2016年概念被正式提出,花了近20年时间;但从无人知晓到被资本和行业看好、开启商业化元年,只用了不到5年。

在中国信通院云计算与大数据研究所高级业务主管袁博看来,隐私计算受到重视,是“大势所趋”。

这是一条典型的被政策催熟的赛道。

2020年4月,国务院发布《构建更加完善的要素市场化配置体制机制的意见》,第一次将“数据”定义为五项生产要素之一,让数据的重要性得到认可;2021年颁布的《个人隐私保护法》《数据安全法》提出了对数据安全的界定和标准,让隐私计算的应用有了目标。

数据隐私同样在国外格外关注。先是 2018年,欧盟“史上最严”的《通用数据保护条例》(简称GDPR)生效实施;几乎同一时期,美国加利福尼亚州颁布了美国国内最严格的隐私立法《2018年加州消费者隐私法案》。

另一方面,技术的发展也推动隐私计算日趋完善。目前,隐私计算应用的主要技术有三种,多方安全计算、联邦学习和可信执行环境,三种技术又分别与密码学、人工智能和软硬件一体相联系。因此,2010年之后AI、芯片技术的发展,也促使隐私计算更快走入商业。

隐私计算,是指在提供数据保护的情况下对数据进行的计算,即保证数据“可用不可见”。在国内,隐私计算这个新概念从2019年左右开始受到市场关注。

这背后蕴藏巨大的市场需求。蚂蚁集团智能平台产品总监曹剑介绍,彼时,行业出现一个趋势,越来越多的企业和企业之间,需要在合法合规的情况下共享彼此的隐私数据。

但袁博指出,我们需要让数据有序、合法、自由地流动,怎样让它更安全,更简单的方法就是锁着不动,但这便无法发挥数据的价值,“我们一直说数据作为生产要素,要更多的流动才能发挥更好的价值,这是一个矛盾的事情。”

而隐私计算,成了业内解决这个矛盾的“最优技术解”,通过技术实现数据从可用不可见、到去标识化、到部分匿名化、再到法律规定的完全匿名化的效果,让数据安全有序地流通。

随着数据量和对隐私计算需求量的增加,隐私计算还需要更新的技术来服务具体的场景落地。在大规模商业化的第二年,“软硬一体的隐私计算一体机”成了2022年隐私计算赛道最热的概念之一。在袁博看来,除了工程化的并行计算、功能组件化、容器化部署等,“软硬件一体机”将会是接下来一段时间的主流方案。

自2021年下半年开始,各家隐私计算的公司除了项目制,纷纷发布软硬件一体机,如蚂蚁的摩斯、星云Clustar软硬件一体机、星环TxData、冲量在线、宇链的一体机等。在从业者看来,软硬件一体机能带来性能的加速、安全的加固以及应用性的增加。

具体而言,一方面,过去几年隐私计算的发展主要是在软件和算法层面的优化,而当算法趋于稳定,需要硬件的辅助来增加隐私计算的效果和效率,成为新的增长点;另一方面,一体机打包了软硬件服务,能更好地帮助客户屏蔽底层隐私计算算法的差异,更方便部署。

“从软件到软硬件一体”这个路径并不是业内初创,在人工智能领域、机器学习领域,当技术稳定之后,许多公司也纷纷选择售卖“软硬一体机”。究其原因,除了让硬件更好地赋能软件,或许还有一个更现实的目的,“增加营收”。

2.“下一个市场竞争点和爆发点是生物医疗”

隐私计算技术的落地场景主要包括金融、政务、医疗领域。商业化应用来到第二年,蚂蚁集团判断,除了落地案例最多、最成熟的金融领域,“下一个市场竞争点和爆发点是生物医疗”。

过去几年,医疗行业的数字化得到政策和技术推进,很多的医院和医疗机构积累了大量数据,为隐私计算的落地提供了土壤。

其次,医疗数据具有极强的隐私属性,对隐私保护和数据安全的需求尤其强烈。中国信通院云大所高级工程师白玉真介绍,近年来,医疗领域信息泄露以及滥用和盗用的事件频发。2020年4月,世界卫生委曾发表声明,在疫情期间遭受到的网络攻击同比增长5倍,全球23.7%的APT(即高级可持续威胁攻击,指某组织对特定对象展开的持续有效的攻击活动)攻击都跟医疗安全事故相关。中国首次超过了美国和韩国,成为了全球APT攻击的首要目标。

在强需求下,目前,隐私计算最先在临床医学研究、基因分析、联合风控这三个医疗场景落地。医疗机构、基因测序公司、科研机构等作为数据提供方,通过隐私计算,实现一些跨机构、跨地域的数据互联互通,在药的研发、药物诊断和疫情精准防控方面有了一些相关的落地。

(1)临床医学研究

白玉真介绍,在一些临床医学研究上,隐私计算可以帮助做一些疾病预测和疾病的研究,辅助智能诊断。

过去,难以获取数据是各医疗机构临床研究的一大难题。一方面,医疗数据涉及病患的隐私信息,贸然使用将面临道德风险和合规惩罚;另一方面,单一医疗机构累计的样本量有限,不足以支撑现代医学的循证科研。解决医疗系统数据孤岛难题是促进临床研究的关键,而隐私计算很可能成为那把“钥匙”。

在医疗领域,要想在药物研发或者辅助诊断等方面得到低误差的计算结果,需要联合十几家或者是几十家的医院的数据,对多节点并发需求和并发计算能力的要求极高,且涉及到大量的数据融合。

目前,国际上已经有成功案例可供我们参考。比如,欧盟通过“机器学习分类账编排药物发现”项目构建了Owkin Connect平台,让用户可以利用制药企业的脱敏数据创建更有效的模型。澳大利亚通过联邦学习等隐私计算技术,连接17家医疗机构数据源,在极大程度上提高了临床研究效率。

在中国,多地医疗机构也开始运用隐私计算技术解决临床研究的问题。厦门市的健康医疗大数据实践是隐私计算在医疗领域的典型案例,基于隐私计算的健康医疗大数据应用开放平台已完全落地,真正做到了数据“可用不可见”“可算不可识”。此外,上海长宁区搭建起了健康大数据开发平台,福建省也在筹备打造基于隐私计算的防疫平台和智能系统。

(2)基因分析

隐私计算主要应用于全基因组的分析、核酸序列比对和病毒基因组分析领域。

对于基因分析场景而言,有效汇聚微生物数据资源是关键。

微生物所、各级疾控中心、研究机构、生物企业等相关方,需要大量数据完成核酸序列与蛋白序列同源性比对,以快速完成疾病筛查、病原菌比对等工作。在新冠疫情仍未结束的今天,基因分析工作显得尤为重要。

基因分析使用场景如何保证数据安全性、算力可靠性算法灵活性是关键行业基于隐私计算技术给出了解决方案:在可信执行环境下搭建机密计算平台,通过集成复杂算法、汇聚多方数据、提供联合计算的方式,再辅以区块链技术,便能保证数据处理全生命周期的存证溯源,最终实现科研机构、医疗机构、生物企业之间数据的安全流通共享。

2020年3月,深圳国家基因库与华大区块链联合开发新型冠状病毒基因组分析平台,并于国家基因库生命大数据平台(CNGBdb)正式上线。据介绍,该项目基于区块链和多方安全计算技术,支持用户在不公布己方数据的前提下,联合其他科研人员协同分析并共享结果,为实时追踪病毒演化、监测新型突变,以及疫情风险评估、医疗对策制定提供有效的数据支撑。

(3)联合风控

除了医疗单位,保险和营销运营公司也早已融入到了医疗系统的细枝末节中。对于健康保险领域而言,保单和流程数据是业务的关键,但是数据纬度不足、数据质量不够是健康保险业务面临的最大瓶颈。

通过连接时效性强、丰富性高的互联网数据,将在极大程度上提高健康保险数据的利用效率。同时,基于可信执行环境的安全计算平台建立起的健康保险核保风控模型,不仅可以实现数据使用合规,还能大幅减少理赔损失。

以泰康人寿为例,经过上述风控模型的训练优化,健康保险核保风控模型对保单异常理赔做出了合理预测,使最终效果提升了20%,预计帮助泰康人寿每年减少理赔额高达4000万元。

在联合营销场景方面,由于互联网医院的大规模建设和普及,运营商的传统营销手段早已不合时宜。对于传统的健康导航服务平台而言,预约挂号、排队叫号、报告查询等服务不足以提供大规模的用户数据。

白玉真认为,若运营商数据与省卫健委数据实现融合,打造省级统一的医疗健康服务平台,将进一步提高对用户数据的保护以及合理利用,最终实现问诊、体检等场景的精准推荐,有效提高用户就医满意度。

END.


  • 885
  • 0
  • 0
  • 0
评论