2022年12月19日,《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(“数据二十条”)对外发布,以把握一条主线、构建四个制度、推进四项措施充分发挥数据要素作用,提高数据要素治理效能。 值得注意的是,尽管“数据二十条”旨在构建数据基础制度体系,但在落实层面,技术加持不可或缺。“数据二十条”提及的“原始数据不出域、数据可用不可见” 、完善数据全流程合规与监管规则体系、统筹构建规范高效的数据交易场所等,无一不为相关数据科技提供了广阔舞台,特别是隐私计算技术更有望成为核心解决方案和基础设施。 具体来看,“数据二十条”提出数据产权“三权分置”,“淡化所有权、强调使用权”等,都与隐私计算的基本理念相契合,而“构建多层次数据交易市场体系”更是隐私计算可以大展拳脚的理想场景。 事实上,隐私计算的效用和价值经过数年实践发展已在多个行业得到了验证,其中在医疗行业的落地应用颇具典型性和代表性。隐私计算作为实现数据可用不可见的核心必要技术,在数据量巨大、数据安全与隐私要求监管等级极高的医疗行业,已从初期试水投入,逐步发展到全面的数据价值产出。 2022年11月,国家卫生健康委发布了十四五全民健康信息化规划,提出推动多方安全计算等关键技术研发和应用,这也是隐私计算技术首次写入行业政策。 2022年12月9日,在首届医疗隐私计算大会暨第二届DataX大会上发布的由互联网医疗健康产业联盟、隐私计算联盟、翼健(上海)信息科技有限公司联合医疗机构、技术服务企业等相关单位编写的《隐私计算医疗应用白皮书(2022)》显示,隐私计算技术在医疗行业的主要应用方向包括临床辅助、医学科研、真实世界研究和联合风控。目前隐私计算技术在医疗行业的应用场景分布在医疗、医药器械、医疗保险三大领域,即“三医应用”。 “三医应用”不仅展示了隐私计算能在健康医疗数据的跨机构安全共享中提供可靠技术保障,释放数据价值,也反过来促进了隐私计算的进一步成熟与发展。中国信通院云计算与大数据研究所副所长闵栋在解读白皮书时表示,可以看到医疗行业数据流通的迫切需求与政策的重点关注,在未来很长时间内能够加速隐私计算在医疗及相关行业的应用推广。 而对技术服务方而言,如何让隐私计算技术更好地适配医疗行业,打造更定制化的技术解决方案则是毋庸置疑的新方向。作为上述大会的支持单位、国内隐私计算“四小龙”之一的翼方健数近日发布了其最新的医疗行业隐私计算战略,提出以“数据和计算互联网”的愿景打造医疗数据协作生态,推出围绕医疗产业的系列优秀解决方案与案例,实现数据到智能应用端到端的医疗多场景全栈闭环,赋能健康医疗数据价值产业化。 隐私计算提升“三医应用”精准度 数据对医疗行业的价值早已毋庸置疑,甚至成为行业发展的主要驱动力之一,但医疗行业也是数据泄漏事件最多的行业,未经授权的泄密成为医疗行业数据安全的重大风险。隐私计算的出现恰好起到了趋利避害的关键作用,让数据价值而非原始数据本身惠及所有参与方。 正如翼方健数董事长陈恂博士在会上所言,人类的科学和技术进步正在快步迈向第四范式,也就是继经验、理论、计算前三个范式之后的以数据为中心的新的创新范式,医学也不例外,医疗实践的数据正是医学发展的知识宝藏。医疗数据太敏感,触碰到每个人的隐私,如果没有新兴的隐私计算技术的加持,医疗数据难以流通,知识也就被尘封,不能够为我们所用。 医疗是一个大概念,不仅是治病救人的医疗机构,也包括医药器械、医疗保险等行业和机构。站在当下,隐私计算之于“三医应用”的意义和效用可以用精准一词来总结。而在所有方方面面中,隐私计算的贡献都不是将来时,而是进行时。 换言之,借助隐私计算充分发掘数据价值,医疗、医药器械、医疗保险便有能力把准确的产品和服务提供给准确的人群,最终造福病患,继而提升全社会的福祉。
医院是医疗场景的最前线。在这里,精准意味着向病患提供精准医疗服务,而精准医疗的前提是必须精准利用数据——数据从哪里来到哪里去、谁能用谁不能用、如何用。 上海交通大学医学院附属瑞金医院副院长胡伟国表示,过去的数据合作,往往是直来直去,原始数据出平台,运算好以后就返回数据计算结果。这样原始数据离开了数据平台,失去了隐私和安全,也因为数据泄露的风险限制了医疗数据的协作共享。现在应用隐私计算,不分享原始数据,数据永远在自己的平台里,只可用,但不可见。 他表示,隐私计算为数据的应用开放设立了边界。数据不出院,原始数据不泄漏,数据访问有授权,而且用户都有安全追溯,如果有异常活动就会马上被阻断,化解了数据隐私安全与多院区、多方合作的矛盾。 复旦大学智能医学研究院常务副院长刘雷则分享了该院最新的数据共享项目,即建立基于隐私计算的健康医疗科研数据协作网,在各医院部署后,数据不出医院,通过联邦学习、数据沙箱等方式来计算。 他强调,数据共享的目标是把附属医院的数据打通和连接,而不是把数据集中在一起。复旦系统包括了国内知名顶级医院,拥有大量数据,通过分布式部署隐私计算平台,并对数据进行治理,映射形成标准化的数据在隐私计算平台联盟中实现共享。
医药研发企业视数据为核心资产。尽管药物研发已经进入AI赋能时代,但药企间基于数据共享的研发合作一直未能成为可能,隐私计算则打破了这一新时代下的旧格局。 在联合药企方面,AI药物研发面临的最大痛点在于该领域复杂的知识产权和相关经济利益,使得制药机构之间数据直接共享和合作几乎不可能。通过隐私计算模拟多个制药机构之间的药物协同研发,助力制药机构在保障自身药物数据隐私安全的前提下协同药物发现。 在连接患者方面,药企希望了解药品的使用状况,以此优化整体诊疗方案。但药企不能直接拿到患者信息,如何在合法合规的前提下持续优化药品,发现不良事件,是隐私计算非常强的场景。
保险业经营的是风险,而对风险的度量需要基于大量数据。对于保险公司而言,各种来源的数据往往难以达到完善,尤其在健康险产品设计中,医疗类数据却必不可少,隐私计算恰能弥合这样的矛盾。 当下的健康保险已不止于提供医疗费用的补偿,而希望能更精准针对不同人群设计更需要的保障,包括为特定人群、特定疾病提供“费用补偿+健康管理”的服务。实现这一目标所需要的医疗数据包括如地区、人口、发病率、平均医疗费用、病程管理信息等。基于隐私计算的数据共享和互通就能帮助建立有效的底层数据平台,从而更有针对性的保险保障的设计。 值得一提的是,数据的共享还有望降低保费。商涌科技平台技术中心总经理王竞表示,隐私计算对于保险行业最大的价值是作为一种基础设施已经起到了应有作用,解决数据互信和互通的问题。未来如果有一种标准化的数据和安全方案,令所有数据交互在标准方案上执行,就会大幅降低数据成本。数据成本的下降会影响保险成本,最终降低保险定价。 “三医应用”格局下的隐私计算 1962年9月12日,美国总统肯尼迪在《我们选择登月》的演讲中说:“我们决定在这十年间登上月球并实现更多梦想,并非它们轻而易举,而正是因为它们困难重重。” 21世纪人工智能时代下隐私计算的诞生与发展亦非易事,落地医疗行业更面临许多困难,“三医应用”格局来之不易。 相比医疗行业对隐私计算从认知到实践的历程,隐私计算服务商把技术从学界扩展到商业应用的路途无疑更加艰辛,面对已经取得的成绩也更不能松懈。本届大会上,各方对于医疗隐私计算的思考可谓深刻。
“三医应用”虽然代表了医疗的三大场景,但细分来看,即便在这三大场景之下还可分出更多更具体的场景。这些场景对于数据价值发掘的需求、痛点与难点各不相同,隐私计算需要通盘的、工程化的解决方案。 作为行业领军企业,翼方健数给出的答案是建立数据和计算互联网(IoDC,Internet of Data and Computing)。翼方健数CEO罗震博士表示,IoDC构建了一个分布式的数据和计算的互联网,网络中各数据源守好自己的数据安全和隐私保护责任。数据需求方接入数据源网络,通过应用数据源的数据(结合自身数据)挖掘数据价值。在数据共享和协作中,原始数据不离开数据源的掌控,数据需求方通过隐私计算结合应用计算的方式连通原始数据。 罗震同时坦言,IoDC是一个宏大愿景,其建设需要直面各类挑战,总结来说就是“异构”的挑战。在技术层面,数据发现包括了数据的异构、数据计算包括了存储和计算方式的异构、算力调度则包括算力的异构,这些技术上的异构都有相对应的技术解决方案。而在众多异构中,信任的异构则是根本性问题,即数据需求方和数据源之间的信任矛盾,需要隐私计算来化解。
技术发展成熟的标志往往不在于认为其无所不能,而恰恰在于清晰地认识到边界,隐私计算也是如此。尤其对于狭义的隐私计算技术,如联邦学习、多方安全计算、TEE等,更不能武断地认为单凭技术本身就能实现安全高效的数据价值发掘。 在对隐私计算边界的探讨中,如何覆盖数据全生命周期可以说是一大热点问题。胡伟国表示,隐私计算技术之外我们还必须要思考一些问题,如数据应用方如何发现数据,如何获得数据使用权,获得数据授权之前如何判断数据是否符合要求。数据的授权申请、审批、追溯都值得进一步的思考。 翼方健数医疗健康事业群总裁李苇刚坦言,对于数据价值发掘而言,隐私计算是必要条件,但不是充分条件。狭义的隐私计算技术不是从原始数据到数据价值的全过程解决方案,广义的隐私计算则是一个系统工程,需要涵盖数据可用、多方参与、全流程、安全计算环境、数据资产化等的全流程思考和全栈技术。 全流程与全栈对技术服务商无疑意味着巨大的投入,但也是打破边界的必然选择。翼方健数首席科学家张霖涛博士表示,翼方健数经过多年努力建立了一套完整的隐私计算解锁医疗数据价值的解决方案。首先建立坚实的隐私安全计算平台,从单体平台到联盟,再到数据和计算的互联网等,建立不同场景下的全栈解决方案。第二是针对医疗建立了数据全生命周期核心管理能力,包括数据清洗、数据管理、数据标注、数据价值抽取、数据价值分配、数据交易的一系列的工具。第三是提供数据驱动的差异化应用,在医疗、医保、科研、疾控等多方面投入。
隐私计算在医疗领域是否还有更多探索空间?在技术层面,区块链技术得到了业界专家的关注,这是因为当前的数据价值发掘过程往往更多谈论数据的安全流通和分享,但较少谈及数据拥有方因贡献数据价值而获得的收益。 广州实验室科学数据平台主任李亦学教授就强调了区块链技术在数据收益和激励机制方面的前景。他指出,区块链和智能合约保障了数据的可溯源可审计,实现可信协作和自动的价值分配。智能合约可以保证任何贡献都有存证,任何承担的都有价值分配。 他同时表示,翼方健数结合隐私安全计算与区块链的智数坊平台在这方面已经做出了实践并发挥了重要作用,使2000万医院的临床样本数据安全汇聚,做到价值流动。 在应用层面,宜昌市疾病预防控制中心首席专家张培教授认为,过去几年里隐私计算在传染病领域实现了应用落地,但从宜昌来看,传染病只占了整个疾病谱非常小的一部分。随着传染病的热点过去,可以切入健康城市慢病领域。 他表示,慢病由环境、饮食、睡眠等多方面因素形成,是一个漫长的综合因素叠加的结果。在这个过程中,围绕健康城市建设、健康管理、健康威胁因素控制等,是应用隐私计算的另外一个方向。 无可否认,“三医应用”格局为隐私计算在医疗行业的发展开了个好头,医疗领域基于其天然的强隐私需求和积累的庞大数据量,正成为隐私计算落地的丰沛热土,而随着新冠疫情留下的冲击和余波,生物医疗的重要性也被赋予更高的期待,隐私计算之于医疗的应用可能性,或将成为一个又一个的盲盒,期待更多惊喜的解锁。 |
|