联邦学习:发挥大家的力量发展AI

2021-10-09 16:11 来源:电子说

最近发表在《自然医学》的研究成果表明,联邦学习可以构建一个强大的AI模型,并在不同的医疗机构推广。这一发现展示了AI在能源、金融服务、制造业等领域进一步应用的前景。

由新冠肺炎疫情导致的几家医院联合发布的一项倡议表明,任何行业的组织都可以通过合作开发预测性人工智能模型,在准确性和普遍性方面建立新的基准。

这项合作今天发表在领先的同行评审医学杂志《自然医学》上,展示了联邦隐私保护学习技术如何创建强大的AI模型,这些模型可以在不同的企业中很好地工作,即使是在受机密数据或稀疏数据限制的行业中。

该研究的第一作者Ittai Dayan博士说:“在ai开发过程中,当一个算法是在一家医院的数据上创建的,这种算法一般在其他任何医院都不能很好地工作。”Ittai Dayan博士在Mass General Brigham领导人工智能开发,并于今年创立了医疗初创公司Rhino Health。

“但通过使用联邦学习和来自各大洲的客观多模态数据来开发模型,我们可以构建一个可扩展的模型,帮助世界各地的一线医生。”以太大研说。

医疗行业还启动了其他大规模的联邦学习计划,包括一项关于乳房x光检查评估的五人研究,以及制药巨头拜耳公司针对脾脏分段解剖的人工智能模型培训。

除了医疗行业,联邦学习还可以帮助能源公司分析地震和井筒数据,帮助金融公司改进欺诈检测模型,帮助自动驾驶汽车的研究人员开发推广到不同国家驾驶行为的AI。

联邦学习:发挥每个人的力量发展人工智能。

开发人工智能模型的公司和研究机构通常受到其可用数据的限制。这可能意味着小企业或小众研究领域缺乏足够的数据来训练精确的预测模型。由于企业中患者或客户的人口统计学特征、特定的数据记录方法,甚至所用科学设备的品牌,即使是大型数据集也可能存在偏差。

为了收集足够的培训数据来构建一个强大且可扩展的模型,大多数企业需要与同行一起收集数据。然而,在许多情况下,数据隐私法规限制直接在共享的超级计算机或云服务器上共享数据,例如患者的病历或专有数据集。

这就是联邦学习的意义所在。

发表在103010杂志上的新研究叫做EXAM(EMR CXR AI模型)。这项由Mass General Brigham和NVIDIA领导的研究汇集了五大洲的20家医院,对神经网络进行训练,用于预测新冠肺炎症状患者在到达急诊科等护理点24小时和72小时后可能需要的供氧水平。这是迄今为止规模最大、最多样化的临床联邦学习研究之一。

多方合作有助于人工智能工作

联邦学习使考试的合作伙伴能够创建一个人工智能模型,该模型可以从每个参与医院的胸部x光图像、患者生命体征、人口统计数据和实验室值中学习,并且不需要访问每个医院的私有服务器中存储的私有数据。

每家医院都在本地NVIDIA GPU上训练一个相同神经网络的副本。在训练过程中,各医院只需要定期向中心服务器发送更新后的模型权重,中心服务器中的全局版本神经网络会对其进行汇总,形成新的全局模型。

这就像分享一场考试的答案,但并没有透露任何用来获得答案的学习材料。

合著者、美国国立卫生研究院(NIH)介入肿瘤学中心主任、临床中心介入放射科主任布拉德伍德(Brad Wood)博士表示:“EXAM研究的结果表明,无需交换私人可识别数据,就可以在医疗领域训练高性能、可扩展的AI模型,从而保护数据隐私。”

“这些发现不仅可以用于新冠肺炎的跨医院模式,还表明联邦学习是该领域一个有前途的解决方案。这为实现更有效、更合规的大数据共享提供了框架,为挖掘AI深度学习在医疗领域的潜力提供了支撑。”

与所有参与组织共享的全球考试模型将人工智能模型的平均性能提高了16%。研究人员发现,与在任何单个站点训练的模型相比,全局考试模型的通用性平均提高了38%。

从上图可以看出,对于数据集较小的医院,全局联合学习的性能提升尤为明显。

泰国朱拉隆功国王纪念医院和朱拉隆功大学AI医学中心联合主任Sira Sriswasdi说:“联邦学习使世界各地的研究人员能够为一个共同的目标进行合作,并开发一个可以从每个人的数据中学习和总结的模型。”这家医院是联合开发EXAM的20家医院之一。“通过NVIDIA GPU和NVIDIA Clara软件,我们可以轻松参与这项研究,并产生有影响力的成果。”

医院和初创公司进一步开展考试研究。

最初的EXAM研究汇集了来自北美、南美、欧洲和亚洲的合作者,只需两周的培训就能实现对患者需氧量的高质量预测。这种洞察力可以帮助医生确定患者所需的护理水平。

此后,研究伙伴验证了AI模型可以在模型构建和训练场所以外的环境中推广和良好执行。马萨诸塞州的另外三家医院(库利迪金森医院、玛莎葡萄园医院和楠塔基特小屋医院)对EXAM进行了测试,发现神经网络在独立和前所未有的数据上也表现良好。

库利迪金森医院发现,该模型可以预测患者到达急诊室后24小时内的呼吸机需求,灵敏度为95%,特异性超过88%。在英国剑桥的阿登布鲁克医院也发现了类似的结果。

开发原始模型的MGH&BWH临床数据科学中心科学主任Quanzheng Li博士表示,Mass General Brigham计划在不久的将来部署EXAM。该医院网络与Lahey医院和医疗中心以及英国的NIHR剑桥生物医学研究中心一起与英伟达初创加速成员Rhino Health合作,使用EXAM开展前瞻性研究。

最初的EXAM模型使用过去新冠肺炎患者的记录进行回顾性训练,因此研究人员已经掌握了关于患者最终需要的氧气量的真实数据。这项前瞻性研究将AI模型应用于新入院患者的数据,朝着在现实环境中部署AI模型又迈出了一步。

剑桥大学医学院放射科主任Fiona Gilbert表示:“联邦学习具有革命性的力量,可将AI创新融入到临床工作流程中。我们与EXAM的长期合作旨在使此类全球合作变得可重复和更有效,满足临床医生应对复杂健康挑战和未来流行病的需求。”

EXAM模型通过NVIDIA NGC软件中心公开,供研究者使用。企业和研究机构在开始使用联邦学习时,可以使用NVIDIA AI Enterprise软件套件中的AI工具和框架。该套件经过优化,可在NVIDIA认证系统上运行。责任

延伸 · 阅读