黑科技波士顿人工智能实验室主任曹渔:端智能在医学领域的应用

2017年7月10日

,端智能,人工智能,大数据,迁移学习,个性化,曹渔

2017年7月9日,由浙江省人民政府指导,杭州市人民政府主办,ACM(美国计算机协会)、IEEE(美国电气和电子工程师协会)、中国学会、浙江省委人才办公室、浙江省科技厅协办的“未来已来”全球人工智能高峰论坛在浙江杭州未来科技城拉开帷幕。作为支持媒体参与了本次报道。

麻省理终身教授、波士顿人工智能实验室主任发表了《在医学领域的应用》重要讲话。

大家好!首先感谢组织方的热心招待,有感谢大家参加我们的分享。今天我跟大家分享的题目叫《端智能在医学领域的应用》。

首先我给大家介绍一下什么叫端智能。端智能和传统的有什么不一样?大家对云计算和云智能应该很熟悉,比如说在传统的云计算领域,大家有智能手机、智能终端,这些智能手机和智能终端会产生很多的数据,通过网络传到云端,在云端进行复杂的计算。计算结果以后,再返回终端。在这种情况下,我们称之为传统的云计算、云智能。

而我们的端智能呢?是有些不一样的地方。也就是说,在我们的端智能里面,我们会把人工智能的算法、架构部署在终端,在终端领域,我们运行我们的计算。在这种情况下,我们可以保证我们的计算不依赖于网络,同时我们可以实现实时的数据处理。更重要的是,我们可以保护用户的隐私,而且实现的定制。在这基础上,有可能产生很多新的商业模式。这就是我们认为端智能是推动垂直领域人工智能化最重要的技术之一。

这一页展示了端智能发展历程。在2014-2015年的时候,美国思科公司首先提出边沿计算的概念。我们波士顿实验室首先在科技大会上提出了端智能的概念。在这个基础上,2016年美国的主流ID厂商逐步布局边缘计算和端智能。在过去的一两年之内,大概有近20家与端智能相关的企业获得超过5亿美元的融资。在2017年到来的时候,边缘计算已经迅速发展成为10亿美元的技术市场。大家也许注意到本周微软公司宣布进行重大的转型,他们专注云计算和端智能,这也是未来的方向之一。

天的题目是端智能在医疗领域的应用,为了了解在医疗领域的应用,我们首先了解在医疗领域实现人工智能化面临哪些技术方面的挑战。我们知道,真正的产品落地还有商业方面的考虑,但我今天在这里主要跟大家分享一下技术方面的考虑。

从技术的角度来说,有四个主要的技术挑战:第一,异构数据普遍存在。也就是说大家可以想象在医疗领域,我们有医疗图像、视觉、音频还有各种各样的文本、非文本数据,这些数据都有不同的处理方式;第二,有效数据的缺失。我们知道是一个很流行的话题,但是在很多应用里面其实没有大数据,只有小数据。在这种情况下,我们怎么进行处理?这也是一个挑战的方向;第三,缺乏个性化模型。其实这和密切相关。精准医疗的目的是实现千人千面,但离我们的目标还有一定的距离。第四,技术架构和系统工功效。在传统的云计算里面,在云端有很强的计算能力,不用考虑功耗。但是在终端必须考虑功耗,我们手机一天要充电,在这种情况下我们必须考虑到如何重新开发技术架构,使系统更高效。接下来,我想跟大家更详细地分享一下在每一个领域所面临的技术挑战。

首先,异构数据普遍存在。大家知道在医疗领域有医疗图像、视频数据、音频数据、结构化数据、非结构化数据、文本数据。每一种数据的处理方式、存储格式、传输方法、算法都不尽相同。怎么样能够开发一个有效的人工智能的系统,能够把这些多模态的数据利用起来,作出更好的诊断和治疗及这是非常有挑战性的任务。

第二个技术挑战,我们称之为有效数据缺失。刚才我提到大数据,大数据是现在非常热门的方向,而且在生物领域会产生很多大数据。但不幸的是,在生物医疗领域很多数据缺乏标识。我们学习人工智能,分为监督学习和无监督学习,目前为止在工业界应用最为成功的其实是监督学习。监督学习有一个重要的先决条件,是什么?它需要有一个非常好的标注的数据。大家知道BAT这些公司有海量的数据,同时在这些海量的数据里面,很多有比较好的标识,如果没有标识,他们会雇很多人对数据进行标识。但是在医疗领域,虽然我们有海量的数据,但是有用的标识并不多。也就是说,我们面临着大数据的问题,但我们只有小数据可供处理,这是一个非常挑战的任务。

第三个挑战,我们称之为缺乏个性化模型。我们知道精准医疗的目的是千人千面。但因为医疗领域的复杂性,实际上要做到这一点非常困难,有很多计算和技术方面的挑战。

最后一点,计算架构和系统。我之前提到云计算、云存储有海量的存储和计算,但是在我们的端智能里面并没有足够的存储和计算能力。怎么样能够把传统的计算架构、计算算法进行改造,使它适宜于端智能?这是一个非常挑战的任务。特别是在传统的云计算里面,数据要传到网上,传到云端。而大家知道,在很多医院里面不允许把数据传到云端,即使传到云端,也存在很大的隐私泄露的领域。所以在医疗领域,我们希望把数据留在本地。问题就出现了,怎么样才能使本地计算更有效、高效地技术?这是我们认为具有挑战的方向。

说了技术挑战,我想向大家简单介绍一下端智能如何解决医疗中的技术挑战。简单来说,我们将人工智能算法部署在医疗的终端,实现本地计算和个性化模型的定制,从而确保病人的隐私和数据安全,这是我们提出的从高层次角度解决医疗技术的挑战。

接下来,我想花一点点的时间,给大家稍微详细讲解一下技术方面的挑战。大家看到我们在这两列里面,左边是技术的挑战,右边是解决的方案。我想跟大家一条条简单介绍一下,如果大家有什么问题,可以跟我交流。

第一点,我们是用深度神经网络解决异构数据建模的问题。如果大家从事深度学习的话,就会知道每一种深度学习网络对不同的数据有效。比如说卷积神经网络对图像有效,但它对语音不一定有效。那对语音识别里面,递归神经网络用得很多,但是对图像并不有效。所以我们要需要不同的神经网络,有不同的组织、参数能够把异构数据进行建模。因为我们知道图像、视频、音频每一种模型不一样,怎么样综合起来?这是我们的解决方案。

第二个,。我们知道作为我们人有一个很重要的能力,我们称之为举一反三。也就是说我们在一个领域所学到的东西,完全有可能用于一个新的领域。当我们只有小数据的时候,当我们没有足够大的大数据的时候,我们仍然希望能够训练一个很好的模型。在这种情况下,我们用迁移学习的方法,就可以做到用一个领域的大量的数据,通过迁移学习的方法,到新的领域进行学习,从而达到类似的效果,从而能够解决小数据训练的问题。

第三方面,我们叫做用增量学习的方法,来解决个性化模型定制的问题。所谓“增量学习”是什么意思?也就是说最开始的时候,我们用数据学到一个通用的模型,这个通用的模型会教给用户和病人。在跟病人进一步交互过程中,我们用增量学习的方法把模型进行更新。在这种情况下,我们就可以定制一个模型。比如说一种治疗的方法、一种诊断,在某一个病人的手中,经过一段时间的交互,经过一段时间的数据积累,它的模型会发生变化,从而实现我们理想中的千人千面。

第四个方向,雾计算。它是云计算的延展。我们知道云计算是高高在上的,它在天上。而云有一种新的架构,把云计算的架构慢慢向终端进行扩展。在这种情况下,我们称之为雾计算,能够充分利用本地计算的能力、本地计算的功能,从而实现本地计算的目标。也就是说,我们可以用这种新的计算架构,能够实现功耗的减少,而达到同样的性能。

最后一个是异构计算。异构计算是用来解决深度学习系统速度的问题。大家知道深度学习需要CPU、GPU,如何把这些东西高效利用起来?这是非常具有挑战的问题。时间关系,我不能讲太多,之后可以跟大家交流。

我们用我们的端智能技术,可以在很多领域得到应用,包括诊断、治疗和康复,在这个领域我们都有各种不同的应用。

我占用大家2-3分钟的时间,介绍一下我们的一些应用。这个应用是实验室开发的辅助人工智能系统,该系统是典型的解决多模态数据,用多模态数据的方法解决辅助诊断的应用实例。大家可以看到我们用病例的各种信息,解决影像的问题。这个例子是基于手机的肺结核辅助系统,也是用端智能解决医疗领域应用的问题。大家知道手机计算功耗低,我们能做到这一点,也是因为我们有特殊的端智能技术。

我们相信端智能在中国医疗领域当中应该是大有可为的,谢谢大家!

2017825将举办破壁·融合 2017中国大健康产业升级峰会。本次峰会将重点关注大健康产业升级、行业变革与创新。活动三大亮点:1、卫计委相关领导将在会上发起成立大健康产业联盟”,2、智库将发布《AI+医疗行业报告》,3大健康产业领军50专题片震撼首发行业变革势不可挡产业创新方兴未艾。欢迎您报名参会峰会链接

波士顿人工智能实验室主任曹渔:端智能在医学领域的应用

This entry was posted in 人工智能, 医疗信息化 and tagged , , , , , . Bookmark the permalink.

发表评论

电子邮件地址不会被公开。 必填项已用*标注