黑科技百度、亚马逊、谷歌,智能助理几家仍需努力

2017年7月8日

机器人,语音,自然语言处理,Siri,Alexa,人工智能

王威廉在国内关注领域的人群中颇有名气,他的微博成为不少人了解AI领域动态的渠道之一。这位UC Santa Barbara计算机科学系助理教授、CMU博士日前接受了UC Santa Barbara Current的采访,他如此描述此次采访:“什么是?在iPhone十周年之际,我应UC Santa Barbara Current之邀请,谈了谈人工智能,并简要介绍了自然语言处理。”

无论是,,Cortana还是Google Assistant,在NLP方面都还有很多工作要做

10年前乔布斯把iPhone带到我们眼前时,世界还不知道它(以及其他智能手机)将怎样改变我们的生活。10年以后,这些掌中的计算机比当年阿波罗11号上搭载的计算机还要强大,我们可以随时随地下订单、转账、查看邮件、看电影、更新Facebook、读新闻、用GPS导航、查看日程甚至控制家用电器。

而所有这些功能和技术中,有一项特别引人注目——Siri。这一iPhone 4S上首次登场的语音助理能帮助你交流、浏览、查询,还能为你打开其他App。它能为你找到附近的各种服务,还可以为你做天气预报。

这类人机交互并不是什么新东西。几十年来我们一直在试图和机器交谈,电影中也不乏人机对话的场面,但现实中的计算机似乎仍然不太健谈。

而人工智能,尤其是NLP的发展,正在改变这一局面。借助于计算力的发展和更优秀算法的出现,让计算机不仅能说话,还能交谈的愿望正变得越来越强烈。

“自然语言处理是一种让计算机理解文本和语音的技术。”王威廉说。“机器不仅要学习如何理解人类语言,还要学习如何生成人类语言。”

“产业发展趋势要求我们的学生有更丰富的数据分析技能。”他说。

人类在生命早期就开始学习语境、语音,这对于人类是很自然的事情,但对机器来说不那么容易。描述一件事有几百种方法,且对话中我们经常根据语境指称事物,习语、省略比比皆是,却不影响语义理解。我们还能理解不同的口音。而最有名的那些语音助理,Siri,亚马逊的Alexa,微软的Cortana和Google Assistant,在这些方面还都捉襟见肘。

Siri的早期版本,第一个智能手机语音助理,只能理解孤立的陈述和指令,王威廉说。你无法连续提问,即使所问的主题可以从前一个问题中推理得出,但如不明确说出,Siri就无法理解你在问什么。

“目前准确度正在提升,但仍无法令人满意。”他说,“还有很多工作要做。”

王威廉表示,研究需要大量数据和多个同时进行处理的“层”。语音识别和其他人工智能研究已经进行多年了,但直到硬件能够支持处理多层、迭代的深度学习处理,NLP才真正普及。随着神经网络模型在训练过程中变得越发复杂,NLP的应用前景将会增加,同时可能在无处不在的智能手机中部署。王威廉班上的一个学生正在致力于离线NLP处理。这样的设备可以让身处外国的用户即使无法联网也能和他人交流。

与此同时,王威廉也在深化自己的研究,不仅让机器去学习,同时让机器可以自己教自己。

“在强化学习中,我们希望教会机器在没有太多人工标注数据的情况下,逐渐做出更明智的决策。”王威廉说,“用这种机器学习方法,计算机得以自动探索选项,并采用回报最大化的行动,而其中的人类监督达到了最小化。”

王威廉说:“总的来说,NLP、机器学习和数据分析激起了较为广泛的兴趣。”NLP尤其有用,因为我们在各种app和场景中,都要依靠词汇——文本的或语音的——来交流。“如何设计能理解人类并生成自然语言的智能机器,我想这是未来科技工作者都要面临的问题,而他们也将从中受益。”

This entry was posted in 自然语言处理, 语音识别 and tagged , , , . Bookmark the permalink.

发表评论

电子邮件地址不会被公开。 必填项已用*标注