作者:胡郁 来源:中国科学报 发布时间:2016/7/5 9:16:46
选择字号:
胡郁:机器向人脑的靠近

 

■胡郁

机器擅长的是运算智能,感知智能方面,就是看到世界、听到周围世界的能力,机器也在快速赶上来。但在认知方面,让我们能够有语言、语音,能够积累知识、能够进行判断等方面,机器其实比我们差得很远。

这也是科大讯飞现在以语音和语言为入口的计算机的认知革命。我们所执行的讯飞超脑计划想要做的事情,就是把机器的感知智能和认知智能通过传感器和算法感知世界,并且能够对自然的人类世界进行认知,这将作为人工智能非常重要的突破点。

怎样实现这种突破,有两种不同的途径,一种和脑科学非常相关,我们可以对大脑所有的神经元构造和它的工作机理进行分析,然后根据大脑的整个工作机理重构出来真正和大脑相同的机制,但这条思路用时比较长。

另外一条思路就是用互联网思维,利用我们机器学习算法和大数据在尽可能快的过程中学习,就像AlphaGo一样,不完全能模仿大脑,但利用机器运算的方法能够模拟我们的感知和认知。

从人脑中获取智能最关键的一点是,就像人类学会飞翔,但我们并没有造一个鸟出来,而是利用了空气动力学。我们研究大脑,其实并不是把大脑完成复制,而是希望找到大脑中的智力动力学,进一步优化机器学习的算法。

如果用互联网思维来解决、改进我们的人工智能,要感谢三方面的进展:一是人工神经网络,另外拜互联网和移动互联网所赐,我们可以得到大量数据;更重要的是我们有千千万万的算法,有直达用户的产品,这些产品把用户的使用习惯源源不断传入后台,我们可以利用网络效应不断优化它们。

真正人工智能的框架应该是什么样的呢?人类大脑皮层在工作过程中分为两个层面:一个叫感知层面,就是视觉、听觉和触觉;还有认知层面,当我们看到一只猫、听到猫的叫声,人脑里有一个概念,这些概念形成了语言中的单词和词汇,就是“猫”的概念。所以在讯飞超脑里分两个层面:感知智能是对我们听到的、看到的、触觉到的东西进行识别,同时把识别结果上升到我们认知智能的层面,形成一个概念空间的表示和推理,在过去五年中我们相继把深度学习网络应用在感知和认知,包括视觉、听觉、自然语言、翻译等各个方面。

我们通过递归的方法,可以让神经网络模拟大脑的感觉,这是现在最新型的递归神经网络用于语音识别的过程。但光有递归还不够,现在最新的一个方式是用图像的方法识别语音,这是当前最新的技术。

当语音进入我们的耳朵时,我们耳朵里的纤毛会根据它的长度与语音中不同的频率进行共振,如果把共振的频率分析出来,我们可以得到语谱图。我们应用一个新型的卷积神经网络来处理语音图像,就得到了语音识别当前最好的结果。我们可以看到,即使是跟最新的递归神经网络相比,用卷积神经网络,也就是用识别图像的方法,我们仍然能取得48%的提高。

现在我们采用一种连续的空间来表现词语,每个字、词都可以用“词语卷积”的方法,用一段连续的数字,相当于一个空间里的坐标系,这样每两个单词之间的距离就可以把它计算出来。我们把所有词聚了一下类就可以看到这么一个结果,比如新浪、网易、腾讯,这些词语是连在一起的;吕布、张飞、关羽、诸葛亮,他们是比较接近的。其实在我们的大脑皮层中,如果你来测量,比如播放一个词语,我的大脑里会出现放电,相关词语在大脑皮层中存储的位置也是非常接近的。

利用这种方法,我们建立了一种表现词语的空间概念的表达体系,在这样的表达体系之下,我们可以进一步地去分析词语层面、句子层面和篇章层面,它们在各个层面上的连接和计算的距离。

(作者系科大讯飞轮值总裁,本报记者贡晓丽根据其在第三届网易未来科技峰会上发言整理)

《中国科学报》 (2016-07-05 第5版 技术经济周刊)
 
 打印  发E-mail给: 
    
 
以下评论只代表网友个人观点,不代表科学网观点。 
SSI ļʱ
相关新闻 相关论文

图片新闻
《自然》(20241121出版)一周论文导读 清华这位院士搭建了一座室外地质博物园
科学家完整构建火星空间太阳高能粒子能谱 “糖刹车”基因破除番茄产量与品质悖论
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文
 
论坛推荐

Baidu
map