加入收藏 | 设为首页 | 会员中心 | 我要投稿 温州站长网 (https://www.0577zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 动态 > 正文

宋继强:20年后来看今天 人工智能还是早期阶段

发布时间:2016-12-19 13:45:31 所属栏目:动态 来源:网易科技
导读:副标题#e# 网易科技讯12月17日消息,由中国人工智能学会主办,网易科技承办的2016中国人工智能产业大会暨第六届吴文俊人工智能科学技术奖颁奖盛典今日在深圳登喜路国际大酒店举行。 本次大会以“AI新时代·产业新动能”为主题,会上英特尔中国研究院院长宋

现在看到做人工智能的应用,或者说部署人工智能的计算在云端还是很少,通过英特尔的分析,现在是云端提供绝大部分的计算资源的,目前这部分的份额还是在10%,还是比较少,但是这一块是非常大飞速发展的,但是到2020年,AI计算量将会增长12倍,我要节省电力、体积和资源,这都是重要的,所以我们要不断推动技术创新,我们不能停留在今天这个阶段,后面有更多的优化方案等着我们。

从我们做人工智能的分析来看,因为英特尔不是人工智能专家,但是我们跟很多学界一起合作,也有一个对人工智能分类的认识,人工智能从在学术界开始,定义学科来讲,它的目标是为了让机器具备人的智能处理的能力,刚好跟徐扬生院士讲的第一条非常相似,哪些能力很重要?三大能力,感知能力、推理能力和行动能力,这三大能力是决定了你这个机器人能不能根据外界环境,做一个很好很智能的决策,同时把他反馈到外部世界,而且比较稳定。另外还有一个徐院士没有讲到的,就是适应性,而不是这个设计好了就只有当初的能力,而是要有适应不停变化的环境,要有持续的学习,自主的学习,不断增强的能力,这里横向化的内条非常重要,记忆是目前大家还想得比较少的,但是在一个真正的自主系统里,能够让人去满意使用它的话非常重要,它实际上是让你能够把感知推理行动串起来,去适应新的环境。下面这个就是具体的方法工具,这么多都是专家学者,就不需要多讲。首先要有大量的数据,才能把知识和规则提取出来,才能为我们所用,处理新的数据。第二类是知识驱动,不在乎你有多大的数据,可能用很少的数据,但是那些数据非常关键和精准,你只要从小数据里,就能推出一个完备的系统,能够做事。所以这两块,是应该齐头并进的,不能说哪一块优于另外一块,而是应该互相结合的去做。

深度学习目前来讲非常火,他火的原因是什么?因为最近这几年,我们首先有大量的数据,像ImageNet,提供了大量的数据,计算的能力也大幅提升,我们知道摩尔定律在过去这些年给我们提升更多的计算能力,存储能力也大幅度提升。过去二十年来,我们的计算能力提升了上百倍都不止,我是90年代读大学的,用的是286,386,现在二十年后,是百倍级的提升,机器你的主屏强,内存小,性能还是不够。1995年的时候,一个GB的存储一千美金,现在0.03美金,这都是通过过去的摩尔定律推动到现在,才有这个爆发点。这个爆发导致我们可以通过深度学习,在某些领域取得比较大的突破,有些领域比如说做视觉识别,特定的人脸识别,已经可以超过人,他犯的错误比人的少,因为人是生物,人会疲劳,人会走神,机器不会。所以目前在语音的识别和视觉的物体识别两个领域有非常大的突破。我们也看到了这个突破,通过深度学习可以通过增加它的训练数据增加性能,意味着我要增加训练能力,来支持这些训练,而不是把数据增加一百倍,把训练时间增加一百倍,我增加这些处理数量,是希望大幅度缩减我的训练时间,但是光增加处理数量行吗?不行,你会遇到一个平台,因为处理器与处理器之间需要有通讯,这些通讯有时候是数据通讯,有时候是控制通讯,当你通讯的瓶颈达到的时候,你再增加处理器,你也缩短不了。所以这就是目前来讲,为什么你在使用某些架构的时候,你再增加处理器,也不见得训练时间减少了,而这时候需要有更高效的技术,能够同时增加你计算的密度,同时也能够大幅度增加你的通讯带宽,这样才能达到线性的增长。

Lake crest是今年刚刚发布,是今年11月份刚刚对全球发布的英特尔的代号,这个代号是专门为深度学习定制的一款芯片,这款芯片有几大特色。第一,它里面的运算设计是为了深度学习量身定制,同时它的计算密度也非常高,这个待会儿也会讲到。第二,它把数据访问,刚才我们讲到的多节点之间的数据访问的瓶颈,给优化掉了,并且能够支持高速的内存,这个高速内存是使用HBM2的内存,直接分装在一个芯片的里边,所以这样的效果是非常的好。这样会给我们带来什么好处?我们知道,在做深度学习训练的时候,即使你的模型,我们知道人工智能做神经网络的时候,它的每一个节点里面既有计算也有数据,而且数据有的还是浮点的,希望是每个计算节点有自己的内存接口,这个要求还不是那么容易满足,现在我们可以通过这个硬件技术支持到这一点,你有了这个支持,意味着我首先设计的模型,我在做很多算法训练的时候,我的尺寸大小不受太大的限制。因为很多人在初始设计的时候不考虑功耗,不考虑代价成本,去做出来,但是这时候是需要允许你去做这么大模型的平台的,同时IO增加,你也可以知道是多少增加,所以我们可以很好支持新模型的探索,这是怎么实现的呢?

这是它的一张架构图,中间那些绿色的实际上是计算处理单元,提供了我们称为基于张量架构的单元,我们做很多块运算,张量计算架构可以很快速直接进行快运算,比用处理器快很多,而且我们看到这里面有个Flexpoint技术,以前有定点数,有浮点数,但这都是固定的告诉你,你用了多少,Flexpoint是介于这两者之间,是可以动态变化的,也就是你在做的初期,你不需要那么高的精度,你可以用广的精度做,运算到后期,你需要越来越多进度的时候,再增长为它提供很好计算的密度。同时还有一个好处,这四个黄块,是直接就在一个芯片里面分装在一起,有各自独立的IO接口,而且距离主芯片非常近。第三个好处,我设计了一款芯片之后,其实总值是有一个上限,怎么样去突破这个上限,你是否能容易构成节点。这上面的蓝块ICL,是私有定制芯片间的通讯链路,这个链路的速度非常快,带宽也很高,而且它的12个意味着什么?一个芯片可以跟12个芯片连接,可以构成一个12维的超网络支持你的运算,现在大家可能还用不到这么多。这就是它有一定灵活性的深度学习计算的架构。

这是我们收购了很多公司带来的新技术,我们之前的技术仍然存在,包括至强融核的技术,去做通用计算的加速。Arria FPGA可以做在功耗和性能优化的情况下做加速,这也是非常好的,这在2016年就有。2017年,这些继续往前推进,同时我们会增加在特定优化的时候,增加Lake Crest架构,我们会把这些人工智能的硬件和方案统称为Nervana平台产品组合,这是我们的商标,而不只是收购过来的一款芯片。

(编辑:温州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读