加入收藏 | 设为首页 | 会员中心 | 我要投稿 温州站长网 (https://www.0577zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

你们把AI吹上了天,但它却依然没4岁的小孩聪明!

发布时间:2019-03-04 15:59:24 所属栏目:教程 来源:钛媒体APP
导读:图片来源@视觉中国 有研究表明,人工智能听上去很厉害,但目前最先进的人工智能还远远不能解决人类4岁儿童能够轻松解决的问题,那么,人工智能会变得比4岁的孩子更聪明吗?看看孩子们如何处理信息如何学习的,大家或许能获得启发。 每个人都听说过人工智能

你们把AI吹上了天,但它却依然没4岁的小孩聪明!

图片来源@视觉中国

有研究表明,人工智能听上去很厉害,但目前最先进的人工智能还远远不能解决人类4岁儿童能够轻松解决的问题,那么,人工智能会变得比4岁的孩子更聪明吗?看看孩子们如何处理信息如何学习的,大家或许能获得启发。

每个人都听说过人工智能的新进展,尤其是机器学习,尽管人工智能的名称令人印象深刻,但该技术在很大程度上是由检测大数据集中的统计模式的技术构成的,人类的学习方法可远不止于此。

人类是如何学习的

我们是怎么对我们周围的世界了解得这么多的呢?即使还是儿童的时候,我们也能学到很多的东西,比如四岁的孩子已经知道植物、动物和机器;欲望、信念和情感;甚至恐龙和宇宙飞船。

科学已经把我们对世界的认识扩展到不可想象的地步,扩展到宇宙的边缘和时间的开始,我们用这些知识进行新的分类和预测,想象各种新的可能性,并在这个世界促成新的事情的发生,但触及这个世界的只是一股触及我们视网膜的光子流以及干扰耳膜的空气,当我们拥有的例证如此有限的时候,我们是如何用眼睛后面的几磅灰色黏液来完成这一切的呢?

你们把AI吹上了天,但它却依然没4岁的小孩聪明!

来源于史密森学会杂志

到目前为止,最好的答案是,我们的大脑基于触达我们各种感官的具体特定而又混乱的数据进行运算,然后那些运算产生了对世界的准确描述,表现形式似乎是结构化的、抽象的和层次化的,它们包括对三维物体的感知,构成语言基础的语法,以及“心智理论”等心智能力。

“心智理论”能让我们理解他人的想法,这些表现形式使得我们能够做出各种各样的新预测,并以人类特有的创造性方式想象出许多新的可能性。

这种学习不是唯一的一种智力形式,但对人类来说尤其重要,这种智力是小孩子的专长,尽管孩子们在计划和决策方面非常糟糕,但他们是世界上最好的学习者,事实上,很多将数据转化为理论的过程发生在我们五岁之前。

人类两种基本的学习方法

自亚里士多德和柏拉图以来,有两种基本的方法来解决我们如何知道我们所知道的东西的问题,它们仍然是机器学习的主要方法。

亚里士多德自下而上来解决这个问题:从感觉开始——光子流和空气振动(或数字图像或录音的像素或声音样本),这样看你能否从中发现学习模式,这种方法被像哲学家大卫·休谟(David Hume)和密尔(J. S. Mill)这样的古典联想主义者以及后来的像巴甫洛夫(Pavlov)和斯金纳(B. F. Skinner)这样的行为心理学家进一步发扬。从这个观点来看,表现形式的抽象性和层次性结构是一种错觉,或者至少是一种附带现象,所有的工作都可以通过关联和模式检测来完成,特别是如果有足够数据的话。

这种自下而上的学习方法和柏拉图的自上而下的学习方法一直共存,谁也无法一直压过对方。

也许我们从具体的数据中获得抽象的知识,是因为我们已经知道了很多的东西,特别是由于进化,我们已经有了一系列基本的抽象概念。像科学家一样,我们可以用这些概念来构建关于世界的假设,然后,如果那些假设是正确的,我们就可以预测数据应该是什么样的,而不是试图从原始数据中发现模式,与柏拉图一样,笛卡尔(Descartes)、诺姆乔姆斯基(Noam Chomsky)等“理性主义”哲学家和心理学家也采取了这种方法。

有一个日常例子可说明上述两种方法之间的差异,它就是解决垃圾邮件泛滥的问题,那些邮件数据由收件箱中长长的未分类的消息列表组成,现实情况是,其中一部分邮件是非垃圾邮件,一部分是垃圾邮件。如何使用数据来区分它们呢?

先来考虑自下而上的方法,你会注意到,垃圾邮件往往有一些特征:长长的收件人列表,发送自尼日利亚,内文提及百万美元奖金或者壮阳药,问题是,完全有用的非垃圾邮件也可能具有这些特征,如果你看了足够多的垃圾邮件和非垃圾邮件的例子,你可能会发现垃圾邮件不仅往往具有这些特征,这些特征还往往以特定的方式出现在一起(尼日利亚来源以及提及100万美元奖金意味着有问题)。

事实上,可能有某种微妙的更高级的相关性可用来将垃圾邮件与有用的非垃圾邮件区分开来——例如,拼写错误和IP地址比较特殊,如果检测到那些特殊的模式,就可以过滤掉垃圾邮件。自下而上的机器学习技术正是这样做的,学习者会得到数百万个例子,每个例子都有某些特征,每个例子都被标记为垃圾邮件(或者其他的类别),计算机可以提取出区分二者的特征的模式,即便那些特征非常微妙。

那么自上而下的方法呢?举例来说,你收到了一封来自《临床生物学杂志》编辑的邮件,它谈到你写的其中一篇论文,说他们想要发表你的一篇文章,邮件来源不是尼日利亚,内文也没有提及伟哥和百万美元奖金,该邮件没有垃圾邮件的任何特征,但通过使用已有的知识,并以一种抽象的方式思考产生垃圾邮件的过程,你可以断定这封邮件是可疑的:

你知道垃圾邮件发送者试图利用人类的贪婪从人们身上榨取钱财。你还知道,正规的“开放获取”期刊已经开始通过向作者而非订阅者收费来覆盖它们的成本,你也不从事临床生物学之类的工作。

综合所有的这些因素来看,我就可以提出一个关于邮件来源的新假设,它的目的是诱使学者付钱在假期刊上“发表”一篇文章,这封邮件和其他的垃圾邮件一样,都源自于可疑的形成过程,尽管它看上去一点也不像垃圾邮件,你可以从一个例子中得出这个结论,你可以跳出邮件本身,通过谷歌搜索发来邮件的编辑的信息来进一步验证你的假设。

用计算机术语来说,你是从一个“生成式模型”着手,它包括贪婪和欺骗等抽象概念,且描述了垃圾邮件的产生过程,这让你能够辨别典型的来自尼日利亚的垃圾邮件,但同时也让你想象到许多不同种类的潜在的垃圾邮件,当你收到来自《华尔街日报》的邮件时,你可以逆向推断:“这看起来就像那种从垃圾邮件生成过程中生成的邮件。”

人工智能新的令人兴奋之处在于,人工智能研究人员最近开发出了这两种强大而有效的学习方法,但评论认为,这些方法本身并没有什么新的深刻的东西。

自下而上的深度学习

在20世纪80年代,计算机科学家发明了一种巧妙的方法来让计算机检测数据中的模式:链结式(或称神经网络)架构。这种方法在上世纪90年代陷入低潮,但最近随着谷歌旗下DeepMind等强大的“深度学习”方法的崛起,它又重新焕发了生机。

例如,你可以为一个深度学习程序提供一组标记为“cat”(猫)、“house”(房子)等等的网络图像。该程序能够检测区分这两组图像的模式,并使用这些信息正确地标记新的图像。

(编辑:温州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读