加入收藏 | 设为首页 | 会员中心 | 我要投稿 温州站长网 (https://www.0577zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

达摩院重修“巴别塔”

发布时间:2019-03-04 17:44:49 所属栏目:教程 来源:钛媒体APP
导读:图片来源@视觉中国 钛媒体注:本文来自于公众号浅黑科技(qianheikeji),作者:史中,钛媒体经授权转载。 刘慈欣在小说《乡村教师》里,有这么一段描述: 一个文明程度极高的外星文明观察地球,发出了惊叹:这种没有记忆遗传的生物,相互间用薄膜器官震动

达摩院重修“巴别塔”

图片来源@视觉中国

钛媒体注:本文来自于公众号浅黑科技(qianheikeji),作者:史中,钛媒体经授权转载。

刘慈欣在小说《乡村教师》里,有这么一段描述:

一个文明程度极高的外星文明观察地球,发出了惊叹:这种没有记忆遗传的生物,相互间用薄膜器官震动产生的声波进行交流,每秒只有1-10比特的速率,居然能够独立进化出 5B 级文明,这太不可思议了!

达摩院重修“巴别塔”

看到这里,我心头一紧。。。

姑且不论在大刘心中 5B 文明比 2B 文明强多少。重点在于:外星人说的有道理啊,我们不就是些只能靠超低带宽的语言交流的沙雕残疾生物么。。。人类这个创业团队一点点从古猿集团剥离,用了一百万年才“独立上市”。我们仰仗的全部家当:“听说”“读写”“思考”,全都和语言能力相关。

幸亏我们“身残志坚”,在渺小之余还意外赢回些许尊重。

利用低效的语言文字,我们发现了牛顿定律,发现了相对论和量子论。

我们喜欢党同伐异顺便制造了世界大战,但我们没死反而在战争中发明了计算机,在此之上,我们还发明了人工智能。

我们还扛着锄头进军人工智能领域最难开垦的土地——“自然语言处理技术”,想让人工智能反过来听懂我们说话。

人类果然是个不知天高地厚的狂妄物种啊。

这个魔幻的剧本一旦打开,就再也停不下来了。2018年底,一则预测击中了人们的神经:

语音人工智能将在特定领域通过图灵测试。

这是啥意思?这意味着人工智能马上就成为世界上第二个会“说人话”的物种了。

想想看,你和妹子煲了五分钟电话粥,可能都根本分辨不出她到底是个人还是机械。这将带来一场伦理革命:未来我们不仅把人工智能当做合作伙伴,也会把它们当做爱或恨的对象。人类稳固万年的情感边界将第一次松动。

发布这条预测的,不是民间科学家,而是大名鼎鼎的达摩院——阿里巴巴挑战前沿科学的骑士团。

很多人都会回想起2017年马云在云栖大会上振臂一挥,豪掷千亿组建达摩院的热血沸腾。而欣赏一部史诗,决不能只看它的封皮。他的况味藏在每一行诗句的光影里。

达摩院的大神们,究竟怎样一步一步攀登“人工智能”这座梦幻远山?

你和身边的朋友们,又要怎样一点一点地学会和“说人话的机器人”相处?

接下来中哥还得用“语言”这种低效的模式,慢慢讲给你听。

(1)脑洞+脑洞+脑洞

按照惯例,先跟中哥开几个脑洞。

听过那么多道理,却还是过不好这一生。

你有没有想过这是为什么?因为你是“听”到的道理,而不是用一根电线直接怼到你大脑传输进去的完整信息,语言传递的不是全量信息。

脑洞一:语言和电线是一样的,他们从本质上来说都是“脑脑接口”。

给你一分钟,闭上眼睛理解一下。

你可以想象每个人的大脑都是一汪深邃的湖泊,他们之间若要连接,需要挖一道水渠,就像下面这样:

达摩院重修“巴别塔”

这个水渠,就是我们的语言。(这回你理解为啥说话又叫沟通了吧)然而,语言携带的信息量很少,就像水渠的宽度非常窄,很难把一个湖里的水瞬间全部灌进另一个湖里。

脑洞二:为了更高效地沟通,语言实际上是把信息进行了极高的压缩。

每个人都会把脑海里综合视觉、触觉、嗅觉、味觉、环境、常识、专业知识和彼时心境综合起来形成的汹涌思路压缩成一段语言说给接受者,而接收者听到之后,在自己脑海里把这些语言信息结合自己的视觉、触觉、嗅觉、味觉、环境、常识、专业知识储备和当时的心境加以还原,这个过程完成,听话者才理解了说话者的意思。

这个压缩比率有多大呢?每秒人脑可以处理的信息是400部高清电影,而每秒语言的信息量只有几k大小,差距几十万倍。所以,如果你的语言是这颗豌豆,那么脑补出来的内容就是这个篮球。

脑洞三:巨幅压缩会伴随巨大的信息损失。由于每个人的感官和知识储备不同,在补全的过程中就会出现一定歧义。

特别明显的一个例子就是:过年你和来串门的熊孩子讲不要乱动自己珍贵的手办,结果他完全理解不了你在说什么。直到他把模型弄碎一地,你抓着他的腿往树上一顿抡。有了这次完整的体验之后,他的知识结构里才会添加一项特别具体的禁忌。

情侣之间吵架,女生哽咽着说:你不懂我!这根本不是无情无耻无理取闹,实际上这时她已经一语道破了人类的生理极限。

脑洞四:机器理解人话的过程中,最重要的一个障碍就是:“歧义”。

人类可以根据自己所有的感官采集到的实时信息和巨量的知识储备在大脑里解压对方的语言,但是机器远没有人这么敏感的嗅觉触觉视觉,更没有人的常识知识图谱,所以它们把语言中压缩的信息进行还原时,所出现的“歧义”就会像火山喷涌那样多。

半个世纪以来,所有自然语言处理技术的目的都可以归纳为:消除歧义。(在机器的精神空间中,一句话对应且只对应一个意思)

我说这么一大堆的目的,是为了让你理解:人能听懂人已经靠脑补+幸运了;让机器听懂人,我只能说这是个奇迹。

说到这,中哥多补充一些背景知识。

自从人类发明计算机那天起,人机交互就踏上了艰难的长征路。

上世纪中叶,人们把打孔的纸带塞进机器,用这种方式和计算机交流。

上世纪80年代,人们组合了键盘、显示器、命令行界面、编程语言,人机交互的方式变成了手的敲击和屏幕显示。

上世纪末,MacOS 和 Windows 领导的图形界面出现,键鼠套装成为了人机交互的标配。

达摩院重修“巴别塔”

2010年,智能手机普及,人机交互的方法变成了一根手指点点点。

2016年以后,智能音箱爆发,这才让酝酿已久的语音交互方式站在了历史的聚光灯下。

在未来,很可能人类可以用脑电波设计“脑机接口”进行人机交流,但所有相关的技术都处在非常早期的阶段。

你可能觉得人机交互的方法变来变去,捉摸不定。但事实上,它至少呈现了两个永不回头的趋势:

1、交互的带宽越来越大。

2、人机交互中,人需要适应机器习惯的比重越来越小,机器需要适应人习惯的比重越来越大。

虽然在未来脑机接口有可能实现超大的带宽,但是不可否认,语言仍然是人类千万年进化形成的最高效的“天然接口”,占据了无可替代的“技术生态位”。目前人工智能语音交互被公认为“下一代人机交互技术”。

这种和人类命运息息相关的科技研究,正是达摩院的菜。

不久之前,我见到了这一领域的两位大神——达摩院语音实验室的老大鄢志杰和达摩院语言技术实验室的老大司罗。

语音实验室,就像鱼头和鱼尾,负责“听和说”。简单来说就是把人说的话精确转录为机器能处理的文字,把机器的文字输出用无限接近于真人的发音说出来。

语言技术实验室,就像鱼的中段,负责思考。简单来说就是在人工智能大脑内完成归纳、理解、思考、总结等等一系列步骤。

这两个团队,拼成了“自然语言处理”从接受信息到处理信息到表达信息完整的一条鱼。

像很多达摩院的大神一样,鄢志杰和司罗也不是普通的科学家,他们是“有故事的科学家”。

(2)上山下乡

如果你像欣赏雕塑大卫那样欣赏达摩院,你就会发现达摩院的躯体很有意思。

达摩院下设机器智能、数据计算、机器人、金融科技、X实验室几大分支,几乎全部和人工智能相关。这样浓重的配比,和达摩院的传承不可分割。

举个例子,达摩院中领衔机器智能班底的金榕和蚂蚁金服首席科学家漆远,他们都是当年阿里巴巴最神秘的机构——iDST——的创世团队。

达摩院重修“巴别塔”

金榕

iDST,全称是“数据科学与技术研究院”。当年马云高呼的“DT 时代”,其中的D和T,都被放进了 iDST 的名称里,可见它被给予了多重的期待。

(编辑:温州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读