加入收藏 | 设为首页 | 会员中心 | 我要投稿 温州站长网 (https://www.0577zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 评论 > 正文

深度:人工智能和机器学习如何改变苹果历史?

发布时间:2016-09-07 16:15:56 所属栏目:评论 来源:加速会
导读:早在3年前,苹果就已经成为了第一家在操作系统中整合智能助手的大型科技公司……

实际上,在处理语音识别的过程中,Siri转向神经网络技术是由于多名人工智能专家的到来。这其中包括语音团队的负责人 埃里克斯·阿赛洛(Alex Acero)。阿赛洛早在90年代初就在苹果从事语音识别的研究,而随后还曾供职于微软研究院。他表示:“我喜欢从事这方面工作,并发表过很多论文。然而 在Siri推出时,我感觉,如果希望将这些深度神经网络变为现实,那么这是个机会。这将不再只是几百个人会阅读的研究成果,而是被数千万人使用。”换句话 说,他就是苹果期望的科学家类型:优先关注研发产品,而不是发表论文。

机器学习非常显著的、从多个方面对Siri 造成了冲击

在3年前阿赛洛加入苹果时,Siri的语音技术仍然从第三方授权而来,而这样的局面急需改变。费德里西指出,这是苹果多 次采取的模式:“如果有迹象表明,某一技术领域对于我们提供优秀的产品非常关键,那么我们将进行内部开发,提供我们想要的体验。如果想让某一技术变得优 秀,那么我们需要拥有这一技术,并展开内部创新。语音识别是个很好的例子,我们利用外部技术去起步。”

这一团队开始训练神经网络,取代Siri最初采用的技术。阿赛洛表示:“我们拥有有史以来最庞大的GPU(图形处理单 元)阵列,而我们向其中输入了大量数据。”在2014年7月上线之后,结果证明他们的工作行之有效。他指出:“对于所有语言,错误率下降了一半,而在很多 情况下甚至超过一半。这主要是由于深度学习技术,以及我们采取的优化方式。这不仅是对算法本身,也是对整个端到端产品。”

“端到端”的说法很形象。苹果并不是第一家将深度神经网络用于语音识别的公司,但苹果指出,通过控制整个系统,该公司获 得了优势。阿赛洛表示,由于苹果自行设计芯片,因此他可以直接接触芯片设计团队和固件开发工程师,从而最大化神经网络的性能。Siri团队的需求甚至影响 了iPhone的整体设计。

费德里西表示:“不仅仅是芯片,这也影响到我们要在设备中集成几个麦克风,麦克风的位置,如何优化硬件、麦克风,以及用于声音处理的软件。这些都需要考虑。相对于只开发软件的公司,这是令人难以置信的优势。”

另一项优势:在被用于某款产品时,苹果的神经网络可以成为其他应用的核心技术。例如,帮助Siri了解用户的机器学习技术可以成为处理语音输入的引擎。而由于Siri的存在,用户会发现,如果使用语音输入而不是软键盘,那么他们的消息和电子邮件将会更连贯。

关于Siri,库伊提到的第二大要素是自然语言理解。从2014年11月开始,Siri就利用机器学习技术去理解用户的 意图,并在一年后发布了基于深度学习的版本。机器学习技术优化了用户体验,尤其是用户可以更灵活地去表述命令。库伊掏出自己的iPhone,激活了 Siri。他对着手机说:“通过Square Cash向简恩转账20美元。”手机屏幕上显示了他的命令。随后,他用略微不同的语言再次发出这个命令。“向我老婆发20美元。”结果仍是同样。

苹果会说,如果没有Siri的进步,那么当前一代支持复杂语音控制的Apple TV无法成为现实。早前版本的Siri要求用户以固定方式说出语音命令。而目前基于深度学习的Siri不仅能从大量的电影和歌曲中找出特定的择,还能处理 一些模糊的概念:推荐几部汤姆·汉克斯的优秀惊悚片。费德里西指出:“在这项技术得到应用之前,你无法做到这一点。”

今年秋季,苹果将发布iOS 10,而Siri语音技术的最后一个环节也将被机器学习所改变。深度神经网络将取代苹果从第三方授权而来的技术。之前,Siri语音来自预先录制的声音数 据库,每个句子实际上都由单词拼接在一起。格拉伯表示,机器学习将会使Siri语音更流畅,更像是真人在说话。

阿赛洛进行了展示。最初是我们熟悉的Siri语音,这样的声音充满了机器感。随后,他又展示了新版Siri语音,而这一版本可以流畅地说出:“嘿,我能为你做些什么?”那么是什么带来了不同?阿赛洛表示:“就是深度学习。”

尽管这看起来只是一些小细节,但更自然的Siri语音可以带来很大改变。格拉伯表示:“如果语音质量更高,那么人们就会更信任Siri所说的内容。更好的语音能吸引更多用户,促使用户更多地使用。因此,这将带来收益递增效应。”

随着苹果将Siri开放给其他开发者,用户使用Siri的意愿以及机器学习带来的优化对苹果而言将变得更重要。实际上, 关注苹果的评论人认为,苹果早就应该将Siri开放。许多人指出,苹果的第三方Siri合作伙伴只有数十家,落后于亚马逊Alexa。后者宣称,外部开发 者给Alexa带来了超过1000种技能。苹果则表示,这样的对比没有意义,因为亚马逊用户需要用特定命令去调用这些“技能”。Siri可以用更自然的语 言去集成SquareCash和Uber等服务。(苹果的另一家竞争对手,即Siri创始团队开发的新版语音助手Viv也将集成第三方服务,不过Viv的 发布日期尚未确定。)

与此同时,苹果报告称,Siri的优化带来了改变。通过常见的搜索请求,用户可以发现新功能,得到更多信息。库伊表示: “请求数量正越来越多。我认为,我们需要更好地传播我们所做的工作。例如,我喜欢体育。你可以问Siri,它认为哪支球队将赢得比赛,而你可以得到答案。 连我都不知道,我们已经能做到这一点。”

在接纳机器学习技术的过程中,苹果面临的最大问题或许在于,如何在保护用户隐私的情况下取得成功。苹果会将用户信息加 密,而其他所有人,包括苹果律师,都无法获得这些数据(美国FBI(联邦调查局)在拥有搜查令的情况下同样拿不到这些数据)。此外,苹果宣布不会因为广告 目的而收集用户信息。

尽管从用户的角度来看这样做很好,但这不利于吸引人工智能人才。一名现供职于人工智能公司的苹果前员工表示:“机器学习专家想要获得的就是数据。考虑到对隐私保护的立场,苹果实际上对你有所限制。你可以辩论这样做是否正确,但苹果也因此被认为不是真正的人工智能发烧友。”

(编辑:温州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读