@那些想要转行AI的人:送你一份人工智能入门指南

@那些想要转行AI的人:送你一份人工智能入门指南 发表时间:2017-11-08 00:00

点上方绿标即可收听朗读音频

双击文章内容从指定位置处朗读

翻译 | AI科技大本营(rgznai100)

参与 | 彭硕

人工智能是什么?人工智能为何重要?我们应该畏惧人工智能吗?为什么突然之间所有人都在谈论人工智能?

你可能会从网上知道人工智能如何为亚马逊和Google的虚拟助理提供支持或者人工智能如何一步步地取代所有的工作(有争议的)但是这些文章极少很好的解释人工智能是什么(或者机器人是否将要接班)本文将对人工智能做出解释这份简明指南将随着领域的发展和重要的概念出现进行更新和改进

 

人工智能是什么?

 

人工智能是具有学习机制的软件或计算机程序人工智能使用这种知识在新的情况下做出决定就像人类一样构建该软件的研究人员尝试编写可以读取图像文本视频或音频的代码使得人工智能从中学习一些东西 一旦机器学到了知识就可以在别的地方使用 如果一个算法学会识别某人的脸那么可以在Facebook照片中找到它们 在现代AI中学习通常被称为“训练”(将在后文进行介绍)

 

人类自然会学习复杂的想法我们可以看到像苹果这样的对象然后在以后识别一个不同的苹果 机器是非常字面化的 - 电脑没有对“类似”的灵活概念人工智能的目标是使机器减少仅基于文本而形成的概念 机器很容易判断两张苹果的图像或两个句子是否完全相同但人工智能旨在从不同的角度或不同的光线识别同一苹果的图片; 它捕捉视觉角度去识别苹果这被称为“泛化”或基于数据的相似性形成想法而不仅仅是基于AI所看到的图像或文本 更普遍的想法可以应用于AI以前没有看到的事情

 

卡内基梅隆大学计算机科学教授亚历克斯·鲁德尼奇(Alex Rudnicky)说“人工智能的目标是将复杂的人类行为降低到可以计算的一种形式 “这反过来又使得我们能够建立对人类有用的可以从事复杂活动的系统。”

 

今天距离人工智能还有多远?

 

人工智能研究人员仍在努力解决这个问题的基础 我们如何教电脑来识别他们在图像和视频中看到的内容? 之后识别如何进入理解 - 不仅产生“苹果”这个词而且知道苹果是一种与桔子和梨相关的食物人类可以吃苹果可以用苹果做饭并用它们来制作苹果馅饼并且联系到约翰尼·苹果派的故事诸如此类 还有一个理解语言的问题——词根据语境有多重含义定义总是在演变每个人的说法都有一点点差别 电脑如何理解这种不固定的千变万化的语言构造?        

 

由于介质不同人工智能的进展速度也不相同现在我们看到了在理解图像和视频能力的惊人增长这是一个业界称之为计算机视觉的领域但是这一进步对其他人工智能的理解并没有多大帮助这是一个被称为自然语言处理的领域这些领域正在发展有限的智能这意味着人工智能在处理图像、音频或文本方面具有强大的功能但却无法从这三者中学习到同样的方法一个不可知论的学习形式是一般智力这是我们在人类身上看到的许多研究人员希望各个领域的进步将揭示更多关于我们如何让机器学习的共享真理最终融合成统一的人工智能方法

人工智能为什么重要?

 

一旦人工智能学会了如何从图像中识别出一个苹果或者从音频片段中转录出一个语音片段它就可以被应用于其他软件中做本应该需要人类来做的决策它可以用来识别和标记你的朋友在Facebook的照片你(一个人) 本应该手工做的事情它可以从自动驾驶汽车或者你的车的倒车影像里识别出另一辆车或者一个街头标志它可以用来定位农业生产中应该移除的劣质农产品这些任务仅仅基于图像识别通常是由用户或公司提供软件的人完成的

如果一个任务节省了用户的时间它是一个功能如果它能节省了公司里工作的人的时间甚至完全消除了一份工作那么它就是一个极大节约了成本有一些应用程序比如在销售分析的几分钟内处理数百万个数据点如果没有机器是不可能实现的这意味着以前从未有过的新信息的潜力这些任务现在可以通过机器在任何时间和任何地点快速、廉价地完成它是人类曾经完成的任务的复制对于无限可伸缩的低成本劳动力来说这是不可否认的经济利益

 

卡内基梅隆大学人类计算机交互实验室的教授Jason Hone说虽然人工智能可以复制人类的任务同时它也有能力开启新的劳动“汽车是马的直接替代品但在中长期内它还带来了许多其他用途比如用于大型运输的半卡车家具搬运货车小型货车带折蓬的汽车”Hong说“同样地人工智能系统在短期内将直接取代常规任务但在中长期内我们将看到它和汽车一样的戏剧性使用

 

就像Gottlieb Daimler和Carl Benz没有考虑到汽车将如何重新定义城市的建造方式或者污染或肥胖的影响我们还没有看到这种新型劳动力的长期影响

 

AI为什么现在这么火爆而不是30(或者60)年前?

 

关于人工智能应该如何学习的许多想法实际上已经超过了60年上世纪50年代像Frank Rosenblatt、Bernard Widrow和Marcian Hoff这样的研究人员首先研究了生物学家认为大脑的神经元是如何工作的以及他们在数学上做的事情我们的想法是一个主要的方程可能无法解决所有问题但是如果我们像人脑那样使用了很多连接起来的方程会如何呢?最初的例子很简单:通过数字电话线路分析1和0然后预测接下来会发生什么(这项由Widrow和Hoff在普林斯顿大学完成的研究仍然被用来减少电话连接的回声)

2006年达特茅斯会议五十年后当事人重聚达特茅斯左起摩尔麦卡锡明斯基赛弗里奇所罗门诺夫

 

数十年来计算机科学界的许多人认为这个想法永远不会解决更复杂的问题而现如今它是主要科技公司的实现人工智能的基础从谷歌、亚马逊到Facebook再到微软回顾过去研究人员现在意识到计算机还没有复杂到足以模拟我们大脑中的数十亿神经元而且我们需要大量的数据来训练这些神经网络正如我们了解的那样

 

这两个因素计算能力和数据在过去的10年里才得以实现在2000年代中期图形处理器单元(GPU)公司NVIDIA表示他们的芯片非常适合运行神经网络并开始使得AI在其硬件上运行变得更加容易研究人员发现如果能够使用更快、更复杂的神经网络就可以提高准确度

 

然后在2009年人工智能研究员Fei-Fei Li发布了一个名为ImageNet的数据库它包含了超过300万个有组织的图片在里面还添加了标签她认为如果这些算法有更多的例子来寻找到模式之间的关系那么它就能帮助他们理解更复杂的想法她在2010年开始了一场ImageNet的竞赛到2012年研究人员Geoff Hinton使用了数百万张图片来训练神经网络以超过10%的准确率的巨大优势战胜了其它的应用正如Li所预测的数据是关键Hinton还把神经网络堆在另一个上面一个只是找到了形状而另一个则看了纹理等等这些被称为深度神经网络或深度学习也就是今天你在新闻中听到的关于人工智能的消息一旦科技行业看到了结果人工智能的繁荣就开始了数十年来一直致力于深度学习的研究人员成为了科技行业新的摇滚明星截止2015年谷歌有超过1000个项目使用了某种机器学习技术

 

我们应该恐惧人工智能吗?

 

看过终结者这样的电影后人们很容易就会害怕像天网这样的全能的邪恶的AI在人工智能研究领域天网被称为一般的超级智能或者人工通用智能这类软件在各个方面都要比人脑更强大

 

由于计算机能够扩展这意味着我们能够制造出更强、更快的计算机然后把他们连接起来恐惧是来自于这些机器人大脑的计算能力可能会增长到一个深不可测的水平如果他们真的聪明到那个地步他们就会无法控制并会绕过任何试图关闭他们的人这就是埃隆马斯克和史蒂芬霍金这样极其聪明的人所担心的世界末日正如马斯克所言虽然它们在某些领域的确拥有智能但大多数主流人工智能研究人员都对召唤恶魔的说法不以为然尽管研究人员把学习的基本原理打破了例如他们改变了如何去理解模式背后的意义然后把这些新的理解组织成一个功能性的世界观目前还没有证据表明电脑会有需求欲望或着意志来存活Facebook 人工智能研究中心的领导Yann Lecun说道

 

“当我们受到威胁我们嫉妒我们想要获得资源比起陌生人我们更喜欢我们的近亲等等这些行为时我们会变得更暴力这些都是进化中为了我们的生存而建立起来的除非我们很明确的把这些基本行为建立到智能机器里否则它们不会有这些行为”他在Quora上写道

没有证据表明计算机会认为人类是一个威胁因为没有给计算机定义这样的威胁也许人类能够定义它并告知机器在一些参数中运作这些参数在功能上就像一个生存的意志而这个意志并不存在

谷歌公司的创始成员、百度前人工智能负责人吴恩达说“我说过我不担心人工智能变邪恶的原因跟我不担心火星上人口过多的原因是一样的” 但是有一个原因让我们害怕人工智能人类

有证据表明人工智能对从它学习的数据中获取人类偏见很敏感这些偏见可能是无害的比如识别图片中的猫比狗更常见因为它是被更多的猫图片训练出来的但是它们也可能会把刻板印象延续下去比如相比其他性别或种族AI更多的把医生和白人男性联系起来如果一个有这种偏见的人工智能负责招聘医生那么它可能会对那些非白人男性的员工造成不公平ProPublica的一项调查发现用于判决那些被判有罪的人的算法存在种族偏见因为其对有色人种的人提出了更严厉的判决卫生保健数据通常不包括妇女尤其是孕妇这样在向这些人提出医疗建议时会导致系统功能不完整由于这些机制之前是由人类来做的而现在我们拥有一台速度更快的超级强大的机器我们就要确保它们能够在我们的道德规范中公平而一致地做出这些决定

要判断一个算法是否有偏见并不容易因为深度学习需要数以百万计的连接计算通过所有这些小的决策来计算出它们对更大的决策的贡献是非常困难的因此即使我们知道人工智能做出了一个糟糕的决定我们也不知道它是什么原因也不知道它是怎么做的所以在它实施之前很难建立起一个机制来捕捉到偏见

在自动驾驶汽车这样的领域这个问题尤其不稳定在自动驾驶汽车上每一项决定都可能事关生死早期的研究表明我们很有希望能够逆转我们所创造的机器的复杂性但现在几乎不可能知道为什么Facebook、谷歌或微软的人工智能做出了任何决定

功能性AI术语表

算法一套计算机要遵循的指令一个算法可以是一个简单的单步程序也可以是一个复杂的神经网络但是通常被用来指一个模型

 

人工智能这是一个统称广义上说软件意味着模仿或取代人类智能的各个方面人工智能软件可以从图像或文本、经验、进化或其他研究人员的发明等数据中学习

计算机视觉人工智能研究探索图像和视频识别和理解的领域这个领域从了解苹果的外观到苹果的功能用途以及与之相关的理念它是被用作自动驾驶汽车、谷歌图像搜索以及Facebook上自动贴标签的主要技术

 

深度学习一个神经网络被分层来理解数据中的复杂模式和关系的领域当一个神经网络的输出成为另一个神经网络的输入时有效地将它们叠加起来由此产生的神经网络就是“深度”了

普通智力有时被称为“强人工智能”一般智能将能够在不同的任务中学习和应用不同的想法

生成式对抗网络这是一个包含两个神经网络的系统一个是用来生成输出的另一个是用来检验这个输出的质量是否是想要的输出的神经网络例如当试图生成一个苹果的图片时生成器将生成一个图像而另一个(称为鉴别器)如果不能识别图像中的一个苹果会使生成器再次尝试生成

 

机器学习机器学习(ML)常常与术语人工智能结合在一起是使用算法从数据中学习的惯例

模型模型是一种机器学习算法它可以建立自己对某一主题的理解或者它自己的世界模型

自然语言处理用于理解语言中思想的意图和关系的软件

 

神经网络通过连接起来的数学方程式的网络模拟大脑处理信息的方式以建立起来的算法提供给神经网络的数据被分解成更小的块并根据网络的复杂性分析其基础模式成千上万次当一个神经网络的输出被输入到另一个神经网络的输入时这两个神经网络就会链接到一起成为分层成为一个深层的神经网络通常深度神经网络的层会分析越来越高的抽象层的数据这意味着在得到最简单和最准确的数据表示之前它们会将有用数据从没有必要的数据中提取出来

 

卷积神经网络一个主要用来识别和理解图像、视频和音频数据的神经网络因为它能够处理密集的数据比如数百万像素的图像或数千个音频文件样本

 

递归神经网络一种用于自然语言处理的神经网络它可以周期性地、连续地分析数据这意味着它可以处理像单词或句子这样的数据同时在句子中保持它们的顺序和上下文

 

长短期记忆网络一种周期性的神经网络的变体它的是用来根据数据来保留结构化的信息例如RNN可以识别句子中的所有名词和形容词检查它们是否被正确使用但LSTM可以记住一本书的情节

 

强化学习一种能够从经验中学习的深度学习算法是可以控制环境的某些方面的算法比如视频游戏的角色然后通过反复试验和错误来学习由于它们是高度可重复的作为三维世界的模型并且已经在电脑上玩了许多强化学习的突破都来自于玩视频游戏的算法在DeepMind的AlphaGo中RL是机器学习的主要类型之一它在围棋中击败了世界冠军Lee Sedol在现实世界中在网络安全等领域已经证明了这一点软件学会了欺骗反病毒软件使其认为恶意文件是安全的

 

超级智能比人脑还要更强大的人工智能很难定义它因为我们仍然无法客观地衡量人类的大脑能做什么

 

监督式学习在被训练的过程中给其提供的数据是已经组织好的、已经被贴好标签的机器学习如果你正在建立一种监督式的学习算法来识别猫你就可以在1000张猫的图片上训练这个算法

 

训练通过提供数据来让算法学习的过程

 

无监督学习机器学习算法的一种没有给出任何关于它应该如何对数据进行分类的信息并且必须找到它们之间的关系的算法像Facebook LeCun这样的人工智能研究人员将无人监督的学习视为人工智能研究的圣杯因为它与人类自然学习的方式非常相似“在无人监督的学习中大脑比我们的模型好得多”LeCun告诉IEEE光谱“这就意味着我们的人工学习系统缺少了一些非常基本的生物学习原理”

资源推荐

重磅 | 128篇论文21大领域深度学习最值得看的资源全在这了

爆款 | Medium上6900个赞的AI学习路线图让你快速上手机器学习

Quora十大机器学习作者与Facebook十大机器学习、数据科学群组

Chatbot大牛推荐AI、机器学习、深度学习必看9大入门视频

葵花宝典之机器学习全网最重要的AI资源都在这里了(大牛研究机构视频博客书籍Quora......)

亲,眼睛太累了,关注exread(睿读吧)微信号,用耳朵“阅读”微信。

您可以将文章的链接或收藏的微信发送到睿读吧微信号中,我们会帮您转换成音频来听读,让您的眼睛休息一下吧!
查看来源 违规举报