人工智能漫谈

更新于 2018年05月16日

本文主要内容:人工智能现在已经有62岁了.人们普遍认为1956年美国的达特茅斯研讨会Summer Research Project on Artificial Intelligence,是现代人…

主要内容

人工智能现在已经有62岁了。人们普遍认为1956年美国的达特茅斯研讨会Summer Research Project on Artificial Intelligence,是现代人工智能的起点。这也是人工智能,Artificial Intelligence这个词首次登场。这个会议是由四个人发起的,分别是明斯基Minsky,约翰.麦卡锡McCarthy,罗切斯特Rochester和香农Shannon。作为划时代历史意义的一次会议,当然不会只是提出了AI的名称,更重要的是带来了三个标志性的研究成果,分别是明斯基提出的 SNARC,麦卡锡John McCarthy提出的α-β搜索法,Allen Newell提出的 “逻辑理论家”。

会议原址

达特茅斯楼

0.jpg

明斯基Minsky在这次会议上提出SNARC(Stochastic Neural Analog Reinforcement Calculator),这是世界上第一台神经元网络计算机,用3000个真空管来模拟40个神经元组成的网络。 后来他去普林斯顿大学读数学博士学位,博士论文题目是《神经网络与大脑模型问题》,当时评委认为神经网络不是数学,还好冯.诺依曼力挺他,说”现在不算,但很快就得算”。 冯老眼光很准,神经元网络后来遭受了几次危机,都是靠着数学上的突破才一一化解。而且数学上可以证明,神经元网络可以无限逼近任何连续函数,这是坚实的理论基础。 遗憾的是后来随着研究的深入,Minsky对神经元网络的态度越来越消极,1969年他提出神经元网络不能解决XOR异或问题。确实只有一层的神经元网络是无法解决XOR问题的,Minsky承认多层神经元网络或许能做更多,但是他(认为)找不到训练隐藏层的方法。 这导致神经元网络陷入第一次低谷。 直到1986年Hinton等人发明了BP算法,人们掌握了训练多层神经元网络的方法,多层神经元网络才重新回到人工智能舞台中央。 明斯基2016年才去世,他这一辈子是真正见证和影响了人工智能的潮起潮落。

1.jpg

Minsky

John McCarthy提出α-β搜索法,主要用于下棋的高效搜索问题。 如果我们把围棋简化为2*2的格子,那么第一步黑棋有4种可能的落子位置,第二步白棋有3种可能,第三步黑棋有2种可能,最后白棋只有一种可能。真实的围棋是19*19的格子,所以每一步落子都有19*19种可能(实际后面落子选择少于19*19),一盘棋的总落子大概有19*19步(实际棋局多在200步左右,小于19*19),也就是总的搜索空间为 (19*19)(19*19)。 我们把问题一般化,总的搜索空间为Bd,其中B(Branch)为每一次的搜索分支,而D(Depth)则为搜素树的深度。 也就是我们可以把总的搜索空间看成是一个树形结构, B和D分别是树的宽度和深度。搜素算法的核心就是通过一些规则来减少搜索树上的一些分支,也就是剪枝。所以α-β搜索法也叫做α-β剪枝算法。1997年IBM的深蓝打败世界象棋冠军卡斯帕罗夫,使用的主要就是α-β搜索法,当然当时使用了分布式计算,跑在30台IBM电脑上。

2.jpg

John McCarthy

Allen Newell和西蒙一起提出“逻辑理论家”Logic Theroist。这是一个推理程序,可以证明罗素《数学原理》的第二章的大部分定理。这个程序给所有与会人带来了深刻的印象。 但之前Newell曾给逻辑学最重要的刊物《符号逻辑杂志》投稿,被惨遭退稿,理由是“把一本过时的逻辑书中的定理用机器重新证明一遍没有价值”。

Newell和西蒙认为,现实世界中所存在的对象和过程,都是可以用符号来描述和解释。Newell现在被认为是符号主义学派的创始人。 符号主义认为,所有的知识都可以用符号(也就是规则)来表示,人类的认知过程,就是各种符号进行运算的过程(各种规则的组合推理),推理就是采用启发式知识及启发式搜索对问题求解的过程。符号主义在人工智能发展的大部分岁月里,一直占据着主导地位,决策树和专家系统是这个流派的力作。

3.jpg

Newell

1956年,Minsky,McCarthy和 Newell三个人都是28岁,都是年轻小伙子, 也没有什么名气。 所以当时 McCarthy把香农Shannon请去了参加这个会议,扯虎皮做大旗, 因为在1953年 Minsky和McCarthy都曾在贝尔实验室给香农打工。 当时香农已经40岁了,作为信息论的发明人, 他在科学史上的地位基本上跟图灵差不多。 香农在贝尔实验室的同事们把香农和爱因斯坦相提并论, 并认为“这样的比较是不公平的,对香农不公平!”。香农发明的信息熵函数,在决策树算法中扮演着关键角色。

4.jpg

香农

这次会议被认为是里程碑式的,是人工智能的历史起点,主要有两个原因。

第一,人工智能随后发展的20年,基本上被这些人,或者这些人在MIT、斯坦福、CMU等的同事、学生们主宰了。Minsky,McCarthy和 Newell三个人后来都获得了图灵奖。

第二, 这次会议提出的算法和思想,深刻的影响了随后人工智能几十年的发展。

人工智能历史的60年,普遍认为有两个主要的流派,一个是符号逻辑主义,就是Newell提出的思想,专家系统和知识工程就属于这个流派,在AI历史上长期占据主流地位。 另一个是联接主义, 神经元网络是其出色代表,历史上神经元网络三起三落,但自从2006年以来的这十年可以说是风头正盛,深度学习俨然成了人工智能的代名词。现在看,这两个流派的思想,在1956年的会议上就已经提出来了。α-β搜索法和其后续的变种,也深刻影响着搜索问题的求解。

现在我们站在2018年往回看, 当年的人工智能思想和现代人工智能思想,有一个本质的不同,就是缺少概率和统计学的引入。在AI发展之初,本质上还是由人类输入各种逻辑推理的思想并程序化,也就是机器的智能肯定小于人类程序员的智能。 但随着计算机、互联网和大数据的出现,我们现在有了超大数据集可用,算力也得到长足的发展,所以使用的方法也基本转变为基于概率和统计的方法。 贝叶斯概率图、蒙特卡洛搜索树,都是基于概率和统计的算法。 机器学习算法,本质上也是利用大量的数据来找到合适的规律并用公式表达。

用于图像识别的神经元网络更是如此, 只需要输入大量带有标记的图片,训练完毕的神经元网络即可以学习到识别是猫还是狗,识别的准确度甚至可以达到98%,超过人类识别率的95%。 这个过程并不需要人类编写程序规则说猫的特征是圆脸、圆眼睛、长有胡子、毛茸茸的等等,所有的特征是程序通过大量的训练样本自己学习得到的。所以我们说现在机器的智能在某些特定领域可以超过人类的智能。

在深度学习火爆的今天,也有很多学者指出其问题:

1)现在的训练方法需要大样本,跟人类的智力还有本质区别,人类基于少量的样本就可以得到答案。

2)过程无法解释,尽管训练好的模型可以识别猫和狗,但是你不知道为什么。而基于规则的符号主义模型,尽管准确度不如神经元网络模型,却是完全可以解释的。

3)没有常识,也就是没有知识工程。比如说猫可以飞吗? 猫是动物,猫没有翅膀,会飞的动物都有翅膀,所以猫不可以飞。 符号主义系统只需要把这几条规则(专家知识)串到一起就可以得到正确的答案。但是你却无法训练一个神经元网络得到这个结果。

4)不具备预测和规划能力。

这些声音显示着,尽管神经网络在工程界大行其道,学术界却在呼唤符号主义。就跟光的波动派和粒子派之争一样,历史总是螺旋式上升的,历史不会简单重复, 学术思想总是在不断的丰富和完善,而工程界有了超大规模数据、超强算力的支持, 我们大可期待人工智能科学的灿烂发展。

请持续关注“人工智能园地”

5.jpg

文章未完,点击这里查看全文(来自人工智能园地)