编码机

人物特写清华大学邓志东特征提取推

发布时间:2022/11/13 15:26:43   

引言:人类是可以进行推理的,只需要从小数据、小样本中学习,然后用特征+推理的方法就可以进行可靠的判别,这就是人类举一反三的能力。

邓志东

清华大学计算机系教授,博士生导师

年7月,北京,清华大学。

天气一如既往的热,仿佛要把你的五脏六腑烤干。

当然,跟气温一样火热的,还有当下的人工智能。

在办公室见到邓志东教授,也算是踩着点了。因为他刚刚从一个大会上回来,据说为了这次采访,教授特意要求把自己的发言顺序调到了第一个......

邓教授是一个非常直爽的人。整个采访过程,热情周到、快言快语、妙语连珠,完全没有一丝科学家的“标准”形象。不过,他头上的光环却绝对是标准的科学范儿:中国自动化学会智能自动化专业委员会主任、中国自动化学会智能制造专业委员会副主任、中国人工智能产业创新联盟专家委主任委员......

本文整体思路脉络:

▉人工智能:三起两落的传奇

1、感知机和它的致命缺陷

2、人工智能的第二次高潮和不切实际的幻想

3、现在,正是人工智能最好的时期

4、从弱人工智能到超人工智能,我们还有漫长的路要走

任何AI技术,只要达到或超过人的水平,它就具备商业价值

1、支撑无人超市的技术已趋成熟,但商业模式尚未明确

2、至少5大领域已经成熟,但落地之前需要极大的付出

人类基于“特征提取+推理”的小样本、小数据学习

1、下一次的技术突破或爆炸,应该具备哪些条件?

2、卷积神经网络的缺陷和解决方案

代码开源,反映出AI之下,核心商业思路和模式的全新变革

正文:

人工智能:三起两落的传奇

年,以麦卡锡、明斯基、香农和罗切斯特等为首的一批年轻科学家在一起聚会,共同研究和探讨用机器模拟智能的一系列有关问题,并首次提出了“人工智能”这一术语,由此标志着“人工智能”这门新兴学科的正式诞生。

感知机和它的致命缺陷

“之后的年,美国认知心理学家Rosenblatt等首次提出了一种称之为‘感知机’(Perceptron)的人工神经网络模型。主要是基于年由美国心理学家麦卡洛克和数理逻辑学家皮特斯提出的MP人工神经元模型进行构建的前馈网络,旨在发展出一种模拟生物系统感知外界信息的简化模型。‘感知机’主要用于分类任务,由此开创了神经网络的第一次热潮。

“不过当时的感知机是单层的,只有输出层没有隐含层。但单层的感知机,有一个先天性的致命缺陷:解决不了线性不可分的两类样本的分类问题。而要是加了隐层以后,却找不到相应的学习算法。”年明斯基等发表了书名为“感知机”的专著,指出了单层感知机的这一局限。

“当时大家都认为感知机没有什么前途。”

自此以后,由于明斯基在人工智能领域的权威性,人工智能遭遇了第一个低潮,这种低潮几乎贯穿了整个70年代。

人工智能的第二次高潮和不切实际的幻想

“到了80年代,美国认知心理学家Rumelhart等提出了BP网络,为带隐层的多层感知机找到了一种有效的学习算法,即误差的反向传播算法,也就是我们现在在卷积神经网络中使用的监督学习算法。其实就是使用Sigmoid函数与双曲正切函数对经典的MP人工神经元模型进行了改进,但正是这个看似很小的一个突破,却解决了感知机不能进行学习的致命缺陷。

“再加上年美国物理学家Hopfiled提出的反馈神经网络,于是乎,整个80年代,人工智能又一次迎来了高潮,跟现在真的很像,大家又都一窝蜂的开始搞神经网络。

“此外,当时很多人都在想,如果把人的专家级经验通过规则的形式总结出来,建立大规模规则库,然后将规则作为知识进行推理,不就可以解决很多问题了吗?这样的前景简直太美好了!它可以挑选出正确的分子结构,模拟老中医看病(例如研发中医诊疗专家系统),可以模拟专家找石油、找天然气、找矿石......,总之就是无所不能,可以完全替代人类从事许多工作。典型的代表就是斯坦福大学的费根鲍姆教授,曾因知识工程的倡导和专家系统的实践,获得年度图灵奖。”

但问题是:首先,规则很难被总结和归纳,因为人的规则通常是“只可意会不可言传”。

“就说车辆驾驶吧,开了几十万公里的老司机,是不是可以用专家系统来模拟他?用计算机来替代他?显然不可能。

“人类的驾驶行为,输入主要是双眼看到的图像序列,输出主要有三个模拟量:方向盘转角、油门踏板开度和刹车踏板进程,这是一个利用训练和学习获得的非线性映射。人在开车行驶过程中看到路况之后,本能就有三个模拟量的自然反应,而这种自然反应是首先通过驾校的监督学习,然后利用试错式的自我强化学习构建的。要想把其中的规则总结出来,例如对什么样的路况输入,就应该有什么样的输出,说起来容易,实际很难总结出来。而设计出来的规则可能无法真实地反映实际的非线性映射。”

人或机器的学习方法包括监督学习、强化学习和无监督学习。对人来说,在学校里叫监督学习,进入社会就是强化学习,即通过不断的试错,成功了有奖励、失败了受惩罚,其结果就是每进行一个决策,都是为了使结局成功的概率最大化,由此积累决策或选择的社会经验。

“当时,机器推理所依赖的规则都是人为设计的,但是刚才我们也分析到了,其实规则是很难被总结和设计的。人类感知智能中的‘规则’都是通过学习构建和精进的,不是人为设计的。因此这个阶段的人工智能,靠设计而非学习获得规则,前提就错了。”

其次,当时的人工智能并没有解决好数据层到语义层的所谓语义鸿沟问题。

比如我们利用动物的属性定义根据一系列条件去推断或识别大象。

“你看,教科书里大象是有定义的,可以用描述性的方法来表示。我们可以通过外形、体重、象腿、象牙、象鼻等特征描述,用推理的方法就知道这是一头大象,而不是别的东西。因为人是有这样的推理能力的,知道象腿是什么、象鼻是什么......,这种视觉感知或模式识别能力,对人而言,轻而易举,但对机器而言,如何进行这种‘部件级别’的分割、识别与理解,这在当时几乎是不可能的,实际也被人为地忽略。

“这样的事情,实际上机器做不了,它无法感知。它甚至都不知道你说的象牙是什么、象鼻是什么,又怎么可能知道这个是大象呢?

“它没有识别能力,符号主义的基于规则的知识工程悬浮在‘空中’,这是走不下去的。感知问题没解决,再加上规则本身是人工设计且无学习能力,这是两个致命缺陷。”

当时全世界都对人工智能的发展报以极高的憧憬,认为它可以在很多方面取代人类,也出现了许多疯狂的计划。例如当时经济繁荣的日本甚至搞了一个雄心勃勃的智能计算机国家计划,即所谓的第五代计算机计划,立志要研究出世界上最先进的模糊推理计算机,突破“冯·诺依曼瓶颈”,确立信息领域的“全球领导地位”。该计划虽历时10年,总耗资8亿多美元,但最终还是以失败而告终。

第二次人工智能热潮持续10余年,只是BP网络和Hopfield网络能力有限,利用规则作为知识进行的推理,却并没有感知智能的支撑,最终成为空中楼阁。因此,到年左右,人工智能又进入了一个寒冬。理想和现实的巨大差异,让人们认识到,当时的人工智能其实做不了多少事情的。

现在,正是人工智能最好的时期

“人工智能的第三次高潮,发端于年。

“深度学习的概念由加拿大多伦多大学的Hinton教授等人于年提出,主要包括深度卷积神经网络、深度信念网络和深度自动编码器。尤其是在年,Hinton教授与他的两位博士生在参加ImageNet比赛时,把深度卷积神经网络与大数据、GPU结合了起来。我觉得这是一种历史的巧合,但最主要的是时代的进步。我们有了移动互联网,有了云平台,每天都涌现出海量的大数据。同时也得益于摩尔定律的长期持续作用,尤其是视频游戏的超常发展,推动了GPU的快速进步。这三者的结合,似乎产生了一种化学反应。

“从年开始,每年都会举办一场全球范围内的机器视觉识别比赛,也就是上面所说的ImageNet比赛。ImageNet分类数据集包括了1,个物体类别,万张训练图片,5万张验证图片,10万张测试图片,每张图片上的物体都做了类别标签。之后用万图片去训练机器,结束以后让它去识别没有参加过训练的10万张测试图片,看它是否还可以识别出来。

“结果,机器不仅辨认出来了,而且比原来的传统计算机视觉方法准确率提高了10.9%!这么一个显著的性能提升和惊人的识别效果,一下子引起了产业界的极大

转载请注明:http://www.aideyishus.com/lkgx/2278.html

------分隔线----------------------------