×
真空科学与技术学报

《科学大家》专栏|评估机器的智商,认知智能

来源:新浪科技

出品:新浪科技《科学大家》、墨子沙龙

撰文:周熠 博士、上海脑科学与类脑研究中心类脑计算研究组研究员

近些年兴起了一些有趣的测试服务,其中就有智力测试。智力测试一度在年轻人和学生家长之间盛行,大家对于自己的智商能得多少分非常好奇,一度形成了非常典型的社会现象。目前市面上存在的智力测试一般通过受试者回答测试题中有关语言表达、理解能力、逻辑和记忆等方面的问题得出一个表征智力水平的分数。而这样一项对于人类来说可有可无的测试,对于人工智能来说却可能是一项十分有必要的衡量标准。

尽管科技迅猛发展的这几年,人工智能在快速学习,不仅可以驾驶计算,甚至可以从事写诗作画等艺术“创作”了。但毋庸置疑的是,测试机器的智商,也就是认知智能,与测试人类的智力水平大有不同。那么要想知道机器的智商几何,拢共分几步?了解人工智能的智商,又对技术进步有着什么样的意义?

评测机器认知智能

评测机器的认知智能,这个事情听上去很简单,但事实上相当困难。早在1950年, 人工智能的祖师爷图灵就提出了著名的图灵测试。简而言之,人类评委和事先不知道是机器还是人的对象交谈,如果人类评审不能够区别交谈的对象是机器还是人,那就认为这个机器具有人的智能。

但是,图灵测试值得商榷。2014年,有一个叫做Eugene Goostman的程序,号称通过了图灵测试,超过1/3的人类评委觉得它就是一个乌克兰的小孩,不是机器。但是,这在学术界引起广泛争议。这是因为某种意义上可以用一些欺骗的方法来做这个事情,比方说可以不回答问题,反过来问问题引导人类评审专家。例如,当面对较难的问题的时候, 可以回答“我不知道”,而反过来问人类评审一些相关的“闲话”。很多时候人类评审的问题可能就在这个过程中被马马虎虎地应付过去了,尤其在机器设定是一个非英语母语的小孩的时候。无论Eugene Goostman是否通过了图灵测试,这至少表明,以图灵测试作为评测机器的标准值得讨论,已经有科学家在这方面展开了很多深入的思考。

另外的一个候选者是智商测试,估计很多人都做过。用机器来做智商测试会怎么样?这是一个挺有意思的事情。自动智商测试没有想象的那么简单,对现在的人工智能技术提出了很大的挑战,既需要涵盖人工智能的诸多方向,也需要融合之前提到的各个流派,而且智商测试本身就有一定的通用性。因此,我们现在正在进行这方面的课题研究,也举办了相应的国际比赛,欢迎大家关注。当然,我们也不认为机器智商测试做得好,就一定代表机器比人强。但我们认为这一定能促进机器在认知智能领域的发展。

数学自动答题

很多人都有这样的感受:所有的学科里面,学的最吃力、最痛苦的莫过于数学。机器到底是不是可以解数学题,跟人比起来,能力到底如何?这也是个挺有意思的问题。我们在这方面也进行了一些尝试。

首先大家可以先思考一个问题:关于机器和机器之间的交流的问题。中国人和中国人之间用中文;英国人和英国人之间用英语,那机器和机器之间交流到底该用什么?机器语?对,就是机器语。这就是我们做的工作的出发点。我们定义了一套关于数学的机器语言。这样,机器和机器之间就可以通过这套语言实现所谓的交流和答题。

这个机器语言长得就像图中这个样子,主要是基于逻辑学的。细节不重要,重要的是机器确实是可以有一套机器语言的,可以通过这套语言相互交流,表示知识,学习知识,从而解决问题。上图中就是一个很简单的题目,等差数列求通项公式的问题。题目的自然语言对人来说可以轻易理解,但是对于机器而言就是一堆ASCII码,机器是不懂得这个题目讲的些什么的。因此,我们需要把自然语言的题目翻译成机器能理解的机器语言,也就是图片的中间部分。因为机器语言是事先定义的,所以机器能够懂这个语言。在把自然语言翻译成机器语言之后,机器就可以调用规则库来解数学题了。

跟人一样,机器解题也是通过一步一步调用定理。刚开始的时候,选取一条规则执行,提取结果之后会得到新的知识,新的事实,然后把它加到原来的事实库里面,又可以继续推。一步一步重复这样推演步骤,机器就能解答数学题。

上一篇:3月4日环球科学资讯
下一篇:没有了

Top