汕头市智能制造产业协会
加入收藏 | 设为首页

内容展示

首页 >

人类赢了!机器人做高考数学题刚及格,竟是因为偏科

2017-06-08

昨日(6月7日)18:28,当参加高考的同学终于和令人头疼的数学说“拜拜”的时候,“准星数学高考机器人”AI-MATHS正式开始挑战高考数学题。

这是继上个月阿尔法狗完胜柯洁后,人工智能机器人再一次和人类PK。不过,出人意料的是,这次机器人并没能碾压人类,两套数学考题分别得到105分和100分,在满分150分的情况下,只能算及格,距离学霸更是相去甚远。

在这次考试中机器人暴露出偏科的问题,看来要战胜机器人不只拔电源这一招了。

高考机器人已有500套试题的积累

与多数人对机器人的印象不同,“准星数学高考机器人”的“身体”并非模仿人类的样子,而是10余台服务器,其“大脑”就是服务器上承载的人工智能系统。

▲高考机器人服务器(图片来源:微信号“成都高新”)

同时,据介绍,高考机器人是通过综合逻辑推理平台来解题,而非学习储存题库。

许多人都误以为,机器人的数据库一定装下了成千上万套的数学试卷题,届时只需要快速地进行试题比对、作答就可以了。其实,机器人本身并没有可用作比对的题库。它主要靠系统学习知识点,形成逻辑推理能力后进行自主解题。

北京日报报道称,目前,高考机器人已经练习了1.2万道题。为训练答题速度,团队加大了题量,目前高考机器人已有500套试题的积累。不得不承认,人工智能在运算、推理、存贮等方面都具备超强的能力,高考机器人可以学习小学到高中的7000多个考点,运算量可达2的800次方。

机器人开考前,所有设备断网断库。断网断库意味着,模仿考生封闭环境的闭卷考试;测试复杂逻辑推理能力与联想能力;断绝一切可能的外界支持,包括专家系统库。

机器人成绩不及人类

6月7日18:28,高考机器人开答北京文科数学卷,一行行数据迅速出现在大屏幕上,22分钟后完成试卷。19:19,机器人开始作答数学全国卷二,19:29完成试卷。

最终,机器人分别得105分和100分。现场阅卷老师表示,“相当于中等水平。”

▲“高考机器人”成绩(图片来源:成都商报)

机器人只考了这个分数?网友吐槽称,虽然没有机器人做得快,但好歹成绩比他好。

每经小编注意到,这样的成绩可能也和研发团队的预期有一定的差距。根据北京日报报道,去年5月,研发团队宣布机器人将参加2017年高考,并预计在2017年数学科目的高考中达到重点本科的录取水平。当时,高考机器人在模拟考中取得过115分的成绩。

而昨天的考试也不是机器人第一次输给人类。早在今年2月23日,成都石室天府中学就曾上演一场“人机大战”,高考机器人首次对战真人——43名高三文科班学生,最终以93分败给了学生们106分的平均分,相对于150分的满分,93分刚过及格线。好在这一成绩超过2016年四川高考文科数学的平均分,通过了中期评测。

机器人也偏科

那么,为何机器人考试比不过人类呢?成都准星云学科技有限公司CEO、清华大学苏州研究院大数据中心主任林辉表示,高考机器人数学题没有做好,是语文没有学好。“规范化的数学语言,解题没有问题。自然语言复杂的题目就很难。”

▲图片来源:成都发布

简单的说就是,机器人的弱项在于——读不懂题。直接用数学语言表述的应用题它可以轻松解答,但它不能理解考题里场景式的描述语言。

举个例子:

如果题目是10-1=?

人工智能系统可以轻松作答。

如果题目用了场景描写将其表述为“小明有10个苹果,小丽吃了一个,请问还有几个苹果?”

同样的问题,不同的表述,面对这样的情况,人工智能系统就“傻”了,它不理解小明是什么、小丽是什么、吃又是什么意思。

因此,让机器人理解人类语言的复杂关系,成为机器人参加考试必须克服的一大难题。

机器人计划考上北大清华

和中国科研人员一样,日本科研人员也遇到了同样的问题。

2016年秋季日本研究人员宣布,放弃让人工智能系统Torobo-kun参加东京大学入学考试的计划。研究者解释道:“人工智能系统无法理解必要的信息,阅读和理解句子含义的能力存在局限。我们发现,现在还没有办法使这一系统获得足够的分数,使它通过东京大学的入学考试。”

Torobo-kun在每个科目的阅读理解测试中就表现得十分糟糕。例如,当它尝试回答一个世界历史问题:“谁是曹丕的父亲?谁成为了中国三国时代魏国的第一位皇帝?”时,Torobo-kun无法给出正确的答案。尽管Torobo-kun已经知道曹丕是曹操的儿子,但它无法想到曹操就是曹丕的父亲,因为它不理解父子关系。

科研人员表示,研发围棋机器人,用计算机语言描述围棋规则相对容易,难在要让系统在极短时间内算出每次落子后的几十步甚至几百步的不同局面。而研发高考机器人最大的难点在于,首先要让系统准确理解人类语言,后面做题的步骤反而不多。人类的语言千变万化,而且还在不断创新,几乎是学不完的。遇到没学过的生词,人类会联系上下文去推测词义,猜对是比较容易的事;而机器人却会卡壳。

▲柯洁完败阿尔法狗(图片来源:微博“Google黑板报”)

每经小编了解到,根据“超脑计划”,我国的“高考机器人”计划在2020年考上北大、清华,而日本也提出在2020年,“高考机器人”考上东京大学。

昨日(6月7日)18:28,当参加高考的同学终于和令人头疼的数学说“拜拜”的时候,“准星数学高考机器人”AI-MATHS正式开始挑战高考数学题。

这是继上个月阿尔法狗完胜柯洁后,人工智能机器人再一次和人类PK。不过,出人意料的是,这次机器人并没能碾压人类,两套数学考题分别得到105分和100分,在满分150分的情况下,只能算及格,距离学霸更是相去甚远。

在这次考试中机器人暴露出偏科的问题,看来要战胜机器人不只拔电源这一招了。

高考机器人已有500套试题的积累

与多数人对机器人的印象不同,“准星数学高考机器人”的“身体”并非模仿人类的样子,而是10余台服务器,其“大脑”就是服务器上承载的人工智能系统。

▲高考机器人服务器(图片来源:微信号“成都高新”)

同时,据介绍,高考机器人是通过综合逻辑推理平台来解题,而非学习储存题库。

许多人都误以为,机器人的数据库一定装下了成千上万套的数学试卷题,届时只需要快速地进行试题比对、作答就可以了。其实,机器人本身并没有可用作比对的题库。它主要靠系统学习知识点,形成逻辑推理能力后进行自主解题。

北京日报报道称,目前,高考机器人已经练习了1.2万道题。为训练答题速度,团队加大了题量,目前高考机器人已有500套试题的积累。不得不承认,人工智能在运算、推理、存贮等方面都具备超强的能力,高考机器人可以学习小学到高中的7000多个考点,运算量可达2的800次方。

机器人开考前,所有设备断网断库。断网断库意味着,模仿考生封闭环境的闭卷考试;测试复杂逻辑推理能力与联想能力;断绝一切可能的外界支持,包括专家系统库。

机器人成绩不及人类

6月7日18:28,高考机器人开答北京文科数学卷,一行行数据迅速出现在大屏幕上,22分钟后完成试卷。19:19,机器人开始作答数学全国卷二,19:29完成试卷。

最终,机器人分别得105分和100分。现场阅卷老师表示,“相当于中等水平。”

▲“高考机器人”成绩(图片来源:成都商报)

机器人只考了这个分数?网友吐槽称,虽然没有机器人做得快,但好歹成绩比他好。

每经小编注意到,这样的成绩可能也和研发团队的预期有一定的差距。根据北京日报报道,去年5月,研发团队宣布机器人将参加2017年高考,并预计在2017年数学科目的高考中达到重点本科的录取水平。当时,高考机器人在模拟考中取得过115分的成绩。

而昨天的考试也不是机器人第一次输给人类。早在今年2月23日,成都石室天府中学就曾上演一场“人机大战”,高考机器人首次对战真人——43名高三文科班学生,最终以93分败给了学生们106分的平均分,相对于150分的满分,93分刚过及格线。好在这一成绩超过2016年四川高考文科数学的平均分,通过了中期评测。

机器人也偏科

那么,为何机器人考试比不过人类呢?成都准星云学科技有限公司CEO、清华大学苏州研究院大数据中心主任林辉表示,高考机器人数学题没有做好,是语文没有学好。“规范化的数学语言,解题没有问题。自然语言复杂的题目就很难。”

▲图片来源:成都发布

简单的说就是,机器人的弱项在于——读不懂题。直接用数学语言表述的应用题它可以轻松解答,但它不能理解考题里场景式的描述语言。

举个例子:

如果题目是10-1=?

人工智能系统可以轻松作答。

如果题目用了场景描写将其表述为“小明有10个苹果,小丽吃了一个,请问还有几个苹果?”

同样的问题,不同的表述,面对这样的情况,人工智能系统就“傻”了,它不理解小明是什么、小丽是什么、吃又是什么意思。

因此,让机器人理解人类语言的复杂关系,成为机器人参加考试必须克服的一大难题。

机器人计划考上北大清华

和中国科研人员一样,日本科研人员也遇到了同样的问题。

2016年秋季日本研究人员宣布,放弃让人工智能系统Torobo-kun参加东京大学入学考试的计划。研究者解释道:“人工智能系统无法理解必要的信息,阅读和理解句子含义的能力存在局限。我们发现,现在还没有办法使这一系统获得足够的分数,使它通过东京大学的入学考试。”

Torobo-kun在每个科目的阅读理解测试中就表现得十分糟糕。例如,当它尝试回答一个世界历史问题:“谁是曹丕的父亲?谁成为了中国三国时代魏国的第一位皇帝?”时,Torobo-kun无法给出正确的答案。尽管Torobo-kun已经知道曹丕是曹操的儿子,但它无法想到曹操就是曹丕的父亲,因为它不理解父子关系。

科研人员表示,研发围棋机器人,用计算机语言描述围棋规则相对容易,难在要让系统在极短时间内算出每次落子后的几十步甚至几百步的不同局面。而研发高考机器人最大的难点在于,首先要让系统准确理解人类语言,后面做题的步骤反而不多。人类的语言千变万化,而且还在不断创新,几乎是学不完的。遇到没学过的生词,人类会联系上下文去推测词义,猜对是比较容易的事;而机器人却会卡壳。

▲柯洁完败阿尔法狗(图片来源:微博“Google黑板报”)

每经小编了解到,根据“超脑计划”,我国的“高考机器人”计划在2020年考上北大、清华,而日本也提出在2020年,“高考机器人”考上东京大学。