汕头市智能制造产业协会
加入收藏 | 设为首页

内容展示

首页 >

拥抱人工智能2.0新时代

2017-07-21


人工智能在经历了60年的发展之后,终于从婴儿发育成幼儿,开始显现出自身远大的发展前景。尤其是Watson和AlphaGo的出现,使得业内人士大喜过望。人类不仅解放了肉体,可以不必身临其境地去从事繁重、危险的体力劳动,而且还初步解放了思维,可以用机器来替代人们进行简单的脑力劳动。而且,按照这样的趋势发展下去,人工智能迟早能够取代人类,能够独立完成人类所能做的任何事情,甚至会超过最优秀的人类。为此,各国纷纷出台相关政策,抢抓人工智能时代的主导权。



一、人工智能1.0已基本成熟



之所以说人工智能已经从婴儿时期进入到幼儿时期,主要是由于人工智能已经从对世界的观察和理解时期开始蹒跚学步,逐步向自己周围的环境进行探索,并参与其中。这主要表现在以下几个方面。

1、棋类游戏全面战胜人类对手

从计算量较小的国际跳棋到计算量最大的围棋,人工智能在棋类游戏领域已经全面战胜了人类的对手。第一台能同人下棋(国际跳棋)的计算机出现在1958年,名为“思考”,机型是IBM704,计算能力是200步/秒,而从1994年起国际跳棋程序切努克(Chinook)就从未被人类击败过。在国际象棋方面,国际象棋软件4.0于1973年问世之后就快速成长起来, IBM的“超级深蓝” 1997年以3比2击败了卡斯帕罗夫,“深弗里茨”于2002年10月与克拉姆尼克4比4战平。在围棋方面,日本电脑围棋软件“ZEN”于2012年3月在受五子和受四子情况下均击败武宫正树九段,谷歌的AlphaGo 先是在2015年10月以5:0战胜欧洲围棋冠军、职业二段樊麾,然后又在2016年3月开始的比赛中以4:1战胜了多次取得世界冠军的韩国棋手李世石,在2017年初又在中日网络棋坛上横扫除了世界排名第一的柯杰之外所有几乎所有顶尖棋手,取得60连胜的战绩。

从如图1所示的棋类人机大战历史进程中我们可以看出,从跳棋到象棋再到围棋,计算量越来越大,计算难度也越来越大,连被认为是一对一智力较量的最高等级游戏、人类的最后堡垒、计算难度最大棋类——围棋也不能阻止人工智能前进的步伐,不能不让人们对人工智能刮目相看。

 图1 人机大战历史进程

2、识别与理解能力开始显著提升

在语音识别与理解领域,IBM在1950年代末就开始了语音识别研究工作,并在1962年西雅图世界博览会上展出了被称作“鞋盒”语音识别机器,1992年研制成功世界上第一套听写系统ISSS,1997年推出了ViaVoice。目前,自然语言识别与理解技术已经超过人类,并开始在语音输入、自动化客服等相关领域商用,并开始向同声传译进军。不仅如此,牛津大学2016年11月发表的论文显示,其研发出的人工智能系统LipNet能够将视频中人物的嘴巴活动与其台词进行匹配,准确率高达93.4%,而即使是最专业的唇语解读者,其准确率也只有20%-60%。在图像识别与理解方面,目前机器图像分类的错误率仅为3.0%,而人眼的辨识错误率约在5.1%左右,并能够根据图像写出其所表达的含义。除了我们常见的二维码应用和OCR(光学文字识别)已经获得广泛商用之外,图像识别与理解技术在自动驾驶、智慧医疗等领域的能力表现也显著超过了人类顶级专家。再有,如果说棋类游戏是属于信息对称的游戏,理解起来相对简单的话,那么人工智能在信息不对称的游戏中也渐渐占据上风。今年年初,卡内基梅隆大学研发的人工智能系统Libratus就在长达20天的鏖战中,打败了4名世界顶级德州扑克玩家,最终赢得了德州扑克大赛,这标志着人工智能已经不再仅仅是暴力计算的代名词,而是有了对不完整信息的理解能力以及据此作出最佳策略的能力。

3、基于深度学习的各类应用已陆续展开

目前,基于深度学习的各类应用已经取得了较好的应用效果,并且正在推动人类社会从信息化时代向智能化时代转变。在云计算、大数据以及深度学习的推动下,人工智能技术已经开始改变网络空间中业务模式。搜索引擎机器人能够根据用户画像为用户推荐满意的搜索结果和广告,写作机器人能够自动撰写新闻甚至科研论文,传媒监管机器人还能够自动识别黄色和政治敏感的图像与视频。我们还记得,就在2016年3月25日 不到一天的时间,推特(Twitter)上的微软人工智能机器人Tay就被人类“教坏”,成为一个脏话连篇的种族主义者,虽然微软不得不将其立即下线,但人工智能强大的学习能力已经表露无遗。尤其是IBM基于前期60多年的持续技术积累,已经将其技术精髓集中体现在Watson之中,并从近几年开始陆续将其所取得的成果在十几个行业进行商用,从最初的信息产业延伸至医疗、环保、投资、保险、并购、法律、时尚等,为相关用户提供较为完善的解决方案,期望引领整个社会全面迈入认知商业新时代。此外,牛津大学正在考虑将Libratus技术应用在商业谈判、军事战略和大型银行使用的高频交易系统等各个领域,日本已经开始将情绪识别与理解用于检测网民的自杀倾向。基于上述原因,我们完全有利于判定,人工智能将会改变人类生活的方方面面。

4、人工智能尚未出现本质性突破

人工智能的发展已经经历了三次大的浪潮,如图2所示。现在人工智能在深度学习的推动下,迎来了新一轮的发展浪潮中。但是,本次浪潮仍然还是由于互联网、云计算、大数据等发展所带来的红利,无论是从技术上还是从应用上来看,人工智能仍然处于处级发展阶段,没有出现本质性的突破。

图2 人工智能发展浪潮

首先,随着应用的不断深入,目前基于深度学习的人工智能已经开始逐渐显现出诸多弱点。深度学习是基于统计学的方法,并不能保证随着层数的增多和训练数据集的增大而获得更高的精度。深度学习所学习到的内容是数据集的特征,而不是用户所关心的知识。深度学习还存在黑箱问题,用户根本就不知道深度学习分析的结果所为何来。深度学习是基于大数据的智能,无法解决小数据问题。深度学习限于其数据集的问题,还只能用于某个特定领域之内,无法解决常识性知识问题,因而也不具备通用智能。


二、向人工智能2.0迈进



按照潘云鹤院士《人工智能迈向2.0》一文中给出的定义,人工智能2.0是基于中的变化的信息新环境和发展新目标的新一代人工智能,所涉及的技术包括大数据智能、跨媒体智能、自主智能、人机混合增强智能和群体智能等。

1、大数据智能

基于大数据的深度学习通过与增强学习的结合,利用增强学习过程中积累的知识,不断优化和提升自身的理解水平,实现了大数据驱动的知识学习,促进了大数据智能的产生,使得原本依赖于暴力计算的深度学习焕发了活力,具备了单一任务中的分析、推理和决策能力,并将在一定程度上解决深度学习的黑箱问题。实际上,AlphaGo通过其“估值网络”和“快速落子”两大法宝,已经发展出了“直觉感知”和“推理”的能力,初步具备了大数据智能。

2、跨媒体智能

人类可以通过视觉、听觉、嗅觉、味觉、触觉等以及其他知识进行综合感知,形成对周围世界的全面认识,这也是人工智能所希望达到的目标之一。跨媒体智能技术就是要让人工智能能够综合理解文本、图像、语音、视频、地理信息或其他类型数据及其相关属性。通过跨媒体计算,人工智能可以打破单一数据的局限性,随时多维度感知周围世界的几乎所有信息,实现跨媒体语义贯通,为人工智能的智能行为奠定基础。跨媒体智能除了可以与情感计算结合用于实现高仿真情感机器人之外,还可以使人工智能发展出联想、设计、概括、创造等能力。

3、通用智能

目前的人工智能饱受质疑的一个主要方面就是单个系统只能解决单一的问题,而且即使是在某一专门领域能够轻松战胜人类的人工智能系统,也难以应对其他领域的简单问题,甚至根本不能解决常识性问题。为解决这一难题,人工智能必须学会在没有先验知识的情况下,主动寻找知识关联,扩充自身知识图谱,实现举一反三的能力。实际上,人工智能在具备了跨媒体智能之后,完全可以通过跨媒体数据学习获得一定的通用智能,从而打开通往通用智能之门。2017年3月底,百度IDL研究院徐伟等就提出了一个新的通用智能架构,能够使得智能体通过多任务强化学习和零数据的情况下,结合语言和视觉两种信号在迷宫中导航并定位物体。

4、自主智能

人工智能饱受质疑的另一个方面是缺乏自主学习的能力。比如,在无人车间、无人工厂、太空、极地等控制人员不在现场或不便于在现场的情况下,无人机、无人车、无人船、服务机器人、空天机器人、极地机器人等各类智能设备需要其在遇到新的问题时,具备像人类一样的思考和处置能力,甚至可以应对自身所处的未知环境和问题,在全新环境进行自主决策。经过科学家门的不懈努力,目前自主智能领域已经取得了一定成绩。一方面,基于跨媒体智能与SLAM(simultaneous localization and mapping,即时定位与地图构建)技术结合的全自主移动机器人已经开始出现初级原型系统;另一方面,DeepMind已经开发出了一种算法,允许Deepmind系统的神经网络自主学习并再次使用所保留的信息,甚至开始向机器自主编程方向迈进。

5、混合增强智能

除了让机器具备人类智能之外,人工智能的另一个研究方向是混合增强智能,包括各种各穿戴设备、智能驾驶系统、外骨骼设备、人机协同手术系统等,它们都是以人类为本身为基础的,利用人类的意识进行机械系统的操作,实现人机协同。这类人工智能系统由于有人类的直接参与,获得了社会上较高的认可。如霍金所用的座椅就可以让毫无语言能力和肢体活动能力的霍金进行现场演讲;另外,一些通过脑电等操作的机械手臂等也已经开始帮助残障人士实现自主活动。由于混合增强智能使得人类能够利用自身意识,通过机械化延伸与扩展,来实现人脑主导的体力、感知力和智力等各方面增强与拓展,更加易于为人类所接受,并带来直接的益处,因此在近期可望取得明显的市场发展。目前,市场上已经出现了一定数量的混合增强智能系统,但还存在成本居高不下,难以普及等问题,尚需要从混合增强计算架构的理论与工程实践上继续加以深入研究。

6、群体智能

群体智能主要是来自于对自然界的研究中所受到的启发。人们发现,在自然界中,单个的小鱼、小鸟、蜜蜂、蚂蚁等并不具备有多大智能,但是当它们动态统一成一个群体时,所表现出的能力往往会超越所有个体能力之和。群体智能中所需要解决的问题包括群体成员之间的主动感知与发现、群体知识的获取与生成、群体成员间的协同与知识共享、群体智能的评估与演化、群体成员的自我维持与相互之间的安全交互等。目前已经有一些群体智能的应用出现。Unanimous所开发的Swarm AI平台在第89届奥斯卡大奖名单的预测中,准确率达到了75%。另外还有一些人工智能系统,分别在体育赛事、股市预测等方面,表现出了超过人类顶级专家的能力。

7、类脑智能

类脑智能已经开始显现出深度学习无可比拟的优势。类脑智能借鉴大脑中“内存与计算单元合一”等结构和信息处理方法的特点,在硬件实现与软件算法等多个层面,对于现有的计算体系与系统做出本质的变革,从计算能耗、计算能力与计算效率等诸多方面都有了大幅度的提升,已经成为一个明显的发展趋势。而且,人类对人脑的认识才刚刚开始,随着神经科学、脑科学、认知科学、生物科学、材料科学的不断发展和通信技术的不断进步,类脑智能必将会在不远的将来取得飞跃式发展。类脑芯片开始出现。高效能可重构类脑计算芯片。存储和计算微模块化组合,缩小了相互之间的瓶颈。


三、关于我国发展人工智能的建议



我国政府非常重视人工智能的发展,已经在人工智能领域取得了一定的成绩,并且在近两年又先后出台了多项促进政策,包括《国务院关于积极推进“互联网+”行动的指导意见》(国发[2015]40号)、《中国制造2025》(国发[2015]28号)、《国家高新区互联网跨界融合创新中关村示范工程(2015-2020年)》(国科火字[2015]50号)、《“互联网+”人工智能三年行动实施方案》(发改高技[2016]1078号)等。另外, 2017年《政府工作报告》中也首次提出要加快培育壮大包括人工智能在内的新兴产业,《人工智能2.0规划》已经接近研究完成,并纳入到“科技创新2030—重大项目”之中。但是从全球来看,我国人工智能发展与发达国家还有一定的差距。为抓住机遇,必须要把握好弯道超车的窗口期,在努力缩小人工智能1.0技术与产业发展差距的同时,积极抢占人工智能2.0发展先机。

1、抓紧制订国家级发展战略

人工智能已经开始并将继续深刻改变人类的生产生活方式,并成推动全球新一轮科技革命和产业变革的新动力和新引擎。未来5到10年,从这一革命性力量将会在各个领域中从蓄势待发、崭露头角进入到群体迸发的关键时期。有鉴于此,世界上发达国家和地区纷纷将人工智能做为提升国家竞争力的重要战略取向和重要抓手,加快人工智能技术创新与战略布局,力图占领产业发展新的制高点。尤其是美国,从2016年9月以来,先后发布了《关于人工智能未来的调研应答》、《人工智能报告:AI的应用究竟对人类社会经济有哪些影响 》、《为人工智能的未来做准备》、《人工智能研究开发战略规划》、《人工智能、自动化、经济》等多份国家级战略性文件。为抢占人工智能发展先机,实现从跟跑、并跑到领跑的转变,我国必须要抓紧制定国家级人工智能发展战略,集中理论研究、技术与产品研发、产业发展等各环节优势力量,打造自主可控、国际一流的人工智能产业,同时积极研究人工智能对人类社会所产生的正面、负面影响,从法律法规、伦理道德等各方面为迎接人工智能2.0和人机协同新的文明时代做好准备。

2、强化人工智能发展顶层设计

我国已经在人工智能领域取得了较好的成绩。早在上世纪70年代后期,吴文俊就凭借“吴方法”成为国际自动推理界的领军人物。科大讯飞语音识别技术已经处于国际领先地位,其语音识别和理解的准确率均达到了世界第一。在图像识别和视频识别方面顶级赛事之一的ImageNet竞赛中,以海康威视为代表的中国团队包揽其2016年所有项目的冠军。但是从整个国际发展来看,还只是处于单点突破阶段,与发达国家还有一定的距离。要想实现全面开花,还亟需进一步加强顶层设计,研制适合我国国情的人工智能发展路线图,发挥长处,补齐短板,在芯片、操作系统与平台等基础领域和自动驾驶、无人机、智能机器人等产品领域重点布局,编制人工智能产品政府采购目录,并通过试点、示范、推广等方式持续深入推进人工智能1.0应用创新,打造基础坚实、产品丰富、应用广泛、安全可信的人工智能产业体系;在重大项目和重大工程中进行前瞻性布局,重点研究人工智能2.0核心算法和新型计算架构,突破大数据智能、跨媒体智能、通用智能、自主智能、混合增强智能、群体智能、类脑智能等关键共性技术。

3、完善人工智能发展创新和服务体系

创新体系和服务体系在产业发展过程中起着极其重要的作用。在人工智能这一全新领域之中,尤其需要构建完善的创新和服务体系。一是要自上而下地建设或整合国家、省地各级创新中心、重点实验室、工程实验室等创新平台,建立政府部门、科研机构、企业之间和产业链上下游环节之间信息沟通的长效机制,促进创新成果产业化,打造创新活跃、技术领先、成果丰硕的创新体系。二是要充分发挥学会、协会、联盟、论坛、孵化器等行业组织和平台作用,开展技术竞赛、认证评测等,打造政产联动、立体协同、专业规范、贴心及时的服务体系。三是要加强人工智能标准化服务供给,研制基础共性、互联互通、行业应用、网络安全、隐私保护等技术标准,建设满足需求、基本完善、引领发展、国际先进的人工智能领域融合标准体系。四是要强化各相关主体机构的知识产权意识,推动人工智能领域专利布局、合作和风险防控,构建开放共赢、协同合作、攻防兼备的专利和知识产权体系。五是要加强人工智能学科建设,既注重国际交流和人才引进,又注重大中专院校、科研院所与社会化教育机构相辅相成的本地人才培养,既培养基础扎实、理论先进的研究人员,也培训操作熟练、技术精湛的数据标注员、机器人维修员等新型就业人员,打造梯度合理、数量充足、质量精良的人才体系。

4、重视相关技术与产业协同发展

人工智能作为一种通用型技术,在自身发展的同时也推动着其他技术和产业的发展,而其他相关技术和产业的发展反过来又加速了人工智能的进步。下一代互联网、5G、量子通信为人工智能提供了新的通信方式,保证了人工智能数据的传送速度和质量;生物学与生物脑的进步将逐步揭开神经科学和脑科学的奥秘,加快类脑智能的发展速度;脑机交互与融合使得人工智能能够在人类的直接控制下发挥作用,为人工智能发展创造了更为广泛的发展空间;新材料为人工智能提供更加精准感知、灵敏控制;新型芯片和原子级存储实现超高密度数据存储,使得人工智能系统可以更加高效节能,更加接近于生命体的智能。因此,在积极利用人工智能推动这些技术和产业快速发展的同时,也要重视利用这些技术和产业发展的成果,积极为人工智能2.0的发展奠定扎实的发展基础,这样才能保证人工智能产业的健康、稳定、可持续发展。


人工智能在经历了60年的发展之后,终于从婴儿发育成幼儿,开始显现出自身远大的发展前景。尤其是Watson和AlphaGo的出现,使得业内人士大喜过望。人类不仅解放了肉体,可以不必身临其境地去从事繁重、危险的体力劳动,而且还初步解放了思维,可以用机器来替代人们进行简单的脑力劳动。而且,按照这样的趋势发展下去,人工智能迟早能够取代人类,能够独立完成人类所能做的任何事情,甚至会超过最优秀的人类。为此,各国纷纷出台相关政策,抢抓人工智能时代的主导权。



一、人工智能1.0已基本成熟



之所以说人工智能已经从婴儿时期进入到幼儿时期,主要是由于人工智能已经从对世界的观察和理解时期开始蹒跚学步,逐步向自己周围的环境进行探索,并参与其中。这主要表现在以下几个方面。

1、棋类游戏全面战胜人类对手

从计算量较小的国际跳棋到计算量最大的围棋,人工智能在棋类游戏领域已经全面战胜了人类的对手。第一台能同人下棋(国际跳棋)的计算机出现在1958年,名为“思考”,机型是IBM704,计算能力是200步/秒,而从1994年起国际跳棋程序切努克(Chinook)就从未被人类击败过。在国际象棋方面,国际象棋软件4.0于1973年问世之后就快速成长起来, IBM的“超级深蓝” 1997年以3比2击败了卡斯帕罗夫,“深弗里茨”于2002年10月与克拉姆尼克4比4战平。在围棋方面,日本电脑围棋软件“ZEN”于2012年3月在受五子和受四子情况下均击败武宫正树九段,谷歌的AlphaGo 先是在2015年10月以5:0战胜欧洲围棋冠军、职业二段樊麾,然后又在2016年3月开始的比赛中以4:1战胜了多次取得世界冠军的韩国棋手李世石,在2017年初又在中日网络棋坛上横扫除了世界排名第一的柯杰之外所有几乎所有顶尖棋手,取得60连胜的战绩。

从如图1所示的棋类人机大战历史进程中我们可以看出,从跳棋到象棋再到围棋,计算量越来越大,计算难度也越来越大,连被认为是一对一智力较量的最高等级游戏、人类的最后堡垒、计算难度最大棋类——围棋也不能阻止人工智能前进的步伐,不能不让人们对人工智能刮目相看。

 图1 人机大战历史进程

2、识别与理解能力开始显著提升

在语音识别与理解领域,IBM在1950年代末就开始了语音识别研究工作,并在1962年西雅图世界博览会上展出了被称作“鞋盒”语音识别机器,1992年研制成功世界上第一套听写系统ISSS,1997年推出了ViaVoice。目前,自然语言识别与理解技术已经超过人类,并开始在语音输入、自动化客服等相关领域商用,并开始向同声传译进军。不仅如此,牛津大学2016年11月发表的论文显示,其研发出的人工智能系统LipNet能够将视频中人物的嘴巴活动与其台词进行匹配,准确率高达93.4%,而即使是最专业的唇语解读者,其准确率也只有20%-60%。在图像识别与理解方面,目前机器图像分类的错误率仅为3.0%,而人眼的辨识错误率约在5.1%左右,并能够根据图像写出其所表达的含义。除了我们常见的二维码应用和OCR(光学文字识别)已经获得广泛商用之外,图像识别与理解技术在自动驾驶、智慧医疗等领域的能力表现也显著超过了人类顶级专家。再有,如果说棋类游戏是属于信息对称的游戏,理解起来相对简单的话,那么人工智能在信息不对称的游戏中也渐渐占据上风。今年年初,卡内基梅隆大学研发的人工智能系统Libratus就在长达20天的鏖战中,打败了4名世界顶级德州扑克玩家,最终赢得了德州扑克大赛,这标志着人工智能已经不再仅仅是暴力计算的代名词,而是有了对不完整信息的理解能力以及据此作出最佳策略的能力。

3、基于深度学习的各类应用已陆续展开

目前,基于深度学习的各类应用已经取得了较好的应用效果,并且正在推动人类社会从信息化时代向智能化时代转变。在云计算、大数据以及深度学习的推动下,人工智能技术已经开始改变网络空间中业务模式。搜索引擎机器人能够根据用户画像为用户推荐满意的搜索结果和广告,写作机器人能够自动撰写新闻甚至科研论文,传媒监管机器人还能够自动识别黄色和政治敏感的图像与视频。我们还记得,就在2016年3月25日 不到一天的时间,推特(Twitter)上的微软人工智能机器人Tay就被人类“教坏”,成为一个脏话连篇的种族主义者,虽然微软不得不将其立即下线,但人工智能强大的学习能力已经表露无遗。尤其是IBM基于前期60多年的持续技术积累,已经将其技术精髓集中体现在Watson之中,并从近几年开始陆续将其所取得的成果在十几个行业进行商用,从最初的信息产业延伸至医疗、环保、投资、保险、并购、法律、时尚等,为相关用户提供较为完善的解决方案,期望引领整个社会全面迈入认知商业新时代。此外,牛津大学正在考虑将Libratus技术应用在商业谈判、军事战略和大型银行使用的高频交易系统等各个领域,日本已经开始将情绪识别与理解用于检测网民的自杀倾向。基于上述原因,我们完全有利于判定,人工智能将会改变人类生活的方方面面。

4、人工智能尚未出现本质性突破

人工智能的发展已经经历了三次大的浪潮,如图2所示。现在人工智能在深度学习的推动下,迎来了新一轮的发展浪潮中。但是,本次浪潮仍然还是由于互联网、云计算、大数据等发展所带来的红利,无论是从技术上还是从应用上来看,人工智能仍然处于处级发展阶段,没有出现本质性的突破。

图2 人工智能发展浪潮

首先,随着应用的不断深入,目前基于深度学习的人工智能已经开始逐渐显现出诸多弱点。深度学习是基于统计学的方法,并不能保证随着层数的增多和训练数据集的增大而获得更高的精度。深度学习所学习到的内容是数据集的特征,而不是用户所关心的知识。深度学习还存在黑箱问题,用户根本就不知道深度学习分析的结果所为何来。深度学习是基于大数据的智能,无法解决小数据问题。深度学习限于其数据集的问题,还只能用于某个特定领域之内,无法解决常识性知识问题,因而也不具备通用智能。


二、向人工智能2.0迈进



按照潘云鹤院士《人工智能迈向2.0》一文中给出的定义,人工智能2.0是基于中的变化的信息新环境和发展新目标的新一代人工智能,所涉及的技术包括大数据智能、跨媒体智能、自主智能、人机混合增强智能和群体智能等。

1、大数据智能

基于大数据的深度学习通过与增强学习的结合,利用增强学习过程中积累的知识,不断优化和提升自身的理解水平,实现了大数据驱动的知识学习,促进了大数据智能的产生,使得原本依赖于暴力计算的深度学习焕发了活力,具备了单一任务中的分析、推理和决策能力,并将在一定程度上解决深度学习的黑箱问题。实际上,AlphaGo通过其“估值网络”和“快速落子”两大法宝,已经发展出了“直觉感知”和“推理”的能力,初步具备了大数据智能。

2、跨媒体智能

人类可以通过视觉、听觉、嗅觉、味觉、触觉等以及其他知识进行综合感知,形成对周围世界的全面认识,这也是人工智能所希望达到的目标之一。跨媒体智能技术就是要让人工智能能够综合理解文本、图像、语音、视频、地理信息或其他类型数据及其相关属性。通过跨媒体计算,人工智能可以打破单一数据的局限性,随时多维度感知周围世界的几乎所有信息,实现跨媒体语义贯通,为人工智能的智能行为奠定基础。跨媒体智能除了可以与情感计算结合用于实现高仿真情感机器人之外,还可以使人工智能发展出联想、设计、概括、创造等能力。

3、通用智能

目前的人工智能饱受质疑的一个主要方面就是单个系统只能解决单一的问题,而且即使是在某一专门领域能够轻松战胜人类的人工智能系统,也难以应对其他领域的简单问题,甚至根本不能解决常识性问题。为解决这一难题,人工智能必须学会在没有先验知识的情况下,主动寻找知识关联,扩充自身知识图谱,实现举一反三的能力。实际上,人工智能在具备了跨媒体智能之后,完全可以通过跨媒体数据学习获得一定的通用智能,从而打开通往通用智能之门。2017年3月底,百度IDL研究院徐伟等就提出了一个新的通用智能架构,能够使得智能体通过多任务强化学习和零数据的情况下,结合语言和视觉两种信号在迷宫中导航并定位物体。

4、自主智能

人工智能饱受质疑的另一个方面是缺乏自主学习的能力。比如,在无人车间、无人工厂、太空、极地等控制人员不在现场或不便于在现场的情况下,无人机、无人车、无人船、服务机器人、空天机器人、极地机器人等各类智能设备需要其在遇到新的问题时,具备像人类一样的思考和处置能力,甚至可以应对自身所处的未知环境和问题,在全新环境进行自主决策。经过科学家门的不懈努力,目前自主智能领域已经取得了一定成绩。一方面,基于跨媒体智能与SLAM(simultaneous localization and mapping,即时定位与地图构建)技术结合的全自主移动机器人已经开始出现初级原型系统;另一方面,DeepMind已经开发出了一种算法,允许Deepmind系统的神经网络自主学习并再次使用所保留的信息,甚至开始向机器自主编程方向迈进。

5、混合增强智能

除了让机器具备人类智能之外,人工智能的另一个研究方向是混合增强智能,包括各种各穿戴设备、智能驾驶系统、外骨骼设备、人机协同手术系统等,它们都是以人类为本身为基础的,利用人类的意识进行机械系统的操作,实现人机协同。这类人工智能系统由于有人类的直接参与,获得了社会上较高的认可。如霍金所用的座椅就可以让毫无语言能力和肢体活动能力的霍金进行现场演讲;另外,一些通过脑电等操作的机械手臂等也已经开始帮助残障人士实现自主活动。由于混合增强智能使得人类能够利用自身意识,通过机械化延伸与扩展,来实现人脑主导的体力、感知力和智力等各方面增强与拓展,更加易于为人类所接受,并带来直接的益处,因此在近期可望取得明显的市场发展。目前,市场上已经出现了一定数量的混合增强智能系统,但还存在成本居高不下,难以普及等问题,尚需要从混合增强计算架构的理论与工程实践上继续加以深入研究。

6、群体智能

群体智能主要是来自于对自然界的研究中所受到的启发。人们发现,在自然界中,单个的小鱼、小鸟、蜜蜂、蚂蚁等并不具备有多大智能,但是当它们动态统一成一个群体时,所表现出的能力往往会超越所有个体能力之和。群体智能中所需要解决的问题包括群体成员之间的主动感知与发现、群体知识的获取与生成、群体成员间的协同与知识共享、群体智能的评估与演化、群体成员的自我维持与相互之间的安全交互等。目前已经有一些群体智能的应用出现。Unanimous所开发的Swarm AI平台在第89届奥斯卡大奖名单的预测中,准确率达到了75%。另外还有一些人工智能系统,分别在体育赛事、股市预测等方面,表现出了超过人类顶级专家的能力。

7、类脑智能

类脑智能已经开始显现出深度学习无可比拟的优势。类脑智能借鉴大脑中“内存与计算单元合一”等结构和信息处理方法的特点,在硬件实现与软件算法等多个层面,对于现有的计算体系与系统做出本质的变革,从计算能耗、计算能力与计算效率等诸多方面都有了大幅度的提升,已经成为一个明显的发展趋势。而且,人类对人脑的认识才刚刚开始,随着神经科学、脑科学、认知科学、生物科学、材料科学的不断发展和通信技术的不断进步,类脑智能必将会在不远的将来取得飞跃式发展。类脑芯片开始出现。高效能可重构类脑计算芯片。存储和计算微模块化组合,缩小了相互之间的瓶颈。


三、关于我国发展人工智能的建议



我国政府非常重视人工智能的发展,已经在人工智能领域取得了一定的成绩,并且在近两年又先后出台了多项促进政策,包括《国务院关于积极推进“互联网+”行动的指导意见》(国发[2015]40号)、《中国制造2025》(国发[2015]28号)、《国家高新区互联网跨界融合创新中关村示范工程(2015-2020年)》(国科火字[2015]50号)、《“互联网+”人工智能三年行动实施方案》(发改高技[2016]1078号)等。另外, 2017年《政府工作报告》中也首次提出要加快培育壮大包括人工智能在内的新兴产业,《人工智能2.0规划》已经接近研究完成,并纳入到“科技创新2030—重大项目”之中。但是从全球来看,我国人工智能发展与发达国家还有一定的差距。为抓住机遇,必须要把握好弯道超车的窗口期,在努力缩小人工智能1.0技术与产业发展差距的同时,积极抢占人工智能2.0发展先机。

1、抓紧制订国家级发展战略

人工智能已经开始并将继续深刻改变人类的生产生活方式,并成推动全球新一轮科技革命和产业变革的新动力和新引擎。未来5到10年,从这一革命性力量将会在各个领域中从蓄势待发、崭露头角进入到群体迸发的关键时期。有鉴于此,世界上发达国家和地区纷纷将人工智能做为提升国家竞争力的重要战略取向和重要抓手,加快人工智能技术创新与战略布局,力图占领产业发展新的制高点。尤其是美国,从2016年9月以来,先后发布了《关于人工智能未来的调研应答》、《人工智能报告:AI的应用究竟对人类社会经济有哪些影响 》、《为人工智能的未来做准备》、《人工智能研究开发战略规划》、《人工智能、自动化、经济》等多份国家级战略性文件。为抢占人工智能发展先机,实现从跟跑、并跑到领跑的转变,我国必须要抓紧制定国家级人工智能发展战略,集中理论研究、技术与产品研发、产业发展等各环节优势力量,打造自主可控、国际一流的人工智能产业,同时积极研究人工智能对人类社会所产生的正面、负面影响,从法律法规、伦理道德等各方面为迎接人工智能2.0和人机协同新的文明时代做好准备。

2、强化人工智能发展顶层设计

我国已经在人工智能领域取得了较好的成绩。早在上世纪70年代后期,吴文俊就凭借“吴方法”成为国际自动推理界的领军人物。科大讯飞语音识别技术已经处于国际领先地位,其语音识别和理解的准确率均达到了世界第一。在图像识别和视频识别方面顶级赛事之一的ImageNet竞赛中,以海康威视为代表的中国团队包揽其2016年所有项目的冠军。但是从整个国际发展来看,还只是处于单点突破阶段,与发达国家还有一定的距离。要想实现全面开花,还亟需进一步加强顶层设计,研制适合我国国情的人工智能发展路线图,发挥长处,补齐短板,在芯片、操作系统与平台等基础领域和自动驾驶、无人机、智能机器人等产品领域重点布局,编制人工智能产品政府采购目录,并通过试点、示范、推广等方式持续深入推进人工智能1.0应用创新,打造基础坚实、产品丰富、应用广泛、安全可信的人工智能产业体系;在重大项目和重大工程中进行前瞻性布局,重点研究人工智能2.0核心算法和新型计算架构,突破大数据智能、跨媒体智能、通用智能、自主智能、混合增强智能、群体智能、类脑智能等关键共性技术。

3、完善人工智能发展创新和服务体系

创新体系和服务体系在产业发展过程中起着极其重要的作用。在人工智能这一全新领域之中,尤其需要构建完善的创新和服务体系。一是要自上而下地建设或整合国家、省地各级创新中心、重点实验室、工程实验室等创新平台,建立政府部门、科研机构、企业之间和产业链上下游环节之间信息沟通的长效机制,促进创新成果产业化,打造创新活跃、技术领先、成果丰硕的创新体系。二是要充分发挥学会、协会、联盟、论坛、孵化器等行业组织和平台作用,开展技术竞赛、认证评测等,打造政产联动、立体协同、专业规范、贴心及时的服务体系。三是要加强人工智能标准化服务供给,研制基础共性、互联互通、行业应用、网络安全、隐私保护等技术标准,建设满足需求、基本完善、引领发展、国际先进的人工智能领域融合标准体系。四是要强化各相关主体机构的知识产权意识,推动人工智能领域专利布局、合作和风险防控,构建开放共赢、协同合作、攻防兼备的专利和知识产权体系。五是要加强人工智能学科建设,既注重国际交流和人才引进,又注重大中专院校、科研院所与社会化教育机构相辅相成的本地人才培养,既培养基础扎实、理论先进的研究人员,也培训操作熟练、技术精湛的数据标注员、机器人维修员等新型就业人员,打造梯度合理、数量充足、质量精良的人才体系。

4、重视相关技术与产业协同发展

人工智能作为一种通用型技术,在自身发展的同时也推动着其他技术和产业的发展,而其他相关技术和产业的发展反过来又加速了人工智能的进步。下一代互联网、5G、量子通信为人工智能提供了新的通信方式,保证了人工智能数据的传送速度和质量;生物学与生物脑的进步将逐步揭开神经科学和脑科学的奥秘,加快类脑智能的发展速度;脑机交互与融合使得人工智能能够在人类的直接控制下发挥作用,为人工智能发展创造了更为广泛的发展空间;新材料为人工智能提供更加精准感知、灵敏控制;新型芯片和原子级存储实现超高密度数据存储,使得人工智能系统可以更加高效节能,更加接近于生命体的智能。因此,在积极利用人工智能推动这些技术和产业快速发展的同时,也要重视利用这些技术和产业发展的成果,积极为人工智能2.0的发展奠定扎实的发展基础,这样才能保证人工智能产业的健康、稳定、可持续发展。