多重利好因素推动 人工智能+产业链日渐明晰 2016年09月27日10:31 来源:中国智能制造网|
巨头的加入、资本的持续布局在一定程度上印证了人工+行业的火爆,虽短期看人工智能+仍处于大规模投入期,短期内较难变现,但未来人工智能+应用于无人驾驶汽车、辅助诊断、刑侦监测等领域将会产生巨大的商业价值和社会价值,资本层面的爆发将持续带动人工智能+行业加速爆发。
工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能产品背后的数据、软件及算法等是人工智能的核心要素,而包括机器人、语音助手等在内的软硬件产品仅是人工智能的载体。
1.未来已来,人工智能+时代开启
1.1弱人工智能+已加速渗透,强人工智能+并不遥远
根据传统认知科学的研究成果,智能包含以下几种能力:1)感知能力。感知能力即对外界情况的感受与认知,其中包含两种处理方式:一种是面对简单或紧急情况,可不经大脑思考进行本能反应与应对。另一种是面对复杂情况,需要经大脑皮层进行处理与思考后,做出反应与应对;2)记忆与思维能力。其中,记忆是对感知到的外界信息或由思维产生的内部知识的存储过程,思维是对所存储的信息或知识的本质属性、内部规律等的认识过程;3)学习和自适应能力。能通过学习和自适应进行智能思维能力进化是人类智能的重要体现;4)决策与行为能力。即通过对信息或知识判别后,进行主观决策与行为。
人工智能+是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能+产品背后的数据、软件及算法等是人工智能+的核心要素,而包括机器人、语音助手等在内的软硬件产品仅是人工智能+的载体。
人工智能+的概念很宽泛,可将人工智能+依据实力划分为三类:
1)弱人工智能+:仅擅长某个单方面应用的人工智能+,超出特定领域外则无有效解;
2)强人工智能+:人类级别的人工智能+,在各方面都能和人类比肩,且无法简单进行人类与机器的区分;
3)超人工智能+:在各个领域均可以超越人类,在创新创造、创意创作领域均可超越人类,可解决任何人类无法解决的问题。
我们认为,从目前人工智能+的应用场景来看,当前人工智能+仍是以特定应用领域为主的弱人工智能+,如图像识别、语音识别等分析,如智能搜索、智能推荐、智能排序等智能算法等。而未来随着运算能力、数据量的大幅增长以及算法的提升,弱人工智能+将逐步向强人工智能+转化,机器智能将从感知、记忆和存储向认知、自主学习、决策与执行进阶。
1.2人工智能+发展历经波折,现已进入加速爆发期
人工智能+发展历经波折,历史上经历过2次低谷。传统人工智能+受制于计算能力,并没能完成大规模的并行计算和并行处理,人工智能+系统的能力较差。2006年,Hinton教授提出“深度学习”神经网络使得人工智能+性能获得突破性进展,进而促使人工智能+产业又一次进入快速发展阶段。
其中,谷歌AlphaGO战胜李世石九段对业界产生的轰动效应最大。AlphaGo是一款基于深度学习技术研究开发的围棋人工智能+程序这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。2015年10月阿尔法围棋以5:0完胜欧洲围棋冠军、职业二段选手樊麾。为了测试阿尔法围棋的水平,谷歌于2016年3月份向围棋世界冠军、韩国顶尖棋手李世石发起挑战,并以4:1的总比分获胜。AlphaGO与传统围棋程序最大的区别在于其利用深度学习方法进行训练,AlphaGo学习了3000万步人类实战的围棋下法,学习完毕后,可以通过“左右互博”,自己跟自己下棋,在下了几千盘棋局后,AlphaGo能从这些棋局中学习新的围棋策略,这个过程被Deep-Mind称为“强化学习”。正是由于深度学习方法的引入,谷歌AlphaGO才能迅速跻身顶尖围棋高手水平。
1.3算法层、硬件层、数据层均实现突破,人工智能+加速爆发
1.3.1深度学习推动人工智能+迈上新台阶
深度学习的概念源于人工神经网络的研究,是由Hinton等人在2006年提出,主要机理是通过深层神经网络算法来模拟人的大脑学习过程,希望借鉴人脑的多层抽象机制来实现对现实对象或数据的机器化语言表达。深度学习是通过大量的简单神经元组成,每层的神经元接收更低层神经元的输入,通过输入与输出的非线性关系将低层特征组合成更高层的抽象表示,直至完成输出。
传统机器学习为了进行某种模式的识别,通常的做法首先是以某种方式,提取这个模式中的特征。在传统机器模型中,良好的特征表达,对最终算法的准确性起了非常关键的作用,且识别系统的计算和测试工作耗时主要集中在特征提取部分,特征的提取方式有时候是人工设计或指定的,主要依靠人工提取。
与传统机器学习不同的是,深度学习提出了一种让计算机自动学习出模式特征的方法,并将特征学习融入到了建立模型的过程中,从而减少了人为设计特征造成的不完备性。而目前以深度学习为核心的某些机器学习应用,在满足特定条件的应用场景下,已经达到了超越现有算法的识别或分类性能。
深度学习直接尝试解决抽象认知的难题,并取得了突破性的进展。深度学习的提出、应用与发展,无论从学术界还是从产业界来说均将人工智能+带上了一个新的台阶,将人工智能+产业带入了一个全新的发展阶段。
1.3.2计算成本指数级下降,GPU加速发展为深度学习奠定计算基础
英特尔创始人之一戈登〃摩尔于1975年开创性的提出摩尔定律,即当价格不变时,集成电路上可容纳的晶体管数目约每隔18个月便会增加一倍,性能也将提升一倍。计算成本的极速下降也为人工智能+加速发展提供可能。
未来科学家Kurzweil对人脑进行估算,得到的人脑运算速度估算值是10^16cps(calculationspersecond,每秒计算次数,描述运算能力的单位),也就是1亿亿次计算每秒。现在最快的超级计算机,中国的天河二号,其实已经超过这个运算力了,天河每秒能进行3.4亿亿,但由于天河二号占地大、造价高、运行成本高等特点注定难以广泛应用。根据Kurzweil的观点,认为当1000美元能买到人脑级别的1亿亿运算能力的时候,强人工智能+可能成为生活中的一部分。
在深度学习模型中,矢量化编程是提高算法速度的一种有效方法。深层模型的算法,如BP,Auto-EnCODer,CNN等,都可以写成矢量化的形式。然而,在单个CPU上执行时,矢量运算会被展开成循环的形式,本质上还是串行执行。随着人工智能+的不断发展,基于深度学习模型的算法对大规模并行计算能力的需求不断增加,CPU不再能很好地满足科学家们对于并行计算能力的需求,而GPU天然强大的并行计算能力被科学家们充分挖掘,GPU逐渐从由若干专用的固定功能单元组成的专用并行处理器向以通用计算资源为主,固定功能单元为辅的架构转变。
而GPU则与CPU存在明显区别,GPU的众核体系结构包含几千个流处理器,可将矢量运算并行化执行,大幅缩短计算时间。随着NVIDIA、AMD等不断推进其GPU的大规模并行架构支持,面向通用计算的GPU已成为加速可并行应用程序的重要手段。得益于GPU众核体系结构,程序在GPU系统上的运行速度相较于单核CPU往往提升几十倍乃至上千倍。
利用GPU来训练深度神经网络,可以充分发挥其数以千计计算核心的高效并行计算能力,在使用海量训练数据的场景下,所耗费的时间大幅缩短,占用的服务器也更少。如果对针对适当的深度神经网络进行合理优化,一块GPU卡可相当于数十甚至上百台CPU服务器的计算能力,因此GPU已经成为业界在深度学习模型训练方面的首选。 #hc360分页符
1.3.3数据量,为深度学习奠定数据基础
人类大脑在进化中是一个不断学习、吸收理解与自我完善的过程,经历了历史积淀知识的学习、吸收与理解掌握过程,完成大脑意识进阶过程。而深度学习则是利用机器算法模拟人脑对历史知识学习、吸收与理解并掌握运用的训练过程,因此数据量的丰富程度决定了是否有充足数据对神经网络进行训练,进而使人工智能+系统经过深度学习训练后达到强人工智能+水平。因此,能否有足够多的数据对人工神经网络进行深度训练,提升算法有效性是人工智能+能否达到类人或超人水平的决定因素之一。
近年来,随着移动设备渗透率的逐步提升,全球数据量加速爆发。据国际数据资讯公司估测,数据数量一直在快速增加,这个速度不仅是指数据流的增长,而且还包括全新的数据种类的增多。据统计,2013年全球产生的数据达到3.5ZB,到2020年产生的数量将增至44ZB,CAGR达到43.57%。
我们认为,深度学习的根本是能否有足够多的数据对人工智能+系统进行训练,随着移动互联网的爆发,数据量指数级的增长,这都为利用进行深度学习提供了可能。因此,在DT时代,大数据在知识解析、机器智能与人类智能协调工作及智能分析系统中将会扮演要角色,在大数据的支撑下,人工智能+应用也将变的更加广泛,大数据将支撑人工智能+产业爆发。
2.资本层加速爆发,推动人工智能+产业发展
科技巨头在人工智能+领域的布局始终领先,以Google为例,其在2014年斥巨资收购的DeepMind公司,后者在2015年开发出的基于深度学习模型的围棋程序AlphaGo先是在2015年击败欧洲冠军樊麾二段,后又于2016年3月击败世界冠军李世石九段。显示出人工智能+在围棋领域的强大实力,也在一定程度上引发社会对人工智能+的关注。除Google外,Facebook在人工智能+领域也较为领先,其在图像识别、机器围棋等领域也在不断投入。国内互联网厂商诸如百度、腾讯,同样在人工智能+领域加大投入,持续布局人工智能+领域。
除互联网巨头外,敏锐的资本方也在积极布局人工智能+领域,近年来风投不断加大对人工智能+初创企业的投资,持续布局人工智能+这个重要“风口”。根据VentureScanner统计数据,近年来全球人工智能+领域的投资金额已成爆发增长态势。
2014年人工智能+企业融资总量首次超过10亿美金,2015年融资总量更是超过12亿美金。2016年前三个月的不完全统计显示,全球在人工智能+领域的投资已经超过4亿美金。
根据VentureScanner统计,从人工智能+投资分布情况看,机器学习(应用)分类以263家公司的数量遥遥领先,自然语言处理公司以154的数量位列第二,通用计算机视觉排名第四。从资本方的投资意愿看,对机器学习、自然语言理解、计算机视觉等技术与应用关注度较高。
我们认为,巨头的加入、资本的持续布局在一定程度上印证了人工智能+行业的火爆,虽短期看人工智能+仍处于大规模投入期,短期内较难变现,但未来人工智能+应用于无人驾驶汽车、辅助诊断、刑侦监测等领域将会产生巨大的商业价值和社会价值,资本层面的爆发将持续带动人工智能+行业加速爆发。
3.产业链明晰,市场空间巨大
3.1人工智能+产业链明晰
人工智能+产业链可简单划为三层,即底层基础层、中间层技术层与上层应用层。其中,1)基础层包含硬件存储与计算资源和数据资源等,GPU芯片、云计算平台、传感器、数据等均包含在此层中;2)技术层包含算法、模型平台,感知智能算法、认知智能算法等均在此层中;3)应用层包含硬件产品和软件与服务,硬件中包含无人机、机器人及其他智能硬件等,软件与服务包含语音输入法、虚拟助手、自动驾驶及智能安防等。
从目前的发展情况看,算法层为人工智能+产业链的核心,支撑上层应用的发展,目前感知智能已加速发展,认知智能为人工智能+在算法层面的下一个突破方向。而底层基础层中的数据能力与计算能力主要的发展方向为低成本与小型化,数据采集的发展方向为多样化,移动互联网的发展已经为产业积累了一定的数据,未来随着物联网的发展将积累更多的环境与行为层面数据,丰富数据构成。应用层主要与各垂直行业结合开发深度人工智能+应用。
随着计算机、互联网与移动互联网等网络技术的发展,基于计算机、互联网、物联网在数据生成、采集、存储、计算等环节的突破,推进人工智能+发展。
3.2基础层相对成熟,认知智能尚待突破
目前,全球人工智能+产业在基础层发展已相对成熟,1)计算能力方面。目前云计算+大规模GPU并行计算的计算方式已较为成熟,本地化高性能运算芯片也在加速发展中;2)数据层面。互联网、移动互联网的发展为人工智能+发展积累了海量数据,目前此类数据已能支撑技术开发与应用开发。近期,物联网统一,未来物联网发展在行为、环境层获取并积累更为全面和丰富的数据,支撑人工智能+应用开发。
而与基础层相对应的是,目前人工智能+在技术开发与应用层面仍有较大的发展空间。目前在人工智能+的应用主要在感知层面,如声音、图像等,感知层技术储备相对丰富,而在认知层仍未能获得大幅突破,诸如无人驾驶、全自动智能机器人等仍处于开发中,与大规模应用仍有一定距离。
从我国目前人工智能+产业发展情况看,我国互联网巨头、创业公司在人工智能+基础层、技术层与应用层的参与热情均较高,产业链各环节均已涌现出龙头公司。在基础层中,有百度、阿里为代表的互联网巨头也有数据堂为代表的专业化数据公司;技术层中,百度在机器学习、语音识别与视觉方面均有较深布局,此外如旷视科技、科大讯飞等也分别在其垂直领域有叫深厚的技术储备积累;应用层中,虚拟助手、智能客服、BI与语音识别和图像识别等软件与服务产品较为丰富,硬件产品中诸如服务机器人、教育机器人等产品也处于快速发展中。
从艾瑞咨询发布的中国人工智能+产业全景图看,我国人工智能+产业目前发展现状与国外类似,在基础层与感知智能技术方面积累较为深厚,图像识别、语音识别等感知层技术与应用发展较为完善,而在诸如认知智能技术开发与应用方面尚未找到突破口。
3.3市场空间大,下游应用前景广阔
根据Tractica的预测数据,2016年全球人工智能+收入预计将达到6.437亿美元,到2025年将增长至368亿美元。根据艾瑞咨询预测数据,2015年我国人工智能+市场规模约为12亿人民币,其中语音识别和视觉识别占比分别约为60%和12.5%,其他约占27.5%,预计到2020年,中国AI市场规模将达到91亿人民币。
我们认为,目前人工智能+应用尚不完善,以国内市场为例,商业模式主要集中在License授权、项目等模式中,应用也多局限在以语音识别、语义理解为核心的智能客服、语音助手等及以人脸识别为代表的、打卡及安防领域。由于目前人工智能+技术主要应用感知智能技术,因此市场空间尚未打开,预计随着诸如无人驾驶汽车等认知智能技术的加速突破与应用,人工智能+市场将加速爆发,未来人工智能++汽车、人工智能++医疗等产业均将创造巨大的商业价值。
责任编辑:姚泓泽