人工智能AI芯片行业分析报告.docx
- 文档编号:10723050
- 上传时间:2023-02-22
- 格式:DOCX
- 页数:27
- 大小:2.51MB
人工智能AI芯片行业分析报告.docx
《人工智能AI芯片行业分析报告.docx》由会员分享,可在线阅读,更多相关《人工智能AI芯片行业分析报告.docx(27页珍藏版)》请在冰豆网上搜索。
人工智能AI芯片行业分析报告
(此文档为word格式,可任意修改编辑!
)
2017年10月
正文目录
一、华为发布麒麟970,人工智能行业热潮再起4
1.华为发布全球首款内置NPU人工智能处理器-麒麟9704
2.人工智能热潮再起6
二、人工智能芯片的崛起之路7
1.什么是人工智能芯片?
为什么需要它?
7
2.现在处于弱人工智能、感知智能的初步阶段8
3.人工智能已成为各国战略布局的重要一环9
三、AI芯片三种技术路线,ASIC是终端应用的趋势11
1.GPU:
最先被引入深度学习,技术成熟11
2.FPGA:
具有硬件可编程特点,性能出众壁垒高13
3.ASIC:
未来移动端人工智能硬件的方向14
四、科技巨头加紧布局AI芯片,寒武纪跻身国际前列15
1.NVIDIA:
GPU龙头,AI芯片的市场领先者16
2.Intel:
全领域布局人工智能产品18
3.Google:
发布两代TPU,从ASIC方向进军AI芯片市场19
4.寒武纪:
全球AI芯片领域第一个独角兽初创公司22
5.其他AI芯片参与企业23
五、该领域主要龙头企业23
1.富瀚微23
2.中科曙光24
3.科大讯飞25
4.东方网力25
风险提示26
图目录
图1:
华为麒麟970芯片5
图2:
华为麒麟970芯片性能参数5
图3:
人工智能应用领域6
图4:
2035年的实际经济总增加值增速(%)7
图5:
人工智能芯片的诞生之路8
图6:
人工智能发展进程9
图7:
中美人工智能初创企业总量占全球比10
图8:
中美人工智能产业累计融资额对比(元)10
图9:
NVIDIA高性能GPU-Tesla概况12
图10:
CPU与GPU架构对比13
图11:
XilinxKintex7Ultrascle芯片和AlteraCycloneIV芯片13
图12:
海康威视搭载MovidiusMyriad2处理器15
图13:
MobileyeEyeQ1芯片15
图14:
NVIDIA股价表现16
图15:
GPU是NVIDIA营收主要来源16
图16:
NVIDIA全方位布局人工智能芯片业务17
图17:
Intel收购Altera后的技术路线图18
图18:
谷歌第一代TPU19
图19:
TPU内部架构20
图20:
TPU/CPU与其他组合对比20
图21:
谷歌第二代TPU—CloudTPU21
图22:
CloudTPUPOD内含64颗TPU21
图23:
DianNao结构22
表目录
表格1.华为麒麟970芯片重要技术参数4
表格2.世界各国人工智能相关战略、规划11
表格3.FPGA&ASIC对比14
表格4.Intel人工智能布局19
表格5.其他国内外参与AI芯片产业的科技公司及初创企业23
表格6.富瀚微主营业务收入24
一、华为发布麒麟970,人工智能行业热潮再起
1.华为发布全球首款内置NPU人工智能处理器-麒麟970
华为在IFA2017大会上公布的麒麟970处理器引起了业内关注,它的到来彻
底打破了唯频率和核数崇拜的传统观念。
根据其公开的信息,麒麟970处理器采用了10nm工艺制程(与苹果即将发布用在iPhone8上的A11处理器工艺相同),搭载了Cortex-A73(CPU)、Mali-G72(GPU)和麒麟NPU(神经网络处理单元)。
表格1.华为麒麟970芯片重要技术参数
图1:
华为麒麟970芯片
图2:
华为麒麟970芯片性能参数
创新在于异构与端云结合。
麒麟970采用异构架构完成人工智能处理,芯片括了CPU(中央处理器)、GPU(图形处理器)、NPU(神经网络处理单元)、ISP(图像信号处理)、DSP(数字信号处理)。
NPU在实现AI上承担主要工作,但CPU、GPU等也参与处理。
未来以异构架构实现人工智能将成为主流,这个异构SoC将成为一个AI计算平台。
麒麟970的另一创新之处在于端云结合实现人工智能,云端智能的优势在于
强大的运算能力,基于大数据给出大智慧,在策略性输出上有极大优势。
而端侧在具备了强大的感知能力之后,手机就会成为帮助用户思考的分身和伙伴。
两者达成平衡与协调,才是未来终端发展的出路。
华为麒麟970芯片的发布再次点燃了市场对人工智能领域的关注。
2.人工智能热潮再起
1946年,计算机诞生;1956年人工智能(AI)诞生;1969年互联网诞生……近期无论是华为的麒麟970芯片,还是AlphaGo与柯洁的人机大战,人工智能领域再度风起云涌。
人工智能正席卷安防、人脸识别、自动驾驶等多个领域。
就当前的现状来看,大部分业内人士都认为最先被人工智能“革命”的行业非金融业莫属。
曾经,高盛在纽约总部的美国现金股票交易柜台的交易员曾一度高达600人,而现在偌大的交易大厅却只有两个人值守。
图3:
人工智能应用领域
根据埃森哲今年发布的报告《人工智能:
助力中国经济增长》预测,到2035
年人工智能有潜力拉动中国经济年增长率上升1.6个百分点。
人工智能将成为一种全新生产要素,与资本、劳动力拥有同等重要地位,将成为拉动中国
经济增长的新动力。
而人工智能芯片作为人工智能的核心要素,已成为各国未来发展布局的战略性一环。
图4:
2035年的实际经济总增加值增速(%)
二、人工智能芯片的崛起之路
1.什么是人工智能芯片?
为什么需要它?
人工智能的实现依赖三个要素:
算法是核心,硬件和数据是基础,芯片就是硬件的最重要组成部分。
它其实包括两个计算过程:
1、训练(Train);2、应用
(Inference)。
为什么需要人工智能芯片?
深度学习作为机器学习的分支,是当前人工智能研究的主流方式。
简单说就是用数学方法模拟人脑神经网络,用大量数据训练机
器来模拟人脑学习过程,其本质是把传统算法问题转化为数据和计算问题。
所
以对底层基础芯片的要求也发生了根本性改变:
人工智能芯片的设计目的不是为了执行指令,而是为了大量数据训练和应用的计算。
图5:
人工智能芯片的诞生之路
深度学习模型需要通过大量的数据训练才能获得理想的效果。
随着大数据时代的到来,数据量呈指数级别增长,这一客观环境满足了深度学习算法对于训练
数据量的要求,但是算法的实现还需要相应处理器极高的运算速度作为支撑。
CPU的架构在解决深度学习任务时效率低、成本高。
当前流行的传统CPU架构需要数百上千条指令完成一个神经元的处理,但对于不需要太多的程序指令,却需要海量数据运算的深度学习的计算需求,这种结构就显得相对笨拙。
GPU作为图像处理芯片,其海量数据并行运算的能力与深度学习需求不谋而合,因此被最先引入深度学习。
以GTX200(GPU)为例,在CPU上有大约20%的晶体管是用作运算之用的,而GPU上有80%的晶体管用作运算。
2.现在处于弱人工智能、感知智能的初步阶段
人工智能的阶段可分为弱人工智能、强人工智能、超人工智能;也可分为计算智能、感知智能、认知智能三个阶段。
计算智能是最初级的,主要是计算能力的进化,这有赖于算法的优化和硬件
(CPU芯片)的技术进步。
感知智能有赖于数据获取技术,目前主要有语音识别和机器视觉两种技术。
认知智能是最高级的形态,也是未来需要突破的方向。
目前阶段,人工智能处于弱人工智能,刚刚进入感知智能时代。
图6:
人工智能发展进程
3.人工智能已成为各国战略布局的重要一环
根据腾讯研究院发布的《中美两国人工智能产业发展全面解读》,截止到2017年6月,全球人工智能企业总数达到2542家,美国拥有1078家,占据42%;中国其次,拥有592家,占据23%。
其余872家企业分布在瑞典、新加坡、日本、英国、澳大利亚、以色列、印度等国家。
图7:
中美人工智能初创企业总量占全球比
图8:
中美人工智能产业累计融资额对比(元)
人工智能是当前人类所面对的最为重要的技术社会变革,是互联网诞生以来的第二次技术社会形态在全球的萌芽,因此也成为各国战略布局的重要一环。
2017年7月,国务院印发《新一代人工智能发展规划》,明确了我国发展人工智能的战略目标:
到2030年,人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。
其他各国也分别从国家层面对人工智能产业进行战略布局。
表格2.世界各国人工智能相关战略、规划
三、AI芯片三种技术路线,ASIC是终端应用的趋势
目前适合深度学习的人工智能芯片主要有GPU、FPGA、ASIC三种技术路线。
三类芯片代表分别有英伟达(NVIDIA)的Tesla系列GPU、赛灵思(Xilinx)的FPGA和Google的TPU。
1.GPU:
最先被引入深度学习,技术成熟
图形处理器GPU最初是用在个人电脑、工作站、游戏机和一些移动设备上运行绘图运算工作的微处理器,可以快速地处理图像上的每一个像素点。
其海量
数据并行运算的能力与深度学习需求不谋而合,因此,被最先引入深度学习。
GPU不是完全代替CPU,而是两者分工合作。
在GPU计算中CPU和GPU之间是相连的,而且是一个异构的计算环境。
这就意味着应用程序当中,顺序执行这一部分的代码是在CPU里面进行执行的,而并行的也就是计算密集这一部分是在GPU里面进行。
图9:
NVIDIA高性能GPU-Tesla概况
GPU是基于大吞吐量的设计。
GPU的特点是有很多的ALU和很少的cache,
这点和CPU不同,是为thread提高服务的。
压缩缓存空间Cache,从而最大化激发内存吞吐量,可以处理超长的流水线。
缓存的目的不是保存之后需要访问的数据,而是担任数据转发的角色,为线程提高服务。
目前,GPU芯片市场主要由NVIDIA把控,占据了70%以上的市场份额。
而
应用在人工智能领域的可进行通用计算的GPU市场则基本被英伟达公司垄断。
据英伟达官网数据显示,2016年,有近两万家机构将英伟达产品用于深度学
习加速计算,相比2014年翻了13倍。
图10:
CPU与GPU架构对比
2.FPGA:
具有硬件可编程特点,性能出众壁垒高
FPGA即场效可编程逻辑闸阵列,一个出厂后的成品FPGA的逻辑块和连接
可以按照设计者的需要而改变。
FPGA是可编程的,而GPU由于架构固定,硬件原生支持的指令也就固定了。
其可编程性是关键,因为它让软件与终端应用公司能够提供与其竞争对手不同的解决方案,并且能够灵活地针对自己所用的算法修改电路。
图11:
XilinxKintex7Ultrascle芯片和AlteraCycloneIV芯片
FPGA市场前景诱人,但是门槛之高在芯片行业里无出其右。
IBM、德州仪
器、飞利浦、东芝、三星等60多家公司先后斥资数十亿美元投入这个行业,但是最终成功的只有位于美国硅谷的两家公司:
Xilinx与Altera(被Intel收购)。
这两家公司共占有近90%的市场份额,专利达到6000余项之多,如此之多的技术专利也构成了极高的技术壁垒。
赛灵思(Xilinx)表示,相较于仅使用CPU的服务器,使用XXFPGA云端服务器在赛灵思FPGA所驱动的服务器中,提供10~80倍的每瓦效能比。
目标市场方面,FPGA成本太高,所以适合对价格不是很敏感的地方,比如企业应用,军事和工业电子等等。
3.ASIC:
未来移动端人工智能硬件的方向
ASIC(ApplicationSpecificIntegratedCircuit)是专用集成电路,是为专门目的而设计。
它是应特定用户要求和特定电子系统的需要而设计、制造的集成电路。
ASIC的特点是面向特定用户的需求,ASIC在批量生产时与通用集成电路相比具有体积更小、功耗更低、可靠性提高、成本降低等优点。
FPGA上市速度快,但性能较低。
ASIC上市速度慢,需要大量时间开发,而且一次性成本(光刻掩模制作成本)远高于FPGA,但是性能远高于FPGA且量产后平均成本远低于FPGA。
FPGA可以完全重配置,但是ASIC也有一定的可配置能力,只要在设计的时候就把电路做成某些参数可调的即可。
表格3.FPGA&ASIC对比
目标市场方面,ASIC由于低成本适合消费电子类应用,是未来移动端人工智能硬件的发展方向。
像大疆无人机的MovidiusMyriad芯片、Tesla汽车自动驾驶曾用的Mobileye芯片和Google的张量处理器TPU都是ASIC的代表。
图12:
海康威视搭载MovidiusMyriad2处理器
图13:
MobileyeEyeQ1芯片
四、科技巨头加紧布局AI芯片,寒武纪跻身国际前列
全球科技巨头都在加紧布局AI芯片,希望走在科技变革时代的前线。
NVIDIA是AI芯片的市场领先者,占据了全球GPU70%的市场份额;Intel接连收购Altera、Nervana、Movidius,全方位布局AI产品;Google发布两代TPU,从ASIC方向进军AI芯片市场;寒武纪科技是中科院计算所孵化的一家独角兽公司。
2016年推出了国际首个深度学习专用处理器芯片(NPU),技术全球领先。
1.NVIDIA:
GPU龙头,AI芯片的市场领先者
目前全球GPU行业的市场份额有超过70%被英伟达公司占据。
而应用在人工智能领域的可进行通用计算的GPU市场则基本被英伟达公司垄断。
自1999年发布第一款GPU以来,GPU就成为了英伟达最为核心的产品,占到了英伟达总营业收入的八成以上。
英伟达的股价表现也是十分惊人,2016年英伟达的股价上涨了228%,过去的5年内累计上涨500%。
图14:
NVIDIA股价表现
图15:
GPU是NVIDIA营收主要来源
目前英伟达GPU芯片主要应用方向为数据中心芯片、自动驾驶芯片和嵌入式芯片。
主要包括采用Pascal架构的TeslaP100和TeslaP10芯片、采用Volta
架构的DGX-1芯片、自动驾驶的DriverPX2芯片、JetsonTX2芯片等。
NVIDIA用于深度学习的Tesla芯片经历了Kepler、Maxwell、Pascal、Volta四代架构:
(1)Kepler架构(2012年):
相较GPU第一代Fermi架构计算速度高出三倍。
代表芯片为K40,被用于深度学习的应用。
(2)Maxwell架构(2014年):
较Kepler架构计算速度提高一倍。
代表芯片为M40。
(3)Pascal架构(2016年):
专门针对每瓦性能优化的新架构,采用16nm工艺。
代表芯片为用于深度学习训练的TeslaP100和神经网络推断的TeslaP10。
(4)Volta架构(2017年):
加入Tensor(张量)运算单元,主要针对AI人工智能、DL深度学习。
代表芯片是TeslaV100。
图16:
NVIDIA全方位布局人工智能芯片业务
如今英伟达已经不再是一家单纯的显卡技术厂商,而是一家“人工智能计算公司”。
据英伟达官网数据显示,2016年,有近两万家机构将英伟达产品用于深
度学习加速计算,相比2014年翻了13倍。
医疗、生命科学、教育、能源、金融、汽车、制造业以及娱乐业等诸多行业均将得益于海量数据的分析。
2.Intel:
全领域布局人工智能产品
2015年,英特尔以167亿美元收购了FPGA制造商Altera。
英特尔斥巨资
收购Altera不是来为FPGA技术发展做贡献的,而是要让FPGA技术为英特尔的发展做贡献。
表现在技术路线图上,就是从现在分立的CPU芯片+分立的FPGA加速芯片,过渡到同一封装内的CPU晶片+FPGA晶片,到最终的集成CPU+FPGA芯片。
预计这几种产品形式将会长期共存,因为分立器件虽然性能稍差,但灵活性更高。
图17:
Intel收购Altera后的技术路线图
2016年8月,Intel宣布收购创业公司NervanaSystems。
Nervana准备推出深度学习定制芯片NervanaEngine,相比GPU在训练方面可以提升10倍性能。
与TeslaP100类似,该芯片也利用16-bit半精度浮点计算单元和大容量高带宽内存(HBM,计划为32GB,是竞品P100的两倍),摒弃了大量深度学习不需要的通用计算单元。
简单地总结一下Intel对于人工智能的布局,大体如下表:
表格4.Intel人工智能布局
此外,2016年Intel还兼并了人工智能芯片厂商Movidius,提供低能耗计算
机视觉芯片组。
Movidius芯片可以应用在可穿戴设备、无人机和机器人中,完成目标识别和深度测量等任务。
除了Google之外Movidius与国内联想和大疆等公司签订了协议。
Movidius的Myriad2系列图形处理器已经被联想用来开发下一代虚拟现实产品。
3.Google:
发布两代TPU,从ASIC方向进军AI芯片市场
第一代TPU展现出ASIC在神经网络推断方面的优秀性能。
谷歌在2016年的I/O大会上推出了自己的AI芯片——张量处理器TPU(第一代)。
图18:
谷歌第一代TPU
图19:
TPU内部架构
谷歌资深硬件工程师NormanJouppi刊文表示,初代TPU平均比当时的GPU或CPU快15~30倍(和TPU对比的是英特尔HaswellCPU以及NvidiaTeslaK80GPU),性能功耗比(TOPS/Watt)高出约30~80倍。
TPU是一个推理芯片,它并非是要取代GPU,可以确定的是,TPU与CPU一起使用对训练分析更加有益。
图20:
TPU/CPU与其他组合对比
第二代TPU兼具推理+训练。
2017年5月I/O大会上,谷歌发布了第二代TPU—CloudTPU,峰值性能达到180TFLOPS/s。
第一代TPU只加速推理,但第二代TPU新增了训练的功能。
不仅如此,谷歌的用户还能通过专门的网络,在云端利用TPU构建机器学习的超级计算机。
在第二代TPU里,每个TPU都包含了一个定制的高速网络,构成了一个谷歌称之为“TPU舱室”(TPUPOD)的机器学习超级计算机。
一个TPU舱室包含64个第二代TPU,最高可提供多达11.5千万亿次浮点运算,内存400万兆字节,4倍快于当时市面上最好的32台GPU。
图21:
谷歌第二代TPU—CloudTPU
图22:
CloudTPUPOD内含64颗TPU
4.寒武纪:
全球AI芯片领域第一个独角兽初创公司
寒武纪科技(Cambricon)是中科院计算所孵化的一家独角兽公司。
2016
年推出的寒武纪1A处理器(Cambricon-1A)是世界首款商用深度学习专用处理器,其搭载了国际首个深度学习专用处理器芯片(NPU)(属于ASIC),面向智能手机、安防监控、可穿戴设备、无人机和智能驾驶等各类终端设备,并于2017年8月获得了包括阿里在内的1亿美元A轮融资。
CPU、GPU与NPU相比,会有百倍以上的性能或能耗比差距。
在若干代表性神经网络上的实验结果表明——寒武纪的DianNao处理器的平均性能超过主流CPU核的100倍,但是面积和功耗仅为1/10,效能提升可达三个数量级;DianNao的平均性能与主流GPGPU相当,但面积和功耗仅为主流GPGPU百分之一量级。
图23:
DianNao结构
目前寒武纪主要包括三条产品线:
(1)智能终端处理器IP授权:
智能IP指令集可授权集成到手机、安防、可穿戴设备等终端芯片中,客户包括国内顶尖SoC厂商。
(2)智能云服务器芯片:
作为PCIE加速卡插在云服务器上,客户主要是国内的知名服务器厂商。
(3)家用智能服务机器人芯片:
从智能玩具、智能助手入手,使服务机器人独立具备看听说的能力。
客户是各类下游机器人厂商,产品的推出将比智能云服务器芯片更晚一些。
中国正在发力人工智能芯片,以缩小与全球科技巨头的差距。
5.其他AI芯片参与企业
其他国内外参与AI芯片产业的科技公司及初创企业如下表。
表格5.其他国内外参与AI芯片产业的科技公司及初创企业
五、该领域主要龙头企业
AI芯片是人工智能领域的上游,基于AI芯片的下游场景应用极为丰富,包括安防、消费电子、自动驾驶、可穿戴设备等。
由于A股市场没有像英伟达、Google这样的AI芯片企业,可以从AI芯片产业的下游精选个股。
相关标的包括富瀚微(国内领先的视频监控芯片设计商,产品包括安防视频监控多媒体处理芯片和数字接口模块等)、中科曙光(国内HPC龙头,与寒武纪战略合作)、科大讯飞(智能语音领导者,技术全球领先)、东方网力(安防行业国内领先的视频监控管理产品与解决方案提供商)等公司。
1.富瀚微:
国内领先的视频监控芯片设计商
公司主营业务为数字信号处理芯片的研发和销售,并提供专业技术服务。
主
要产品为安防视频监控多媒体处理芯片及数字接口模块。
公司主要产品和服务具体情况包括:
(1)安防视频监控多媒体处理芯片:
包括图像信号处理(ISP)芯片、网络摄像机(IPC)SoC芯片、数字硬盘录像机(DVR)SoC编解码芯片。
(2)数字接口模块:
公司数字接口模块主要是接受客户委托,为客户定制开发的电路模块。
(3)专业技术服务:
公司在研发和销售芯片及模块产品的同时,也为客户提供专业技术服务,主要包括:
相关算法和IP核的开发服务及授权、集成电路设计服务等。
表格6.富瀚微主营业务收入
未来,富瀚微将继续巩固和持续提升公司在模拟摄像机ISP市场的占有率,并积极拓展在安防视频监控高清网络摄像机SoC芯片、家居安防等市场的份额,拓宽公司营收渠道,实现营业收入、市场占有率及竞争地位的显著提高。
2.中科曙光:
国内HPC龙头,与寒武纪战略合作
公司以高端计算机、存储及其相关设备的研发、生产制造为基础,主要向社会输出云计算及大数据综合服务。
国内高端计算机(HPC)龙头:
根据2015-2016年《中国高性能计算机性能TOP100排行榜》显示,公司连续八年获得数量份额第一名。
公司在硅立方架构高性能计算机、100Gbps高速互联网络技术、6D-Torus高速网络技术、TC4600E-LP液冷刀片服务器、M-Pro架构刀片服务器、XSystem深度学习系统、高性能计算云管理和运维平台等领域开展了大量研发工作,并形成了一系列软硬件产品。
在存储方面,根据IDC报告,2016年前三季度公司NAS存储产品在中国市场按厂商销售额排名第一位。
与寒武纪战略合作,开拓人工智能领域:
2016年公司与北京中科寒武纪科技有限公司签署战略合作协议,双方将在人工智能领域展开深度合作。
这是中
科曙光继2015年联手中科院计算所与NVIDIA共同建立深度学习联合实验室之后,在人工智能领域的又一次重要布局。
两家公司同属中科院计算所,有利于发挥协同效应。
3.科大讯飞:
智能语音领导者
科大讯飞在智能语音及人工智能行业深耕十八年,拥有国际领先的源头技
术。
科大讯飞是我国唯一以语音技术为产业化方向的“国家智能语音高新技术产业化基地”、“国家规划布局内重点软件企业”、“语音及语言信息处理国家工程实验室”。
公司确立起主导产业方向、探索性方向和第三方创业的三层人工智能产业生
态体系,实现人工智能技术与多行业、多领域的深度结合推进,市场拓展高歌猛进,讯飞语音深入各行各业,产业链话语权进一步提升。
公司已与三大运营商、金融机构、手机、电视、汽车等行业领先企业实现广泛战略合作。
讯飞开放平台在线日服务量超30亿人次,合作伙伴达到25万家,过去18个月总用户数(独立终端数量)超9.1亿,以科大讯飞为中心的人工智能产业生态持续构建,形成了从源头技术创新到产业技术创新的全生态创新格局,进一步巩固
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 AI 芯片 行业 分析 报告