ARM Cortex A8A9以及高通Scorpion处理器详解.docx
- 文档编号:5842444
- 上传时间:2023-01-01
- 格式:DOCX
- 页数:21
- 大小:31.92KB
ARM Cortex A8A9以及高通Scorpion处理器详解.docx
《ARM Cortex A8A9以及高通Scorpion处理器详解.docx》由会员分享,可在线阅读,更多相关《ARM Cortex A8A9以及高通Scorpion处理器详解.docx(21页珍藏版)》请在冰豆网上搜索。
ARMCortexA8A9以及高通Scorpion处理器详解
1.一些背景介绍
1.1ARM核心
ARM核心是主控SOC中的重要部分,系统的日常应用都由ARM核心来完成,因此ARM核心的效能很大程度上跟用户体验有关。
ARM公司一般用DMIPS/MHz来标称ARM核心的性能。
DMIPS是DhrystoneMillionInstructionsexecutedPerSecond的缩写,反映核心的整数计算能力。
但Dhrystone算法代码本身比较叫,可以完全放到Cache中执行,因此反映的只是核心能力,并不能反映缓存、内存I/O性能。
SoC定义为将微处理器、模拟IP核、数字IP核和存储器(或片外存储控制接口)集成在单一芯片上。
能支持智能系统的ARM核心有以下几类:
ARM9:
指令集ARMv5,5级流水线,1.1DMIPS/MHz
ARM10E:
指令集ARMv5,intel获得授权后发展的,如PXA270,PXA210系列,6/7级流水线,1.35DMIPS/MHz
ARM11:
指令集ARMv6,8级流水线,1.25DMIPS/MHz
Cortex-A8:
指令集ARMv7-A,13级整数流水线,超标量双发射,2.0DMIPS/MHz,标配Neon,不支持多核
Scorpion:
指令集ARMv7-A,高通获得指令集授权后在A8的基础上设计的。
13级整数流水线,超标量双发射,部分乱序执行,2.1DMIPS/MHz,标配Neon,支持多核
Cortex-A9:
指令集ARMv7-A,8级整数流水线,超标量双发射,乱序执行,2.5DMIPS/MHz,可选配Neon/VFPv3,支持多核
Cortex-A5:
指令集ARMv7-A,8级整数流水线,1.57DMIPS/MHz,可选配Neon/VFPv3,支持多核
Cortex-A15:
指令集ARMv7-A,超标量,乱序执行,可选配Neon/VFPv4,支持多核
×目前只有指令集ARMv7-A的核心才能在Android2.2上支持AdobeFlash。
×Neon是什么?
Neon是ARM核心附带的浮点SIMD引擎,可以把它当一个DSP用,可以把它理解为桌面CPU上的SSE,SSE2。
合理的利用可以增强处理器在游戏、多媒体中的表现,当然需要软件支持。
标准的Neon宽度是64bit。
A9的Neon相对A8略有升级。
如果不使用Neon,就只能有CPU自带的VFP进行浮点运算。
标准A8的VFP没有管线化,速度是比较低的。
A9的VFP管线化后,效能有明显提升,但还是不如Neon。
×超标量:
A8A9A15都是超标量结构,他们具有两条流水线,一个周期可以发射最多两条指令进行执行。
因此同频效能比ARM9ARM11等高的多。
×Cortex-A5是Cortex-A家族中的小弟,功耗较低,单位功耗的效能很高,用于代替ARM9和ARM11占据低端市场。
Cortex-A15是最新发布的,作为高端产品出现,目前资料不多。
×Scropion是高通根据Cortex-A8修改的。
关键的特点是同频下比A8节能30%,或者同功耗的频率高25%。
Scorpion具有部分A9的特性,如乱序执行,管线化的VFP,支持多核。
此外,Scorpion的NeonSIMD引擎(高通称之为VeNum)宽度为128bit,是A8和A9的两倍,能提供更强劲的浮点运算支持,并且在不需要的时候可以关闭一半变成64bit以节省能源。
总体上,Scorpion是具有部分A9特性的A8,高频率节能浮点加强版。
1.2工艺与频率、功耗
这三者是密切相关的,当然频率与SOC的后端设计也有很大关系。
根据参考文献,45nm工艺可以比65nm节省30%的能耗。
45nmScorpion在1.0GHz、1.2GHz和1.5GHz下的典型功耗是350mW、420mW和650mW,其中1.5GHz下已经需要加压,功耗上升更多。
根据以上信息我们可以推测出
Cortex-A8虽然性能强劲,但不是省油的灯。
于是新一代mid主控在45nm、55nm下动辄1.2GHz的主频,能耗有点让人担心。
当然,如果采用的GP工艺,可能会好些。
同样制程的工艺,可以分为LP和GP。
LP是LowPower,降低漏电,使得芯片在闲置状态下的能耗最低。
GP是GeneralPurpose,可以在相同的满载能耗下达到比LP更高的频率,但是闲置状态下功耗高。
国际大厂用于手机的SOC一般都采用LP工艺,以降低待机功耗,毕竟手机大部分时间都在待机。
1.3视频的“硬解”与“软解”
在Android下,个人认为硬解就是通过芯片自带的加速器进行解码,无论用的是DSP还是硬布线的解码器。
软解就是通过软件使用ARM核心进行解码,ARM作为一个通用核心做视频解码,自然效能不会太高,并且依赖软件的算法,一般普遍使用的就是FFMPEG对ARM进行优化,调用neon等。
不过就我个人的使用经验而言,1GHz的Cortex-A8处理器,使用rockplayer,vplayer等基于FFMPEG的软件解码,只能勉强解码480p的视频。
对于848×480,24分钟100M左右的RMVB视频,大部分时间都无法达到满帧,在遇到高码率的动态场景时,帧数降到个位数,会有很明显的卡顿掉帧。
在Tegra2的A9平台上表现稍好,仍不能满帧。
估计是播放软件无法完全利用2个核心,如果两个核心充分利用,解决480pRMVB应该没有问题。
总体而言,1GHzA8处理器软解RMVB基本是RK27MP4的水平。
如果你的眼睛比较挑剔,就要注意了。
一些A8软解720pRMVB流畅的说法,基本都是不实际的。
==========ARM11========================
VIAWM8650
猜测为65nm工艺
ARM11600MHz,300MHzDSP,支持720p硬件解码
256MDDR2,位宽未知
GPU未知
VIA的新一代芯片,WM8505的升级版。
ARM核心从ARM9300/400MHz升级到ARM11600MHz,并且能进一步提升到800MHz,性能基本达到RK2818和TCC8902的水平。
视频能力从基本没有提升到720p硬件解码,虽然相对TCC的1080p解码有差距,但也达到了RK28的水平。
软件方面,终于提供了Android2.1的支持,相比上一代的WM8505只能支持Android1.6有了进步。
但是在A8/A9主控搭载Android2.2/2.3逐渐普及的趋势下,这款方案又将过时,只能作为低端入门的选择。
据报道,售价将在550元以下。
==========Cortex-A8========================
65nm工艺,其中ARM核心为GP工艺,视频解码部分为LP工艺
Cortex-A8800MHz,256KL2Cache
512MDDR2,32bit
视频子系统:
硬解
多格式,H.264,VC-1,MPEG4,RV最高720p(大部分开发商都没做RV的硬解支持),实测可播放部分1080p视频
GPU:
Adreno200(AMDZ430)
三角形生产率:
27M
像素填充率:
166M
RockchipRK2908
本帖最后由seasky于2011-7-823:
40编辑
文章来源于网络,仅供参考。
1.一些背景介绍
1.1ARM核心
ARM核心是主控SOC中的重要部分,系统的日常应用都由ARM核心来完成,因此ARM核心的效能很大程度上跟用户体验有关。
ARM公司一般用DMIPS/MHz来标称ARM核心的性能。
DMIPS是DhrystoneMillionInstructionsexecutedPerSecond的缩写,反映核心的整数计算能力。
但Dhrystone算法代码本身比较叫,可以完全放到Cache中执行,因此反映的只是核心能力,并不能反映缓存、内存I/O性能。
能支持智能系统的ARM核心有以下几类:
ARM9:
指令集ARMv5,5级流水线,1.1DMIPS/MHz
ARM10E:
指令集ARMv5,intel获得授权后发展的,如PXA270,PXA210系列,6/7级流水线,1.35DMIPS/MHz
ARM11:
指令集ARMv6,8级流水线,1.25DMIPS/MHz
Cortex-A8:
指令集ARMv7-A,13级整数流水线,超标量双发射,2.0DMIPS/MHz,标配Neon,不支持多核
Scorpion:
指令集ARMv7-A,高通获得指令集授权后在A8的基础上设计的。
13级整数流水线,超标量双发射,部分乱序执行,2.1DMIPS/MHz,标配Neon,支持多核
Cortex-A9:
指令集ARMv7-A,8级整数流水线,超标量双发射,乱序执行,2.5DMIPS/MHz,可选配Neon/VFPv3,支持多核
Cortex-A5:
指令集ARMv7-A,8级整数流水线,1.57DMIPS/MHz,可选配Neon/VFPv3,支持多核
Cortex-A15:
指令集ARMv7-A,超标量,乱序执行,可选配Neon/VFPv4,支持多核
×目前只有指令集ARMv7-A的核心才能在Android2.2上支持AdobeFlash。
×Neon是什么?
Neon是ARM核心附带的浮点SIMD引擎,可以把它当一个DSP用,可以把它理解为桌面CPU上的SSE,SSE2。
合理的利用可以增强处理器在游戏、多媒体中的表现,当然需要软件支持。
标准的Neon宽度是64bit。
A9的Neon相对A8略有升级。
如果不使用Neon,就只能有CPU自带的VFP进行浮点运算。
标准A8的VFP没有管线化,速度是比较低的。
A9的VFP管线化后,效能有明显提升,但还是不如Neon。
×超标量:
A8A9A15都是超标量结构,他们具有两条流水线,一个周期可以发射最多两条指令进行执行。
因此同频效能比ARM9ARM11等高的多。
×Cortex-A5是Cortex-A家族中的小弟,功耗较低,单位功耗的效能很高,用于代替ARM9和ARM11占据低端市场。
Cortex-A15是最新发布的,作为高端产品出现,目前资料不多。
×Scropion是高通根据Cortex-A8修改的。
关键的特点是同频下比A8节能30%,或者同功耗的频率高25%。
Scorpion具有部分A9的特性,如乱序执行,管线化的VFP,支持多核。
此外,Scorpion的NeonSIMD引擎(高通称之为VeNum)宽度为128bit,是A8和A9的两倍,能提供更强劲的浮点运算支持,并且在不需要的时候可以关闭一半变成64bit以节省能源。
总体上,Scorpion是具有部分A9特性的A8,高频率节能浮点加强版。
1.2工艺与频率、功耗
这三者是密切相关的,当然频率与SOC的后端设计也有很大关系。
根据参考文献,45nm工艺可以比65nm节省30%的能耗。
45nmScorpion在1.0GHz、1.2GHz和1.5GHz下的典型功耗是350mW、420mW和650mW,其中1.5GHz下已经需要加压,功耗上升更多。
根据以上信息我们可以推测出
Cortex-A8虽然性能强劲,但不是省油的灯。
于是新一代mid主控在45nm、55nm下动辄1.2GHz的主频,能耗有点让人担心。
当然,如果采用的GP工艺,可能会好些。
同样制程的工艺,可以分为LP和GP。
LP是LowPower,降低漏电,使得芯片在闲置状态下的能耗最低。
GP是GeneralPurpose,可以在相同的满载能耗下达到比LP更高的频率,但是闲置状态下功耗高。
国际大厂用于手机的SOC一般都采用LP工艺,以降低待机功耗,毕竟手机大部分时间都在待机。
1.3视频的“硬解”与“软解”
在Android下,个人认为硬解就是通过芯片自带的加速器进行解码,无论用的是DSP还是硬布线的解码器。
软解就是通过软件使用ARM核心进行解码,ARM作为一个通用核心做视频解码,自然效能不会太高,并且依赖软件的算法,一般普遍使用的就是FFMPEG对ARM进行优化,调用neon等。
不过就我个人的使用经验而言,1GHz的Cortex-A8处理器,使用rockplayer,vplayer等基于FFMPEG的软件解码,只能勉强解码480p的视频。
对于848×480,24分钟100M左右的RMVB视频,大部分时间都无法达到满帧,在遇到高码率的动态场景时,帧数降到个位数,会有很明显的卡顿掉帧。
在Tegra2的A9平台上表现稍好,仍不能满帧。
估计是播放软件无法完全利用2个核心,如果两个核心充分利用,解决480pRMVB应该没有问题。
总体而言,1GHzA8处理器软解RMVB基本是RK27MP4的水平。
如果你的眼睛比较挑剔,就要注意了。
一些A8软解720pRMVB流畅的说法,基本都是不实际的。
1.43D性能与内存带宽
2.新一代主控简介
更新:
2011/05/30修订Tegra2/三星Orion/OMAP4/AML/TCC8803/RK29/S5PV210部分内容
更新:
2011/04/21
==========ARM11========================
VIAWM8650
猜测为65nm工艺
ARM11600MHz,300MHzDSP,支持720p硬件解码
256MDDR2,位宽未知
GPU未知
VIA的新一代芯片,WM8505的升级版。
ARM核心从ARM9300/400MHz升级到ARM11600MHz,并且能进一步提升到800MHz,性能基本达到RK2818和TCC8902的水平。
视频能力从基本没有提升到720p硬件解码,虽然相对TCC的1080p解码有差距,但也达到了RK28的水平。
软件方面,终于提供了Android2.1的支持,相比上一代的WM8505只能支持Android1.6有了进步。
但是在A8/A9主控搭载Android2.2/2.3逐渐普及的趋势下,这款方案又将过时,只能作为低端入门的选择。
据报道,售价将在550元以下。
==========Cortex-A8========================
Freescalei.MX515
65nm工艺,其中ARM核心为GP工艺,视频解码部分为LP工艺
Cortex-A8800MHz,256KL2Cache
512MDDR2,32bit
视频子系统:
硬解
多格式,H.264,VC-1,MPEG4,RV最高720p(大部分开发商都没做RV的硬解支持),实测可播放部分1080p视频
GPU:
Adreno200(AMDZ430)
三角形生产率:
27M
像素填充率:
166M
当然,i.MX515不算什么新芯片了,鉴于其产品上市不久,就一起说说吧。
国内的515产品基本都是山寨产品,似乎缺乏原厂支持,开发都靠山寨开发商。
于是就有固件保密啊之类的新闻,一旦山寨开发商转向RK2908,后续支持也让人担心。
GPU性能虽然很一般,但与高通手机芯片的GPU一致,软件支持度不错,但由于山寨平板采用了800*600的分辨率,这方面可能存在一定的兼容性问题,此外游戏中重力感应等也需要一定的调试。
视频能力除了缺少RV硬解,其他够用。
Android2.2系统配合A8核心在网络浏览和Flash支持上都问题不大。
但目前山寨产品的续航还存在问题,使用和待机时间较短。
此外软件上的bug也不少。
随着新一代的S5PV210,RK2908和TCC8803上市,此方案的产品将进一步进入千元以内,成为最低价的A8产品。
RockchipRK2908
55nm工艺,猜测为GP
Cortex-A81GHz/1.2GHz,512KL2Cache
512MDDR2/DDR3,32bit
视频子系统:
硬解,猜测为CevaMM3000
多格式,H.264,VC-1,MPEG4,RV,AVS,VP8最高1080p
GPU:
VivanteGC800
三角形生产率:
最高60M
像素填充率:
未知,推测600M
代表:
酷比U9GT,台电T760,原道N10,蓝魔W15
最近红红火火的RK29,瑞芯微没少打广告,大有秒杀高通苹果之势。
瑞芯微宣传的亮点,就是高主频A8核心,1080p以及WebM视频支持以及高性能的GPU。
总体来说,芯片规格还是很不错的。
自然,凭借1.2GHz的高主频,得分比1GHz的产品高是正常的。
不过呢,在三星、TI等厂家使用45nm工艺制作的芯片,标称频率普遍为1GHz的情况下,RK的55nm芯片能标称1.2GHz,想必是用了GP工艺才能到如此高的频率,尽管如此,相信功耗的代价同样也不小。
好在RK29是主攻MID市场的,MID不像手机有大量的时间在待机,牺牲点待机功耗也问题不大。
只是如果上市芯片个个加压跑1.2GHz,我想功耗方面有所牺牲,对于55nm的RK29来说,1GHz还是比较合适的频率吧。
目前可以确认采用的是TSMC的55nmLP工艺,所以现在出来的产品频率不是很能上去,第一批产品普遍在800MHz。
得益于512K缓存,同频下nbench整数性能略高于AML,而内存性能和浮点性能不如采用A9核心的AML。
有部分产品通过固件更新提升到了1GHz,但nbench得分貌似没有提升,有待进一步关注。
此外RK29发热不小,普遍用导热胶与金属屏蔽壳相连,以增加散热。
RK29支持VP8WebM。
能支持这个编码的视频模块,一是google自家的On2的视频解码硬核,另一家是Ceva的MM3000。
考虑到RK29还标称支持AVS,那么只剩下CevaMM3000了。
想起RK28用的CevaMM2000,这次继续用Ceva的视频解码可能性也是挺大的。
之前的消息是,RK29的3D部分使用了Vivante的GC800.GC800是盈方微IMAPX200系列使用的GC600的更高阶版本,在40nmGP工艺下可以达到575MHz的工作频率,提供57M的三角形生成率和575M的像素填充率。
40nmLP只有315MHz的频率。
只是RK29使用的55nm工艺是否能让GC800运行在如此高的频率?
抑或是使用了更高阶的GC1000?
或者最高60M仅仅是GC800的“最高”?
这些我们都不知道,等真正的产品上市。
RK29可谓是对RK28的一次全面升级,从ARM核心上,视频解码上和3D加速上。
但是RK29的真正对手不是三星之类的,恐怕是后面的TCC8803.RK在Android系统软件方面的积累是有目共睹的,相信凭借软件开发实力,联合众多厂商能在下一轮产品的市场中占据大头。
现在看来,RK29的最大对手是AML。
RK29在进一步更新固件后,3D性能得到了比较好的发挥,gameloft的大部分作品已经可以流畅运行,在兼容性上领先于AML
TelechipsTCC8803
45nm工艺
Cortex-A81GHz/1.2GHz
512MDDR2/DDR3,32bit
视频子系统:
硬解,猜测为ARMMali-VE6
多格式,H.264,VC-1,MPEG4,RV最高1080p
GPU:
Mali-200,主频320MHz,
三角形生产率:
20M
像素填充率:
未知
代表:
万和T6
TCC8803是TCC89xx系列的升级版。
采用的ARM核心升级到Cortex-A8,主频1GHz,45nm工艺。
由于Telechips跟ARM关系不一般(TCC89xx开发板貌似就是ARMMali的参考板),猜测TCC88xx中会继续使用ARM提供的图形核和视频模块。
因此,很可能继续使用与TCC89xx相同的Mali-VE6,提供优秀的全高清解码支持。
唯一的消息是解码能力提升到了1080p50fps,大概得益于频率的提升吧。
GPU部分,唯一的消息是主频320MHz。
由于Mali-T604发布没多久,采用的可能性较小,很可能是Mali-400MP,三角形生成率30M,像素填充率为275M乘以片段引擎个数(1-4个)。
不过320MHz对于45nm来说频率并不高。
已经确认是mali-200,和TCC89xx一样。
与RK29,AML相比,GPU部分是落后了的。
性能上也确实不如。
传言山寨供应商将把TCC8803拉到很低的价格,Telechips原厂也来势汹汹,激烈的竞争不可避免。
不过原厂毕竟远在韩国,不知道这次的支持度如何,还是又得靠山寨开发商撑起天下?
目前TCC8803特点不突出,产品较少。
中芯微VC882
工艺未知
Cortex-A81GHz/1.2GHz,256KL2Cache
512M/1GDDR2,猜测为32bit
视频子系统:
硬解
多格式,目前有720p
GPU:
VivanteGC400
三角形生产率:
最高14M
像素填充率:
小于150M
代表:
海纳M8
虽然海纳M8把1280×768八寸电容屏做到了888元,价格还是挺有杀伤力的。
但目前视频能力并不明朗,而采用的GPU为GC400,性能仅RK29的GC800的一半不到,相比之下是个短柄了。
总的来世,可以看作是个国产TCC8803,相对主流的Cortex-A81GHz,外加低端的GPU。
适合上网的用户。
SamsungS5PC110/S5PV210
45nm工艺,LP
Cortex-A81GHz,512KL2Cache
512MDDR2,64bit,或者32bitDDR2+32bitOneDRAM
视频子系统:
硬解,PowerVRVXD370
多格式,H.264,VC-1,MPEG4最高1080p
GPU:
PowerVRSGX540
三角形生产率:
90M
像素填充率:
1000M
代表产品:
三星GalaxyTab,魅族m9
上一篇文章已经介绍过,已经量产芯片中的最强A8,同时配置的GPUSGX540极其强悍,唯一能与之匹敌的就是nVIDIATegra2的GPU了,而软件支持度上SGX系列更有优势。
总体来说是一颗全面且强悍的芯片。
目前山寨产品已经上市,有些零碎的消息,也有些争议,具体表现还有待确认。
只是山寨方案商的软件总是有那么点让人不放心。
而GalaxyTab定价较高,等待普及版的出现,以及小尺寸的GalaxyPlayer。
试玩Tab后整体很流畅,但部分细节还有待三星进一步优化。
目前发现,山寨/国产小厂的视频能力跟三星原厂有差距,一些720p都不能流畅。
TIOMAP3620/30/40
45nm工艺,LP
Cortex-A8800MHz/1GHz,256KL2Cache
RAM:
256/512MmDDR2,32bit
视频子系统:
IVA2+,基于C64x+DSP,430MHz
多格式,但除去爱可视,很多厂商都没做解码
MPEG4可达720p,其余格式在480p水平
3620只带IVA2,解码能力更低,最高480p
GPU:
PowerVRSGX530
三角形生产率:
14M
像素填充率:
280M
代表产品:
爱可视4370101,moto的droidXdroid2手机,B&Nnookcolor
基本就是OMAP3430的45nm版本,规格看来比较一般。
不过采用此产品的厂商软件开发都做的不错,重点说说爱可视70,虽然RAM只有256M,实际使用流畅度挺高,视频部分480p解码也基本够用,但是RMVB分辨率被限制在720*576实在令人苦恼。
总体来说,此方案的产品完善度都不错,基本上都是正规大厂产品,使用上可以放心,但价格都不低
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ARM Cortex A8A9以及高通Scorpion处理器详解 A8A9 以及 Scorpion 处理器 详解