《计算机系统结构教学资料》第四章作业答案..ppt
- 文档编号:713120
- 上传时间:2022-10-12
- 格式:PPT
- 页数:13
- 大小:388.51KB
《计算机系统结构教学资料》第四章作业答案..ppt
《《计算机系统结构教学资料》第四章作业答案..ppt》由会员分享,可在线阅读,更多相关《《计算机系统结构教学资料》第四章作业答案..ppt(13页珍藏版)》请在冰豆网上搜索。
1、若有一静态多功能流水线分为6段,如下图所示,其中乘法流水线由1、2、3、6段组成,加法流水线由1、4、5、6段组成。
使用流水线时,要等某种功能(如加法)操作都处理完毕后才能转换成另一种功能(如乘法)。
若要计算:
AB=(a1+b1)(a2+b2)(a3+b3)问:
(1)在上述流水方式下,完成AB需多少时间?
画出时空图并计算此流水线的使用效率和吞吐率。
(2)与顺序运算方式相比,加速比为多少?
2,T,解:
(1),1,2,3,4,1,2,3,4,4,5,5,5,1,2,3,1,2,3,19,S,6,1,2,3,4,5,4,5,完成A*B需要的时间=19,效率为:
吞吐率为:
(2)加速比为:
2、已知某单功能非线性流水线的预约表如下图,要求:
(1)列出禁止表F和冲突向量C。
(2)画出该流水线状态图,确定其最小平均延迟以及此时的调度方案?
当按此流水调度方案共输入8个任务时,则其实际吞吐率为多少?
附图,解:
(1)禁止表F=4冲突向量C=(1000)
(2)最佳调度策略(1,1,1,5)吞吐率=8/17t,=5,=5,=5,=5,=5,=5,=5,=5,1,2,3,2,3,3,1,3,2,1,1,2,各种调度方案及其相应的平均延迟:
3、有一个双输入端的加-乘双功能静态流水线,由经过时间为t、t、2t、t的1、2、3、4四个子过程构成。
加按124连接,乘按134连接,流水线输出设有数据缓冲器,也可将数据直接返回输入。
现要执行A*(B+C*(D+E*F)+G*H的运算,请调整计算顺序,画出能获得吞吐率尽量高的流水时空图,标出流水线入、出端数据的变化情况,求出完成全部运算的时间及此期间整个流水线吞吐率,效率,加速比?
如对流水线瓶颈子过程再细分,最少只需多少时间可完成全部运算?
若子过程3不能再细分,只能用并联方法改进,问流水线的效率为多少?
解:
根据题意,对算法经调整后,能使流水吞吐率尽量高的流水时空图如图所示。
图中已标出了流水线入、出端的数据变化情况。
S,1,2,3,4,1,2,1,2,1,2,3,3,3,1,2,3,4,5,6,4,5,4,5,6,6,4,5,6,7,8,7,8,7,8,9,9,9,输入,输出,AC,EF,AB,GH,ACD,ACEF,ABACD,ACEFGH,ACEF+GHACD+AB,AC,EF,AB,GH,ACD,ACEF,ACD+AB,ACEF+GH,ACEF+GH+ACD+AB,21t,S,1,2,31,32,1,2,1,3,2,4,3,5,6,4,5,6,7,8,7,8,7,8,9,9,9,根据上图的流水时空图,可以看出,完成全部运算的时间为21t。
如果现在将瓶颈子过程3细分成两个子过程,则时空图如下图所示。
4,1,3,2,4,5,6,1,3,2,4,5,6,16t,S,1,2,31,32,1,2,1,3,1,3,3,5,5,4,5,6,7,8,7,8,7,8,9,9,9,4,2,4,2,4,6,6,1,3,2,4,5,6,16t,由上图可见,完成全部运算最少需要16t的时间即可。
现在若子过程3不能再细分了,只能用2个子过程3通过并联来改进,则其时空图如下图所示。
完成全部运算时的流水线效率,4、超级标量机和超级流水线机都能开发指令级的并行性,现假定这两种机器的流水线都为4段,每段均需1个时钟周期。
若在超级标量机中,每个时钟周期可同时启动3条指令,而超级流水线机中则是每隔1/3时钟周期启动一条指令。
现若要执行6条指令的代码序列,问在两种机器上各需用多少个时钟周期方可执行完毕?
解:
超级标量机需5个时钟周期,超级流水线机需5.67个时钟周期。
5、在CRAY-1机上,V是向量寄存器,设向量长度均为32。
S是标量寄存器,所用浮点功能执行部件的执行时间分别为:
加法需6拍,相乘需7拍,从存储器读存数需6拍,求倒数近似值及除法需14拍,写入寄存器及启动功能部件(包括存储器)各需1拍。
问下列各指令组中的哪些指令可以链接?
哪些指令不可链接?
哪些指令可以并行执行?
试说明其原因并分别计算出各指令组全部完成所需的拍数。
(1)V0存储器
(2)V2V0+V1V1V2+V3V3存储器V4V5*V6V4V2*V3(3)V0存储器(4)V0存储器V3V1+V2V11/V0V4V0*V3V3V1+V2V6V4+V5V5V3*V4(5)V0存储器(6)V3存储器V1V2+V3V2V0+V1V4V5*V6s0s2+s3s0s1+s2V3V1*V4(7)V3存储器(8)V0存储器V2V0+V1V2V0+V1V4V2*V3V3V1+V2存储器V4V5V3*V4,解:
(1)三条指令可全并行执行,需(1+7+1)+(32-1)=40(拍)
(2)前两条并行,和第三条链接,需(1+7+1)+(1+6+1)+(32-1)=48拍(3)前两条并行和第三条链接,而第四条指令与第三条指令串行(因第二条和第四条功能部件冲突),需(1+6+1)+(1+7+1)+(32-1)+(1+6+1)+(32-1)=87拍(4)全部链接(1+6+1)+(1+14+1)+(1+6+1)+(1+7+1)+(32-1)=72拍(5)全并行执行,需(1+7+1)+(32-1)=40(拍)(6)前三条指令并行,与第四条指令串行(V1源操作数冲突),需(1+6+1)+(32-1)+(1+7+1)+(32-1)=79拍(7)前两条指令并行,与第三条链接,再与第四条串行(因第一条和第四条冲突),需(1+6+1)+(1+7+1)+(32-1)+(1+6+1)+(32-1)=87拍(8)前两条指令链接,与第三条串行(V1源操作数冲突),与第四条链接,需(1+6+1)+(1+6+1)+(32-1)+(1+6+1)+(1+7+1)+(32-1)=95拍,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机系统结构教学资料 计算机系统 结构 教学 资料 第四 作业 答案