计算机系统结构期末复习.docx
- 文档编号:2094476
- 上传时间:2022-10-26
- 格式:DOCX
- 页数:27
- 大小:970.34KB
计算机系统结构期末复习.docx
《计算机系统结构期末复习.docx》由会员分享,可在线阅读,更多相关《计算机系统结构期末复习.docx(27页珍藏版)》请在冰豆网上搜索。
计算机系统结构期末复习
第一章
计算机系统结构定义
计算机=软件+硬件(+网络)
两种定义:
定义1:
Amdahl于1964年在推出IBM360系列计算机时提出:
程序员所看到的计算机系统的属性,即概念性结构和功能特性
定义2:
计算机系统结构主要研究软硬件功能分配和对软硬件界面的确定
计算机系统的多级层次模型
第6级专用应用语言机器特定应用用户(使用特定应用语言)
(经应用程序翻译成高级语言)
第5级通用高级语言机器高级语言程序员(使用通用高级语言)
(经编译程序翻译成汇编语言)
第4级汇编语言机器汇编语言程序员(使用汇编语言)
(经汇编程序翻译成机器语言、操作系统原语)
第3级操作系统语言机器操作系统用户(使用操作系统原语)
(经原语解释子程序翻译成机器语言)
第2级传统机器语言机器传统机器程序员(使用二进制机器语言)
(由微程序解释成微指令序列)
第1级微指令语言机器微指令程序员(使用微指令语言)
(由硬件译码器解释成控制信号序列)
第0级硬联逻辑硬件设计员
第0级由硬件实现,第1级由微程序实现,第2级至第6级由软件实现,由软件实现的机器称为:
虚拟机
从学科领域来划分:
第0和第1级属于计算机组织与结构,第3至第5级是系统软件,第6级是应用软件。
它们之间仍有交叉。
第0级要求一定的数字逻辑基础;第2级涉及汇编语言程序设计的内容;第3级与计算机系统结构密切相关。
在特殊的计算机系统中,有些级别可能不存在。
计算机组成:
是计算机系统结构的逻辑实现
确定数据通路的宽度
•确定各种操作对功能部件的共享程度
•确定专用的功能部件
•确定功能部件的并行度
•设计缓冲和排队策略
•设计控制机构
•确定采用何种可靠性技术
计算机实现:
是指计算机组成的物理实现
处理机、主存储器等部件的物理结构
•器件的集成度和速度
•专用器件的设计
•器件、模块、插件、底版的划分与连接
•信号传输技术
•电源、冷却及装配技术,相关制造工艺及技术等
计算机系统结构、计算机组成和计算机实现是三个不同的概念。
系统结构是计算机系统的软硬件的界面;计算机组成是计算机系统结构的逻辑实现;计算机实现是计算机组成的物理实现。
他们各自包含不同的内容,但又有紧密的联系。
组成和实现的改进推动系统结构的进步。
Amdahl定律:
(定量原理)系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占执行时间的比例有关。
加速比公式:
Sn=T0/Tn=1/((1-Fe)+Fe/Se)(应该大于1)
加速比受Fe的限制,它越大就越有可能获得更大加速比
例子:
书10页例1.1和1.2
CPU性能公式:
Te=IC*CPI*CYCLE;
例子:
11页例1.3
计算机系统结构的分类方法:
Flynn分类(按照指令流和数据流的多倍性特征对计算机系统进行分类)冯氏分类(用最大并行度来对计算机系统进行分类)、Handler分类
计算机系统设计的主要方法:
由下往上、由上往下、由中间开始设计
计算机系统结构评价标准
MIPS=指令条数/(指令执行时间*10^6)=Fz/CPI=Fz*IPC
IPC为每个时钟周期平均执行的指令条数
例1:
计算PentiumII450处理机的运算速度。
解:
由于PentiumII450处理机的IPC=2(或CPI=0.5),Fz=450MHz
MIPS=FZ*IPC=2*450=900MIPS
等效指令速度MIPS
等效CPI
Wi:
指令使用频度。
通常:
加、减法50%,乘法15%,除法5%,程序控制15%,其它15%
例2:
我国最早研制的小型计算机DJS-130,定点16位,加法速度每秒50万次,但没有硬件乘法和除法等指令。
用软件实现乘法和除法,速度降低100倍左右,求定点等效速度。
解:
MIPS=1/((0.8/0.5)+(0.2/0.005))=0.02MIPS
即每秒2万次,由于乘法和除法用软件实现,等效速度降低了25倍。
例3如果浮点开平方操作FPSQR的比例为2%,它的CPI为100,其他浮点操作的比例为23%,它的CPI=4.0,其余指令的CPI=1.33,计算该处理机的等效CPI。
如果FPSQR操作的CPI也为4.0,重新计算等效CPI。
解:
•等效CPI1=100×2%+4×23%+1.33×75%=3.92
等效CPI2=4×25%+1.33×75%=2.00
由于改进了仅占2%的FPSQR操作的CPI,使等效速度提高了近一倍
第二章
数据表示+数据结构=数据类型
操作码的优化表示:
定长编码、HUFFMAN编码、扩展编码(***课后题****)
复杂指令系统计算机CISC:
增强指令功能,设置功能复杂的指令;面向目标代码、面向高级语言、面向操作系统;用一条指令代替一串指令
RISC精简指令系统计算机:
简化指令功能,只保留功能简单的指令;较复杂的功能用子程序来实现
较复杂的功能用子程序来实现
RISC的思想精华:
减少指令平均执行周期数(CPI)
RISC的特点
(1)简单而统一格式的指令译码。
(2)大部分指令可以单周期执行完成。
(3)只有LOAD和STORE指令可以访问存储器。
(4)简单的寻址方式。
(5)采用延迟转移技术。
(6)采用LOAD延迟技术。
RISC的关键技术
1、延时转移技术(名词)
定义:
为了使指令流水线不断流,在转移指令之后插入一条有效的指令,而转移指令被延迟执行,这种技术称为延迟转移技术。
采用指令延迟转移技术时,指令序列的调整由编译器自动进行。
采用延迟转移技术的两个限制条件
(1)被移动指令在移动过程中所经过的指令之间不能有数据相关
(2)被移动的指令不破坏条件码,至少不影响后面的指令使用条件码
如果找不到符号条件的指令,必须在条件转移指令后面插入空操作
如果指令的执行过程分为多个流水段,则要插入多条指令
2、指令取消技术
原因:
采用指令延时技术,在许多情况下找不到可以用来调整的指令
向后转移(循环程序)
实现方法:
循环体的第一条指令经调整后安排在两个位置,第一个位置是在循环体的前面,第二个位置安排在循环体的后面,
如果转移成功,则执行循环体后面的指令,然后返回到循环体开始;否则,则取消循环体后面的指令,继续执行后面的指令
3、重叠寄存器窗口技术(OverlappingRegisterWindow)
原因:
RISC中,子程序比CISC中多,因传送参数而访存的信息量很大
美国加洲大学伯克利分校的FBaskett提出
实现方法:
设置一个数量比较大的寄存器堆,并把它划分成很多个窗口。
在每个过程使用的几个窗口中有一个窗口是与前一个过程共用,还有一个窗口是与下一个过程共用。
效果:
可以减少大量的访存操作。
当寄存器溢出时,要在主存中开辟一个堆栈
4、指令流调整技术
目标:
通过变量重新命名消除数据相关,提高流水线效率
5、以硬件为主固件为辅
固件的主要缺点是:
执行速度低
主要优点是:
便于实现复杂指令,便于修改指令系统
RISC主要采用硬联逻辑来实现指令系统
对于复杂指令,也用微程序技术实现。
第三章
存储系统:
(或存储体系、存储层次)
定义:
两个或两个以上速度、容量和价格各不相同的存储器用硬件、软件、或软件与硬件相结合的方法连接起来成为一个系统。
这个系统对应用程序员透明,并且,从应用程序员看,它是一个存储器,这个存储器的速度接近速度最快的那个存储器,存储容量与容量最大的那个存储器相等,单位容量的价格接近最便宜的那个存储器。
在一般计算机系统中,主要有两种存储系统:
(1)Cache存储系统:
由Cache和主存储器构成
主要目的:
提高存储器速度
(2)虚拟存储系统:
由主存储器和磁盘存储器构成
主要目的:
扩大存储器容量磁盘存储器主存储器
存储器访问的局部性原理实质:
根据程序运行的最近情况,可以较为精确的预测出最近的将来将要访问哪些指令和数据。
(1)时间局部性:
最近访问过的代码在很短的时间内有可能被再次访问;主要对应于循环语句;
(2)空间局部性:
与刚被访问过的指令或数据相邻的指令或数据有可能马上被访问;主要对应于顺序执行的语句。
访问的局部性原理是构成层次化存储系统的理论基础。
存储器的主要性能指标:
速度、容量和价格
存储容量的单位价格公式:
当S2>>S1时,C≈C2。
因此,整个存储系统的单位容量价格C接近于比较便宜的M2存储器的单位容量价格C2。
但是S2于S1不能相差太大,否则,存储系统要达到比较高的性能,调度起来很困难。
存储系统的容量
•要求:
存储系统的容量等于M2存储器的容量
•提供尽可能大的地址空间,且能够随机访问
•方法有两种:
•1、只对M2存储器进行编址,M1存储器只在内部编址
2、另外设计一个容量很大的逻辑地址空间
存储系统的速度
速度用存储器的读出时间、访问周期、频带宽度等表示。
读出时间:
“读”命令有效到数据总线数据有效的时间间隔TA;
访问周期:
单体存储器连续两次读写操作的最小时间间隔TM;
TM>TA
命中率H=N1/(N1+N2)N1和N2分别代表对M1存储器和M2存储器的访问次数
访问周期T=H*T1+(1-H)*T2,当命中率H很大时,访问周期T接近于速度比较快的M1存储器的访问周期T1
存储器的访问效率为e=T1/T=1/H+(1-H)*T2/T1
所以访问效率主要与H和T2/T1值有关。
H越大越好,T2/T1越小越好,可这个值通常在10^5很难变小,所以主要通过提高命中率来提高访问效率
例:
假设T2=5T1,在命中率H为0.9和0.99两种情况下,分别计算存储系统的访问效率。
解:
当H=0.9时,e1=1/(0.9+5(1-0.9))=0.72
当H=0.99时,e2=1/(0.99+5(1-0.99))=0.96
采用预取技术可以大幅度提高命中率。
方法是:
当不命中时,在数据从主存储器中取出送往CPU的同时,把主存储器相邻几个单元中的数据(称为一个数据块)都取出来送入CACHE。
H’=(H+N-1)/N,其中N为CACHE的块大小与数据块重复使用次数的乘积,H是原来的命中率,H’是采用预取技术之后的命中率
例:
在一个虚拟存储系统中,T2=105T1,原来的命中率只有0.8,现采用预取技术,访问磁盘存储器的数据块大小为4K字,如果要求访问效率不低于0.9,计算数据在主存储器中的重复利用率至少为多少?
解:
假设数据在主存储器中的重复利用率为m,根据前面的给出关系:
解这个方程组,得到m=44,即数据在主存储器中的重复利用率至少为44次。
例:
Cache存储系统中,Cache的访问周期为10ns,主存储器的访问周期为60ns,每个数据在Cache中平均重复使用4次。
块的大小为1个字时,存储系统的访问效率只有0.5,现在要提高增加块的大小,使存储系统的访问效率达到0.94。
1、当存储系统的访问效率为0.5时,计算命中率和等效访问周期;
2、为了使存储系统的访问效率达到0.94,命中率和等效访问周期应当为多少?
3、为了使存储系统的访问效率从0.5提高到0.94,块的大小至少要增加到几个字?
存储器的频带平衡:
计算机系统中各级存储器的频带应该达到平衡
解决存储器频带平衡方法
(1)多个存储器并行工作(本节)
并行访问存储器
交叉访问存储器
高位交叉访问存储器。
主要目的:
扩大存储器容量实现方法:
用地址码的高位部分区分存储体号
低位交叉访问存储器。
主要目的:
提高存储器访问速度实现方法:
用地址码的低位部分区分存储体号
低位交叉比高位交叉更常用
无访问冲突并行存储器
(2)设置各种缓冲存储器(第五章)
(3)采
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机系统 结构 期末 复习