CPU制作过程.docx
- 文档编号:6423755
- 上传时间:2023-01-06
- 格式:DOCX
- 页数:48
- 大小:251.71KB
CPU制作过程.docx
《CPU制作过程.docx》由会员分享,可在线阅读,更多相关《CPU制作过程.docx(48页珍藏版)》请在冰豆网上搜索。
CPU制作过程
CPU的制作过程详解
现在市场上产品丰富,琳琅满目,当你使用着配置了最新款CPU的电脑在互联网上纵横驰骋,在各种程序应用之间操作自如的时候,有没有兴趣去想一想这个头不大、功能不小的CPU是怎么制作出来的呢。
在今天的半导体制造业中,计算机中央处理器无疑是受关注程度最高的领域,而这个领域中众所周知的两大巨头,其所遵循的处理器架构均为x86,而另外一家号称信息产业的蓝色巨人的IBM,也拥有强大的处理器设计与制造能力,它们最先发明了应变硅技术,并在90纳米的处理器制造工艺上走在最前列。
在今天的文章中,我们将一步一步的为您讲述中央处理器从一堆沙子到一个功能强大的集成电路芯片的全过程。
制造CPU的基本原料
如果问及CPU的原料是什么,大家都会轻而易举的给出答案—是硅。
这是不假,但硅又来自哪里呢?
其实就是那些最不起眼的沙子。
难以想象吧,价格昂贵,结构复杂,功能强大,充满着神秘感的CPU竟然来自那根本一文不值的沙子。
当然这中间必然要经历一个复杂的制造过程才行。
不过不是随便抓一把沙子就可以做原料的,一定要精挑细选,从中提取出最最纯净的硅原料才行。
试想一下,如果用那最最廉价而又储量充足的原料做成CPU,那么成品的质量会怎样,你还能用上像现在这样高性能的处理器吗?
除去硅之外,制造CPU还需要一种重要的材料就是金属。
目前为止,铝已经成为制作处理器内部配件的主要金属材料,而铜则逐渐被淘汰,这是有一些原因的,在目前的CPU工作电压下,铝的电迁移特性要明显好于铜。
所谓电迁移问题,就是指当大量电子流过一段导体时,导体物质原子受电子撞击而离开原有位置,留下空位,空位过多则会导致导体连线断开,而离开原位的原子停留在其它位置,会造成其它地方的短路从而影响芯片的逻辑功能,进而导致芯片无法使用。
这就是许多NorthwoodPentium4换上SNDS(北木暴毕综合症)的原因,当发烧友们第一次给NorthwoodPentium4超频就急于求成,大幅提高芯片电压时,严重的电迁移问题导致了CPU的瘫痪。
这就是intel首次尝试铜互连技术的经历,它显然需要一些改进。
不过另一方面讲,应用铜互连技术可以减小芯片面积,同时由于铜导体的电阻更低,其上电流通过的速度也更快。
除了这两样主要的材料之外,在芯片的设计过程中还需要一些种类的化学原料,它们起着不同的作用,这里不再赘述。
CPU制造的准备阶段
在必备原材料的采集工作完毕之后,这些原材料中的一部分需要进行一些预处理工作。
而作为最主要的原料,硅的处理工作至关重要。
首先,硅原料要进行化学提纯,这一步骤使其达到可供半导体工业使用的原料级别。
而为了使这些硅原料能够满足集成电路制造的加工需要,还必须将其整形,这一步是通过溶化硅原料,然后将液态硅注入大型高温石英容器而完成的。
而后,将原料进行高温溶化。
中学化学课上我们学到过,许多固体内部原子是晶体结构,硅也是如此。
为了达到高性能处理器的要求,整块硅原料必须高度纯净,及单晶硅。
然后从高温容器中采用旋转拉伸的方式将硅原料取出,此时一个圆柱体的硅锭就产生了。
从目前所使用的工艺来看,硅锭圆形横截面的直径为200毫米。
不过现在intel和其它一些公司已经开始使用300毫米直径的硅锭了。
在保留硅锭的各种特性不变的情况下增加横截面的面积是具有相当的难度的,不过只要企业肯投入大批资金来研究,还是可以实现的。
intel为研制和生产300毫米硅锭而建立的工厂耗费了大约35亿美元,新技术的成功使得intel可以制造复杂程度更高,功能更强大的集成电路芯片。
而200毫米硅锭的工厂也耗费了15亿美元。
下面就从硅锭的切片开始介绍CPU的制造过程。
单晶硅锭
在制成硅锭并确保其是一个绝对的圆柱体之后,下一个步骤就是将这个圆柱体硅锭切片,切片越薄,用料越省,自然可以生产的处理器芯片就更多。
切片还要镜面精加工的处理来确保表面绝对光滑,之后检查是否有扭曲或其它问题。
这一步的质量检验尤为重要,它直接决定了成品CPU的质量。
新的切片中要掺入一些物质而使之成为真正的半导体材料,而后在其上刻划代表着各种逻辑功能的晶体管电路。
掺入的物质原子进入硅原子之间的空隙,彼此之间发生原子力的作用,从而使得硅原料具有半导体的特性。
今天的半导体制造多选择CMOS工艺(互补型金属氧化物半导体)。
其中互补一词表示半导体中N型MOS管和P型MOS管之间的交互作用。
而N和P在电子工艺中分别代表负极和正极。
多数情况下,切片被掺入化学物质而形成P型衬底,在其上刻划的逻辑电路要遵循nMOS电路的特性来设计,这种类型的晶体管空间利用率更高也更加节能。
同时在多数情况下,必须尽量限制pMOS型晶体管的出现,因为在制造过程的后期,需要将N型材料植入P型衬底当中,而这一过程会导致pMOS管的形成。
在掺入化学物质的工作完成之后,标准的切片就完成了。
然后将每一个切片放入高温炉中加热,通过控制加温时间而使得切片表面生成一层二氧化硅膜。
通过密切监测温度,空气成分和加温时间,该二氧化硅层的厚度是可以控制的。
在intel的90纳米制造工艺中,门氧化物的宽度小到了惊人的5个原子厚度。
这一层门电路也是晶体管门电路的一部分,晶体管门电路的作用是控制其间电子的流动,通过对门电压的控制,电子的流动被严格控制,而不论输入输出端口电压的大小。
准备工作的最后一道工序是在二氧化硅层上覆盖一个感光层。
这一层物质用于同一层中的其它控制应用。
这层物质在干燥时具有很好的感光效果,而且在光刻蚀过程结束之后,能够通过化学方法将其溶解并除去。
光刻蚀
这是目前的CPU制造过程当中工艺非常复杂的一个步骤,为什么这么说呢?
光刻蚀过程就是使用一定波长的光在感光层中刻出相应的刻痕,由此改变该处材料的化学特性。
这项技术对于所用光的波长要求极为严格,需要使用短波长的紫外线和大曲率的透镜。
刻蚀过程还会受到晶圆上的污点的影响。
每一步刻蚀都是一个复杂而精细的过程。
设计每一步过程的所需要的数据量都可以用10GB的单位来计量,而且制造每块处理器所需要的刻蚀步骤都超过20步(每一步进行一层刻蚀)。
而且每一层刻蚀的图纸如果放大许多倍的话,可以和整个纽约市外加郊区范围的地图相比,甚至还要复杂,试想一下,把整个纽约地图缩小到实际面积大小只有100个平方毫米的芯片上,那么这个芯片的结构有多么复杂,可想而知了吧。
当这些刻蚀工作全部完成之后,晶圆被翻转过来。
短波长光线透过石英模板上镂空的刻痕照射到晶圆的感光层上,然后撤掉光线和模板。
通过化学方法除去暴露在外边的感光层物质,而二氧化硅马上在陋空位置的下方生成。
掺杂
在残留的感光层物质被去除之后,剩下的就是充满的沟壑的二氧化硅层以及暴露出来的在该层下方的硅层。
这一步之后,另一个二氧化硅层制作完成。
然后,加入另一个带有感光层的多晶硅层。
多晶硅是门电路的另一种类型。
由于此处使用到了金属原料(因此称作金属氧化物半导体),多晶硅允许在晶体管队列端口电压起作用之前建立门电路。
感光层同时还要被短波长光线透过掩模刻蚀。
再经过一部刻蚀,所需的全部门电路就已经基本成型了。
然后,要对暴露在外的硅层通过化学方式进行离子轰击,此处的目的是生成N沟道或P沟道。
这个掺杂过程创建了全部的晶体管及彼此间的电路连接,没个晶体管都有输入端和输出端,两端之间被称作端口。
重复这一过程
从这一步起,你将持续添加层级,加入一个二氧化硅层,然后光刻一次。
重复这些步骤,然后就出现了一个多层立体架构,这就是你目前使用的处理器的萌芽状态了。
在每层之间采用金属涂膜的技术进行层间的导电连接。
今天的P4处理器采用了7层金属连接,而Athlon64使用了9层,所使用的层数取决于最初的版图设计,并不直接代表着最终产品的性能差异。
接下来的几个星期就需要对晶圆进行一关接一关的测试,包括检测晶圆的电学特性,看是否有逻辑错误,如果有,是在哪一层出现的等等。
而后,晶圆上每一个出现问题的芯片单元将被单独测试来确定该芯片有否特殊加工需要。
而后,整片的晶圆被切割成一个个独立的处理器芯片单元。
在最初测试中,那些检测不合格的单元将被遗弃。
这些被切割下来的芯片单元将被采用某种方式进行封装,这样它就可以顺利的插入某种接口规格的主板了。
大多数intel和AMD的处理器都会被覆盖一个散热层。
在处理器成品完成之后,还要进行全方位的芯片功能检测。
这一部会产生不同等级的产品,一些芯片的运行频率相对较高,于是打上高频率产品的名称和编号,而那些运行频率相对较低的芯片则加以改造,打上其它的低频率型号。
这就是不同市场定位的处理器。
而还有一些处理器可能在芯片功能上有一些不足之处。
比如它在缓存功能上有缺陷(这种缺陷足以导致绝大多数的CPU瘫痪),那么它们就会被屏蔽掉一些缓存容量,降低了性能,当然也就降低了产品的售价,这就是Celeron和Sempron的由来。
在CPU的包装过程完成之后,许多产品还要再进行一次测试来确保先前的制作过程无一疏漏,且产品完全遵照规格所述,没有偏差。
核心(Die)又称为内核,是CPU最重要的组成部分。
CPU中心那块隆起的芯片就是核心,是由单晶硅以一定的生产工艺制造出来的,CPU所有的计算、接受/存储命令、处理数据都由核心执行。
各种CPU核心都具有固定的逻辑结构,一级缓存、二级缓存、执行单元、指令级单元和总线接口等逻辑单元都会有科学的布局。
为了便于CPU设计、生产、销售的管理,CPU制造商会对各种CPU核心给出相应的代号,这也就是所谓的CPU核心类型。
不同的CPU(不同系列或同一系列)都会有不同的核心类型(例如Pentium4的Northwood,Willamette以及K6-2的CXT和K6-2+的ST-50等等),甚至同一种核心都会有不同版本的类型(例如Northwood核心就分为B0和C1等版本),核心版本的变更是为了修正上一版存在的一些错误,并提升一定的性能,而这些变化普通消费者是很少去注意的。
每一种核心类型都有其相应的制造工艺(例如0.25um、0.18um、0.13um以及0.09um等)、核心面积(这是决定CPU成本的关键因素,成本与核心面积基本上成正比)、核心电压、电流大小、晶体管数量、各级缓存的大小、主频范围、流水线架构和支持的指令集(这两点是决定CPU实际性能和工作效率的关键因素)、功耗和发热量的大小、封装方式(例如S.E.P、PGA、FC-PGA、FC-PGA2等等)、接口类型(例如Socket370,SocketA,Socket478,SocketT,Slot1、Socket940等等)、前端总线频率(FSB)等等。
因此,核心类型在某种程度上决定了CPU的工作性能。
一般说来,新的核心类型往往比老的核心类型具有更好的性能(例如同频的Northwood核心Pentium41.8AGHz就要比Willamette核心的Pentium 41.8GHz性能要高),但这也不是绝对的,这种情况一般发生在新核心类型刚推出时,由于技术不完善或新的架构和制造工艺不成熟等原因,可能会导致新的核心类型的性能反而还不如老的核心类型的性能。
例如,早期Willamette核心Socket423接口的Pentium4的实际性能不如Socket370接口的Tualatin核心的PentiumIII和赛扬,现在的低频Prescott核心Pentium4的实际性能不如同频的Northwood核心Pentium4等等,但随着技术的进步以及CPU制造商对新核心的不断改进和完善,新核心的中后期产品的性能必然会超越老核心产品。
CPU核心的发展方向是更低的电压、更低的功耗、更先进的制造工艺、集成更多的晶体管、更小的核心面积(这会降低CPU的生产成本从而最终会降低CPU的销售价格)、更先进的流水线架构和更多的指令集、更高的前端总线频率、集成更多的功能(例如集成内存控制器等等)以及双核心和多核心(也就是1个CPU内部有2个或更多个核心)等。
CPU核心的进步对普通消费者而言,最有意义的就是能以更低的价格买到性能更强的CPU。
AthlonXP的核心类型
AthlonXP有4种不同的核心类型,但都有共同之处:
都采用SocketA接口而且都采用PR标称值标注。
Palomino
这是最早的AthlonXP的核心,采用0.18um制造工艺,核心电压为1.75V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为266MHz。
Thoroughbred
这是第一种采用0.13um制造工艺的AthlonXP核心,又分为Thoroughbred-A和Thoroughbred-B两种版本,核心电压1.65V-1.75V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为266MHz和333MHz。
Thorton
采用0.13um制造工艺,核心电压1.65V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为333MHz。
可以看作是屏蔽了一半二级缓存的Barton。
Barton
采用0.13um制造工艺,核心电压1.65V左右,二级缓存为512KB,封装方式采用OPGA,前端总线频率为333MHz和400MHz。
新Duron的核心类型
AppleBred
采用0.13um制造工艺,核心电压1.5V左右,二级缓存为64KB,封装方式采用OPGA,前端总线频率为266MHz。
没有采用PR标称值标注而以实际频率标注,有1.4GHz、1.6GHz和1.8GHz三种。
Athlon64系列CPU的核心类型
Clawhammer
采用0.13um制造工艺,核心电压1.5V左右,二级缓存为1MB,封装方式采用mPGA,采用HyperTransport总线,内置1个128bit的内存控制器。
采用Socket754、Socket940和Socket939接口。
Newcastle
其与Clawhammer的最主要区别就是二级缓存降为512KB(这也是AMD为了市场需要和加快推广64位CPU而采取的相对低价政策的结果),其它性能基本相同。
AthlonXP的核心类型
AthlonXP有4种不同的核心类型,但都有共同之处:
都采用SocketA接口而且都采用PR标称值标注。
Palomino
这是最早的AthlonXP的核心,采用0.18um制造工艺,核心电压为1.75V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为266MHz。
Thoroughbred
这是第一种采用0.13um制造工艺的AthlonXP核心,又分为Thoroughbred-A和Thoroughbred-B两种版本,核心电压1.65V-1.75V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为266MHz和333MHz。
目前Intel推出的双核心处理器有PentiumD和PentiumExtremeEdition,同时推出945/955芯片组来支持新推出的双核心处理器,采用90nm工艺生产的这两款新推出的双核心处理器使用是没有针脚的LGA775接口,但处理器底部的贴片电容数目有所增加,排列方式也有所不同。
桌面平台的核心代号Smithfield的处理器,正式命名为PentiumD处理器,除了摆脱阿拉伯数字改用英文字母来表示这次双核心处理器的世代交替外,D的字母也更容易让人联想起Dual-Core双核心的涵义。
Intel的双核心构架更像是一个双CPU平台,PentiumD处理器继续沿用Prescott架构及90nm生产技术生产。
PentiumD内核实际上由于两个独立的2独立的Prescott核心组成,每个?
目前Intel推出的双核心处理器有PentiumD和PentiumExtremeEdition,同时推出945/955芯片组来支持新推出的双核心处理器,采用90nm工艺生产的这两款新推出的双核心处理器使用是没有针脚的LGA775接口,但处理器底部的贴片电容数目有所增加,排列方式也有所不同。
桌面平台的核心代号Smithfield的处理器,正式命名为PentiumD处理器,除了摆脱阿拉伯数字改用英文字母来表示这次双核心处理器的世代交替外,D的字母也更容易让人联想起Dual-Core双核心的涵义。
Intel的双核心构架更像是一个双CPU平台,PentiumD处理器继续沿用Prescott架构及90nm生产技术生产。
PentiumD内核实际上由于两个独立的2独立的Prescott核心组成,每个核心拥有独立的1MBL2缓存及执行单元,两个核心加起来一共拥有2MB,但由于处理器中的两个核心都拥有独立的缓存,因此必须保正每个二级缓存当中的信息完全一致,否则就会出现运算错误。
MCH协调两颗核心之间的相互调用
为了解决这一问题,Intel将两个核心之间的协调工作交给了外部的MCH(北桥)芯片,虽然缓存之间的数据传输与存储并不巨大,但由于需要通过外部的MCH芯片进行协调处理,毫无疑问的会对整个的处理速度带来一定的延迟,从而影响到处理器整体性能的发挥。
由于采用Prescott内核,因此PentiumD也支持EM64T技术、XDbit安全技术。
值得一提的是,PentiumD处理器将不支持Hyper-Threading技术。
原因很明显:
在多个物理处理器及多个逻辑处理器之间正确分配数据流、平衡运算任务并非易事。
比如,如果应用程序需要两个运算线程,很明显每个线程对应一个物理内核,但如果有3个运算线程呢?
因此为了减少双核心PentiumD架构复杂性,英特尔决定在针对主流市场的PentiumD中取消对Hyper-Threading技术的支持。
同出自Intel之手,而且PentiumD和PentiumExtremeEdition两款双核心处理器名字上的差别也预示着这两款处理器在规格上也不尽相同。
其中它们之间最大的不同就是对于超线程(Hyper-Threading)技术的支持。
PentiumD不能支持超线程技术,而PentiumExtremeEdition则没有这方面的限制。
在打开超线程技术的情况下,双核心PentiumExtremeEdition处理器能够模拟出另外两个逻辑处理器,可以被系统认成四核心系统。
前言:
受硬件发烧友追捧的Athlon64处理器在2004年下半年开始改用90nm制程的新核心。
目前,90nmK8Winchester核心已经广泛应用在Socket939Athlon643000+、3200+和3500+和Socket939、754Sempron处理器系列中。
然而Winchester并不能完全取代此前采用130nm制程的Athlon64处理器核心。
之所以这样,里面有诸多原因,其中最大的问题是Winchester核心的频率提升潜力的并不是很理想。
与130nm核心相比,尽管它拥有较低的电源消费量及热量,但基于Winchester核心的处理器最大实际工作频率仅仅只有2.2GHz。
这也是为什么拥有2.4GHz和2.6GHz核心频率的Athlon64顶级型号及Athlon64FX-55仍然基于采用0.13微米制程的Newcastle和ClawHammer旧核心的原因。
然而,AMD宣称将在2005年4月开始停产基于旧制程核心的Athlon64处理器了。
正是在这种情况下,第一款基于Winchester核心的处理器诞生了!
AMD公司的工程师们已经完成了大量工作。
他们设计了一个新的90nmVenice核心(E3改进版),它应该会让130nm旧核心成为历史。
对新核心寄予的巨大希望是基于这个事实的:
AMD开始引入专门对Venice核心使用的新生产标准了。
当然,这个新核心并不仅仅只用来取代低频Athlon64型号的Winchester核心、将新功能性、新特性能引入到了这些处理器之中那么简单,同时也将取代在顶级Athlon64处理器中使用的Newcastle和ClawHammer核心。
而且Venice的到来为更快的Athlon64处理器型号的发布亮起了绿灯。
在不远的将来,AMD预计会发布基于Venice和SanDiego核心(SanDiego是Venice的改进版,具有更大的L2缓存)的Athlon644200+和Athlon64FX-57新处理器。
那么新的Venice核心将为Athlon64带来多大的新意思呢?
这就是本文所要探讨的主要话题!
CPU核心详解
一、Venice核心新在那里?
—三大新特性!
1、DualStressLiner(DSL)技术
在2004年末,AMD和IBM联合公布在晶体管工艺领域取得突破。
这两家公司的工程师共同开发了一项称为DualStressLiner的技术,可以将半导体晶体管的响应速度提高24%。
其实这技术背后的原理是相当简单的。
事实上,DSL很类似于英特尔在90nm生产技术中引入的应变硅技术。
我们都知道,晶体管越微细化,运行速度就越高,但同时也会引发泄漏电流增加、开关效率降低,从而导致耗电和发热量的增加。
而DualStressLiner通过向晶体管的硅层施加应力,同时实现了速度的提高与耗电量的降低。
换句话说,DSL能改变硅之间的原子格,从而让晶体管获得更快的响应时间及更低的热量。
在一种情况下硅原子是被“拉开”的,而在另一种情况下则是“挤在一起”的,这通过把它们移到一个具有要么伸展,要么压紧的原子格的氮化物封闭层上来实现。
与Intel使用的应变硅不同,来自AMD和IBM的DSL能够被用于两种类型的晶体管:
NMOS和PMOS(具有n和p通道)而无需使用极难获得的硅锗层,硅锗层会增加成本,并且有可能影响芯片的产量。
DSL这种双重性性,让它比英特尔的应变硅更有效:
DSL可以将晶体管的响应速度提升24%,而应变硅能提供的最大改进在15-20%。
并且更重要的是,AMD和IBM这项新技术对产量及生产成本并没有任何负面影响。
由于在生产时无需使用新的生产方法,所以使用标准生产设备和材料便可迅速展开量产。
另外,配合使用硅绝缘膜构造(SOI,绝缘体上硅)与应变硅,还可生产性能更高、耗电更低的晶体管。
新的Venice处理器核心是AMD第一款应用DualStressLiner技术的桌面处理器。
这项新技术与目前的SOI技术共同使用可以让基于Venice的处理器能够达到更高的核心工作时钟频率。
AMD工程师们预料,DualStressLiner和SOI一起结合可以让Athlon64处理器的频率潜力有大约16%的增长。
换句话说,基于Venice的CPU应该拥有达到2.8GHz的标称频率。
2、支持SSE3指令集
在生产技术转换过程中也引入了一些更具切实意义的东西。
我们应该首先指出Venice处理器核心所支持的SIMD指令集有所扩展。
目前基于Venice核心上的Athlon64已经提供对SSE3指令的支持,就象基于象基于Prescott核心的Pentium4处理器一样。
然而,需要提醒你的是SSE3并不是一个完整的指令集,但仅仅只是SSE2指令集的扩展版本。
因此,Venice所支持SSE3指令集包括11条新指令:
(1)ADDPS,HSUBPS,HADDPD,HSUBPD
这几条是优化命令,它们能有效地优化标量向量乘积的计算,可以对程序起到自动优化的作用。
这些指令对处理3D图形相当有用。
(2)ADDSUBPS,ADDSU
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CPU 制作 过程