专业英语翻译.docx
- 文档编号:27718177
- 上传时间:2023-07-04
- 格式:DOCX
- 页数:22
- 大小:37.33KB
专业英语翻译.docx
《专业英语翻译.docx》由会员分享,可在线阅读,更多相关《专业英语翻译.docx(22页珍藏版)》请在冰豆网上搜索。
专业英语翻译
第三章
GraphicsProcessingUnits···············useofastandardCPU.
图形处理单元(GPU),其中常见的陪在消费者PC标准的中央处理单元(CPU),有效率的特殊目的而设计的处理器ciently执行必要的计算,产生程序数据的可视化输出。
视频游戏有特别高的渲染需求,这个市场已带动了GPU的发展,在比较的CPU,提供了极高的性能货币成本。
当然,利益的处理能力是否已经产生GPU的要约可以利用更多的通用计算(见[1])。
在
尤其是有潜力使用GPU来提升传统的高性能计算系统,如HPCx常用做模拟类型的性能。
有挑战要克服,但是,要实现这一潜力。
放置在GPU上的要求,从本地应用程序,然而,通常相当独特的,因此GPU架构是相当不同的CPU。
图形处理本身极为并行可高度线程执行在GPU处理核心的大量发现(通常是数百个)芯片。
GPU内存系统是完全不同的标准CPU相当于系统。
此外,GPU架构,反映了一个事实,一般的图形处理不需要科学模拟的准确性和精度相同的水平。
目前需要专门的软件开发,使应用程序能够有效地利用GPU架构。
这份报告首次给出了在GPU上的科学计算的讨论。
然后,我们描述的NVIDIATeslaGPUHPC基准测试应用程序的移植架构,并给出性能测试结果相比,使用一个标准的CPU。
2Background
2Background
2.1GPUs
·····································forexample.
2背景
2.1的GPU
GPU和CPU之间的主要区别是,虽然现代CPU包含了一些高功能的核心,图形芯片通常包含100个或更多的基本核心。
图形芯片还拥有更大的内存比CPU的总线宽度,导致更快的内存存取。
GPU时钟频率通常比CPU的低,但这种差距已经在过去几年关闭。
如渲染的应用程序是高度平行的性质,并能保持核心的繁忙,导致不易这么高的水平,并行化标准CPU.For应用使用较显着的性能改进,可用的性能,可以在何种程度上利用将取决于投入软件开发,应用和投资的性质。
2.1.1建筑
本节介绍了建筑设计的GPU。
NVIDIA的产品都集中在这里,但产品是从其他GPU厂商如ATI,similar.Figure1说明了一个GPU的布局。
由此可以看出,有许多处理核心(处理器)进行计算,每个分组到多处理机。
有11Figure:
NVIDIAGPU芯片和存储器的建筑布局。
转载[2]的权限。
几个级别的内存存取速度和范围方面的不同。
寄存器的处理器范围;共享内存,常量缓存和纹理缓存,多范围和内存可以在一个芯片上所有内核访问的设备(或全球)。
请注意GPU内存地址空间,从分开的CPU,必须在软件管理和设备之间的数据复制。
通常情况下,CPU将运行程序骨架,卸载一个或多个计算要求到GPU的代码段。
因此,有效的GPU加速应用程序。
被称为CPU的主机和设备的GPU。
在设备上运行的功能,被称为内核。
在GPU上,操作组合成块,这在网格排列依次是线程执行。
每个块由一个单一的处理器执行,但如果有足够的可用资源,几个块可以同时在一个处理器上。
处理器时间片块,以提高性能,一个块进行计算,而另一个正在等待内存读取,例如。
可用内存的GPU的一些证物,但是通过这个时间切片的方法,大大延迟,这个延迟可以隐藏适合的应用。
A组32个线程被称为经线,半warp和16个线程。
GPU的线程的一半,扭曲时,执行相同的操作,实现最佳的性能。
这是因为在这种情况下,线程可以并行执行。
条件可以的意思,线程不执行相同的操作,因此,它们必须被序列化。
说,这些线程是不同的。
这也适用于全球记忆体存取:
如果半warp访问全局内存共同遵守一定的规则,有资格被接合的线程,然后他们在并行访问内存和它只会为所有的单一访问时间半warp的线程访问内存。
全局内存位于显卡的GDDR3显存。
这可能是所有线程访问,虽然它通常比片上存储器慢。
记忆访问显着改善,如果被合并内存访问(见5.1.2.5编程指南[2]),因为这可以让一个半warp的所有线程访问的memorysimultaneously。
共享内存只能由同一个块中的线程访问。
因为它是片上,共享的内存空间是速度远远比本地及全球的记忆spaces.Approximately共享内存16KB每个MP(多处理器),但允许每个MP有几个街区一次活动(从而提高性能)最好是用尽可能少的共享尽可能每块记忆。
超过16KB少一点点,实际上是由于内部变量的存储。
共享内存由16个记忆库。
共享内存分配时,每个连续32位字被放在不同的内存银行。
为了达到最大内存性能,银行必须避免冲突(两个线程试图同时访问同一银行)。
在银行冲突的情况下,冲突的内存访问被序列化,否则每个半warp的内存访问parallel.Constant记忆的做只读存储器缓存。
它位于在全局内存,但有是位于每个多处理器缓存。
如果请求的内存高速缓存中,然后访问共享内存快,但是如果它不是那么的访问将是一个全局内存访问相同。
纹理存储器是只读存储器,缓存和二维空间进行了优化地方。
这意味着,是访问[A][B]和[+1][B],发言权,将可能会得到更好的速度比[A][B]和[54][B],而不是进行访问。
纹理缓存是16KB,每个处理器。
这是一个不同的16KB共享内存,所以使用的纹理缓存,不减少可用的共享内存。
存在注册的内存和共享内存访问速度是类似。
每个线程在一个块已宣布它自己的寄存器变量的独立版本。
有太大的变数,将放置在本地内存中,这是在位于全局存储器。
本地内存空间是没有缓存,所以它的访问是正常访问全局内存昂贵。
2.2的CUDA统一计算设备架构CUDA是由NVIDIA公司开发的一种编程语言写CUDA技术的GPU上运行的程序,方便。
这是一个C扩展和使用nvcc编译器编译。
最常用的扩展cudaMalloc*设备上的内存分配,cudaMemcpy*复制的主机和设备之间的数据和设备上的不同地点之间,
内核名称<<<网格尺寸,块尺寸>>>(参数)启动一个内核,threadIdx.x,blockIdx.x,blockDim.x,gridDim.x标识线,块,块尺寸,网格在x方向上的尺寸。
的GPU的CUDA解决一些问题,影响发展方案,以前需要太多的专业知识。
CUDA是很简单的,因此它不会占用太多的时间,已经熟悉C开始使用它的程序员。
CUDA技术还拥有数量超过以往的GPU编程方法的其他好处。
其中之一是它允许线程访问GPU内存中的任何位置,读取和写入到尽可能多的内存位置。
这些都是以前相当限制的限制,并因此减轻他们代表CUDA显着的优势,。
另一个主要的好处是允许访问共享内存,这在以前是不可能的。
使采用尽可能简单的CUDA,NVIDIA已创建的CUDAü[3]
其中包含与演习的书面教程以及在伊利诺伊大学任教的CUDA课程的课程笔记和视频的链接。
也可参考手册和编程指南[4]。
CUDA的SDK[5],包含了许多例子,可以用来测试GPU的安装和提供的源代码,演示CUDA编程技术代码。
所提供的代码是一个模板,哪些程序可以根据提供的基本结构。
CUDA的主要特点之一是提供一个线性代数库
(CUBLAS)和FFT库(CUFFT)。
这些极大地缓解执行
在GPU上的许多科学规范。
2.3GPU的成就回顾
在本节中强调,最近的一些工作,涉及科学计算使用的GPU。
•在伊利诺伊大学厄巴纳-香槟分校的理论和计算生物物理组使用GPU来实现分子建模应用之间的20和100倍的加速度。
蒙特卡罗应用程序和50倍的速度为三维拉普拉斯求解的了。
[7]
拉普拉斯求解,实现在GPU上使用全球唯一和共享
内存。
它使用一个统一的三维拉普拉斯离散化的Jacobi迭代
grid.The伦敦银行同业拆息蒙特卡洛代码使用的是原来的CPU代码非常相似。
Ituses全局和常量内存。
•许多其他英国的研究人员也在尝试与GPU。
[8]NVIDIA已经向他们报告的应用程序展示。
GPGPU.org也保持了使用GPU的研究人员名单。
[10]
•RapidMind的达到了2.4倍的对于BLASGEMM的速度行动,为FFT的2.7倍,布莱克-肖尔斯和32.2倍。
2.4GPU的缺点和替代加速技术
GPU架构的一些缺点,在本节进行了讨论,并简要介绍了一些替代的加速技术。
GPU的关键限制是固有的许多内核开发应用,使高层次的并行要求。
此外,图形处理通常并不需要科学模拟的准确性和精度相同的水平,这是反映的事实,通常GPU的缺乏既纠错功能和双精度计算功能往往是不可用或合并一个性能命中。
这是预期的改善与未来的GPU架构。
另一种常见的批评是GPU的耗电量大。
NVIDIA公司
特斯拉C870使用了170W的峰值,和120W的典型。
产生的热量将很难GPU的数字集群大一起。
GPU还放置比CPU程序员更大的约束。
为了避免显着的性能退化,它是必要条件,以避免内部内核。
避免未合并的全局存储器访问是非常困难的,对于许多应用程序,这也严重降低性能。
任何块间的通信功能的缺乏意味着它是不能确定时,在另一个块的线程已经完成了他们的计算块的线程。
这意味着,如果需要从其他区块的计算结果,那么唯一的解决办法是为内核退出,另一个发射,保证所有的块已完成。
最后,GPU的遭受大量的CPU-GPU的通信延迟。
这一瓶颈可能意味着,除非在GPU上完成加工量足够大,它可能会更快,只需在CPU上执行计算。
有其他替代的加速技术,其中一些简要介绍如下。
ClearSpeed的一个替代方案,以GPU的设计,特别是为HPC应用的处理器,如ClearSpeed公司提供的,。
这些产品通常是非常相似的GPU,与一些修改,通常使它们更适合HPC应用。
这些差异之一是,所有内部和外部存储器中包含ECC(纠错码)来检测和纠正“软错误”。
“软错误”是随机的单位,如宇宙射线是由外部因素造成的错误。
在显卡市场,这样的错误是可以容忍的,所以GPU的不包含的ECC,但HPC应用程序往往是可取或必要的。
ClearSpeed的产品也有更多的coresthan的GPU,但他们在一个较慢的时钟速度运行,以减少热量散失。
也可用双精度。
ClearSpeed的处理器,如专门的产品有一个图形处理器市场吴丹帽子小得多。
这使得GPU的优势一个数字,如规模经济,GR英特尔Larrabee的另一种选择是可能会产生很大的兴趣,当它被释放在2009-2010年是英特尔的Larrabee处理器。
这将是一个多核心矢量能力的x86处理器。
它有过的GPU使得处理器间的通信成为可能显着的优势。
它也应该解决的其他问题影响GPU的CPUGPU的通讯延迟,如数量。
它最初的目的在显卡市场,虽然专门的HPC产品在此基础上,在未来可能发生的。
很可能,它也将包含ECC来减少“软错误”。
AMD也正在开发类似的产品,目前名为“AMDFusion的,但是一些细节尚未被释放。
Cell处理器成为Cell芯片包含一个Power处理器单元(PPE)和几个
协同处理单元(SPES)。
PPE的作用主要是控制在SPE,
做大部分的计算。
Cell处理器是相当类似的GPU。
对于某些应用的GPU超越Cell处理器,而对于其他情况正好相反。
FPGA的现场可编程门阵列(FPGA)是基于连接通过围绕一个可配置逻辑块矩阵的可编程半导体设备可编程互连。
其中的设计,而不是正常的微处理器,设备制造商的固定,FPGA可以编程计算给定的应用程序所需的精确算法。
这使得他们非常强大,多才多艺。
的主要缺点是,它们通常是相当困难的方案,他们也慢,如果需要高精度。
对于某些任务,但他们是受欢迎的。
是非常适合用于FPGA,例如一些费时的天文算法,其中只有4位精度是必要的。
第五章
SoWhatisCloudComputing?
Doyoutrustthemwithyourdata?
那么,什么是云计算?
我们看到云计算作为一种计算模式,而不是一个技术。
在这种模式的“客户”到“云”访问它的价格和“按需”提供的资源插件。
从本质上讲,IT资源之间的大部分写字楼,公寓,或存储空间的多个租户租用和共享,是由住户使用。
“云”通过Internet连接传递,取代该公司的数据中心或服务器提供相同的服务。
因此,云计算是简单地在互联网上销售和交付IT服务。
是指部分类型的云计算。
云计算厂商将虚拟化(一台电脑主机多个“虚拟”的服务器),自动配置(服务器有软件自动安装),互联网连接技术,提供的服务[1]。
这些都不是新技术,但一个新的名字(虽然更新)适用于老年人的集合打包,销售和技术提供一种新的方式。
关键的一点要记住的是,在最基本的层面上,您的数据驻留在别人的服务器(S)。
这意味着,最关心的(和有潜在的数百个)真的来了,信任和控制问题。
你信任你的数据呢?
TheEconomics
Thiscanquicklybecomeanissue.
经济学
规模经济和技能驱动云计算经济学。
与出租房地产,所有权的费用汇集和传播的多租户云计算解决方案的所有住户之间。
作出相应,收购成本低,但住户从未拥有的技术资产,并可能面临的挑战,如果他们需要“移动”,或因任何原因终止服务[2]。
评估云计算成本时,常常被忽视的东西,是需要继续提供网络服务,这是强大到足以支持云解决方案。
这些费用并非总是很小。
例如,如果你有6个或更多的工作站电脑,你可能会需要继续保持在一个域控制器角色的服务器(确保名称解析),至少有一个开关(连接所有的计算机和对方的路由器),一个或多个网络打印机和互联网连接的路由器。
使用云计算我需要什么?
真正需要购买和使用云计算解决方案,是一个信用卡(或其他付款方式)和一个强大到足以支持云提供的服务与互联网连接的局域网。
看似简单的这两项要求。
从技术角度查看企业面临的最大挑战,尤其是中小型企业,可能需要适当强大的网络基础设施和互联网连接。
通常情况下,互联网接入提供一个单一的商业服务的ISP提供商通过在路由器上的单个端口。
这种类型的安装的一个特点是,所有的计算机通过局域网共享连接互联网的带宽同样。
这能迅速成为一个问题。
TypesofCloudComputing
IBMandothertraditionalITvendors.
云计算的类型
的SaaS(软件作为服务)
是云计算最广为人知的和广泛使用的形式。
它提供了一个复杂的传统应用程序的所有功能,许多客户和经常成千上万的用户,但不是一个“本地安装”应用程序通过Web浏览器,[4]。
很少或根本没有代码,用户的本地计算机上运行的应用程序通常是量身定制,以满足特定功能。
SaaS的消除对应用服务器,存储,应用软件开发和相关的共同关心的问题,IT客户的后顾之忧。
最引人注目的例子是S,谷歌的Gmail和Apps,从AOL,雅虎和谷歌即时消息,并从Vonage和Skype的VoIP。
的PaaS(平台即服务)
提供虚拟服务器上的客户可以运行现有的应用程序,而不必担心维护的操作系统,服务器硬件,负载均衡或计算能力或开发新的。
这些供应商提供API或开发平台来创建和运行在云中的应用-例如使用互联网。
应用服务托管服务提供商提供的IT部门监控系统和下游应用,如电子邮件病毒扫描经常被包括在这一类[5]。
众所周知的供应商将包括微软的Azure,Salesforce的F,谷歌地图,ADP薪资处理,美国邮政服务产品。
的IaaS(基础设施即服务)
提供实用的计算能力,通常作为原始的虚拟服务器上的需求,客户的配置和管理。
在这里,云计算提供网格或集群或虚拟服务器,网络,存储和系统软件,通常在一个多租户架构(但不总是)。
IaaS是设计,以增加或更换整个数据中心的职能。
这样可以节省资本设备部署的成本(时间和费用),但不降低配置,整合或管理成本,这些任务必须远程执行。
供应商将包括亚马逊(弹性计算云EC2上]和简单存储),IBM和其他传统的IT厂商
第六章
ThetermInternetofThingsthingtopersonandthing-to-thingcommunication.
长期上网的事情似乎已经由RFID发展社区大约2000年,谁发现通过浏览互联网地址或数据库条目对应一个特定的RFID标签对象的信息的可能性的成员创造。
自那时以来,高瞻远瞩,抓住了那句“物联网”指的事情,尤其是日常的对象,是通过互联网无论是通过RFID的可读性,可识别,可定位,可寻址,和/或可控的总体思路,无线局域网,广域网,或其他手段。
日常物品包括电子设备不仅我们遇到的日常生活,不仅较高的技术开发的产品,如车辆和设备,但是,我们通常不认为所有这些,如电子,食品,服装,住房的东西;材料,零件和组件;商品和奢侈品;地标,边界,古迹;所有的商业和文化的杂物。
虽然分析师定义IOT,连日常物品连接的性质仍有待确定。
通过互联网协议的双向连接,构成了理想的情况下,但物联网概念的始作俑者似乎都强调了RFID的查询和响应简单的模型。
物联网将是不可分割传感器网络监控的东西,但不控制的东西。
首尾相连的日常物体和传感器网络都利用一套共同对微型,低功耗传感,处理,无线通信技术的进步。
分析家普遍描述了两种不同的通信联网模式:
事情和事情的东西的人沟通。
Thing-to-person(andperson-to-thing)·········tothesizeofgravel.
事到人(人事)通讯包括一些技术和应用,其中人用的东西,反之亦然,包括人类的远程访问的对象,和对象(有时称为“blogjects”)连续报道互动他们的身份,行踪和传感器数据。
事情的东西通讯,包括技术和应用,其中日常物品和基础设施,没有人类的鼻祖,收件人,或中介互动。
可以监视其他对象的对象,采取纠正措施,并通知或提示人类所需。
机对机通信的事情,事情沟通的一个子集,但机器对机器通信,往往存在于大型IT系统等包含的东西,可能没有资格作为“日常物品”。
开发者和梦想家所描述的一些独特而又密切相关的物联网的概念是。
传感器网络需要互联网连接,的确经常驻留在远程站点,车辆,建筑物有没有互联网连接。
智能灰尘是长远一些用来表达一个微小的,无线连接的传感器的视野;最近,别人用这个词来描述任何几个技术,范围从一包口香糖大小的一包香烟,而且是广泛地提供给系统开发。
有人可能会认为智能灰尘微小的情况下,作为一个颠覆性技术的发展,将出现长时间后物联网的演变,在这期间的中断数量是前缩小到可用的无线传感器砾石的大小可预见的视力。
Ubiquitouspositioningdescribes···········seethenextbullet.
无所不在的定位描述为定位对象可能驻留在任何地方,包括室内和地下的卫星信号的地方可能无法或其他不足的技术。
生物识别技术识别人及其他生活的东西,而不是无生命的物体。
连日常的对象可以识别授权用户指纹,声纹,虹膜扫描,或其他生物识别技术的手段。
机器视觉是一种方法,可以监控对象,有没有板载传感器,控制器,或无线接口的IOT。
在下面的技术进步,将有助于物联网的发展:
机器对机器的电子通讯接口和协议设置为两个或两个以上的节点在网络上的交战规则。
微控制器被设计为嵌入到比电脑的其他对象的计算机芯片。
无线通信是在发达世界的大多数人所熟悉。
许多不同的无线技术有可能在IOT发挥的重要作用,包括短距离和长距离通道;以及双向和单向通道。
无线设备确定自己在实践中,几乎所有的无线上网设备包含唯一标识符,包括所有的手机和Wi-Fi客户端。
然而,看到未来的子弹。
RFIDtechnologyresembles····················forsensordesigners.
RFID技术类似于一个电子条码,读卡设备,甚至可以检测无视线。
一些RFID阅读器可以同时识别多个物体。
和一些RFID标签阅读器的架构支持安全功能,如需要人为操作,解码之前输入一个ID是一个挑战代码。
RFID技术有不同的大小,功率要求,工作频率,可重写的非易失性存储金额,和软件的情报;范围从几厘米到几百米不等。
然而,大型设备,有一个内部电源往往在较长的范围经营;反之,较小的设备,有没有内部电源(RF工程师说,他们照亮读者的设备,就像一个雷达照亮目标)往往在较短的操作范围。
此外,架构,支持更多的存储空间,rewriteability和处理往往要花费超过简单的架构。
能量收集技术从环境捕获量小,但可用的电能。
目前的能源收获的研发集中在温度变化不定,环境声音和振动,环境射频。
能量采集传感器与RFID的被动,只是共鸣照亮时,产生电力运行的微控制器,传感器,和/全部或部分或网络接口。
从技术上讲,能量采集传感器不仅不定的来源,但也故意传输功率,说,通过射频和声学渠道。
最近麻省理工学院的“WiTricity技术”的紧密耦合谐振器的示范,使超过几英尺的距离相对高效的无线电力传输:
通过射频通道传输功率故意戏剧性的例子。
传感器检测环境中不断变化的属性和汇报制度;传感器网络的目标是利用多个位置传感的好处。
传感器是传感器的类型,必须出示微乎其微的权力需要一个可用的错误率在传达的信息。
声,光,大气条件下,振动,和其他环境信号都是公平的游戏所有的sensordesigners的。
Actuatorsdetect·············objectsandsensors.
驱动器检测输入信号和响应不断变化的环境中的东西。
例如,一个继电器是一个机械开关执行器,切换,从而可以引起良好的反应发生,如使照明,供热系统,发出声光报警,等等。
如电机,气动,液压作动器,可移动物体和泵油。
定位技术可帮助人与机器找东西,并确定他们的身体下落。
传感器在航位推算中发挥了作用,但这种做法不符合实际需要的地理位置,导致无线方式的兴起,包括全球定位系统(通常是由其它信号增强)和蜂窝塔。
固定或轨道发射机已知位置。
他们播出的定时信号,接收设备,通过计算从每个发射器的延迟量三角。
雷达,激光雷达,声纳可以探测事物的相对位置,取决于其电磁,光学,声学特性。
有些事情,发送自己的电台,光,和/或声音,人与机器,以透露他们的下落。
软件包括一个广阔的发展领域。
物联网的发展将依靠软件功能的许多方面,包括分布式执行,自我描述的数据结构,以及更多。
没有理论框架存在外接软件开发的限制,导致投机软件模拟人类推理和履行人民代表的任务。
无论是期待已久的人工智能的优点,软件无疑将有助于未来的用户感,复杂的数据集从日常生活中的对象和传感器网络收集。
第十一章
Agent-oriented············highlightedanddiscussed.
面向Agent技术代表一个复杂的软件系统的分析,设计和建设令人振奋的新手段。
他们有可能显着改善目前的做法,在软件工程和延长能够切实解决的应用范围。
然而,迄今为止,有一些严重的尝试投代理系统作为一个软件工程的典范[1]。
本文旨在纠正这一疏忽。
具体来说,它会被认为:
(一)面向代理系统的概念设备是非常适合于构建复杂系统的软件解决方案及(ii)面向代理的方法比目前的艺术状态的真正提前复杂的系统工程。
从这个观点上,采用面向代理的软件工程方法提出的主要问题是突出和讨论。
TheNatureofComplexSoftwareSystems············aimsandobjectives.
复杂的软件系统的性质
工业强度的软件在本质上是复杂的:
它通常是由大量有许多相互作用的部分特征。
此外,这种复杂性并非偶然:
它是一个软件用于任务类型的先天属性。
因此,提供更容易地处理这种复杂的结构和技术,软件工程的作用。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 专业 英语翻译