参加学术讲座和学术报告Word格式文档下载.docx
- 文档编号:14592069
- 上传时间:2022-10-23
- 格式:DOCX
- 页数:8
- 大小:70.94KB
参加学术讲座和学术报告Word格式文档下载.docx
《参加学术讲座和学术报告Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《参加学术讲座和学术报告Word格式文档下载.docx(8页珍藏版)》请在冰豆网上搜索。
注意事项
一、本表适用于攻读硕士学位研究生实践课程、选题报告、学术报告等。
二、以上各报告内容及要求由相关院(系、所)做具体要求。
三、以上各报告均须存入研究生个人学籍档案。
四、本表填写要求文句通顺、内容明确、字迹工整。
一、新型存储介质应用技术
越快的文件传输速度,越短的软件启动时间可以有效地提高人们的工作效率。
而高效的存储能力就等价于要求存储器能够同时提供超低的响应延迟,超快的传输速度,超大的存储容量,并具备经久耐用的特性。
很不幸,这种理想中的存储器目前在个人电脑上却很难看到。
在很长时间内,人们使用的都是基于温彻斯特结构设计的机械硬盘,其200MB/s以内的连续读写速度,不到2MB/s的随机4KB小文件读写速度,超高的访问延迟令外部存储器成为制约计算机性能提升的主要瓶颈。
近年来,随着固态硬盘的登场,存储器的传输速度、访问延迟均得到大幅改善,但由于闪存颗粒的先天技术特性所致,其主流产品的P/E(编程/擦除)寿命仅有数千次左右。
对于比较在意可靠性、使用寿命的用户来说,固态硬盘也难挑大梁。
因此就如开头所说,现在我们很难找到一种在各方面都有完美表现的存储器。
不过随着以下两种技术的问世,以及后续实用化、商业化工作的开展,存储产品将很可能迎来一次革命,一次质的提升。
如果只从性能上来看,毫无疑问,固态硬盘是传统机械硬盘最好的继任者。
但在早期,由于固态硬盘往往使用成本高昂的SLC闪存,因此其售价高高在上,导致它只能成为少数人的专享。
现在为了帮助固态硬盘进入主流市场,半导体厂商开始采用不同于传统SLC结构的MLC乃至TLC结构的闪存。
这三种结构的差异在于,SLC在一个存储单元里面只保存1位数据,而MLC保存两位,TLC保存三位。
这也就是说,搭建同样容量的存储器,MLC结构只需要SLC结构二分之一的晶体管数量,成本降低到原来的三分之一,而TLC结构只需要三分之一的晶体管数量,成本更减少到原来的五分之一。
尽管成本下降使得产品更加亲民,但是闪存的P/E(编程/擦写)寿命一直是徘徊在用户心头的隐忧。
SLC结构的闪存可以达到10万次P/E寿命,而常见于主流商业产品中的MCL颗粒仅有3000~5000次P/E寿命,TLC更是只有500~1000次。
P/E(编程/擦写)寿命的存在使得固态硬盘的接受度受到直接打压,厂商不得不持续改进闪存颗粒使用调度算法,在各个寿命有限的存储单元之间分摊负载。
为了更好地解决擦写寿命的问题,来自台湾旺宏电子公司的工程师们研发出了一种能够让闪存存储单元自我修复,从而延长闪存使用寿命的技术。
在提高存储密度和存储容量方面,哈佛大学医学院的乔治·
丘奇教授及其同事所做的研究工作可以作为代表。
近期,他们以《DNA中的下一代数据化存储》为标题,在殿堂级学术杂志《自然》上发表了两页简讯,虽然其正文长度尚不到一页,但仍旧引发了广泛关注。
这种DNA存储技术一口气将数据存储的理论极限密度推高了几个数量级,据计算1克重量的单链DNA能够存储455EB的数据(注:
1PB=1024TB,1EB=1024PB),这意味着当下全球互联网的通信线路中流动的数据可以全部存储在1克DNA里面。
二、软件定义数据中心关键技术
目前,IT基础设施及其运营越来越复杂,人们通常采用云计算和虚拟化技术来满足各种业务需求。
在过去的十年里,服务器虚拟化重新部署、管理以及优化了计算资源,将数据中心转化成为一个更加灵活高效的业务应用平台。
专用服务器被动态托管之后,在虚拟服务器环境中能够根据需求运行应用程序。
虽然虚拟化重塑数据中心的运营,企业能够部署机架服务器汇集和分配应用程序的需求,但这种转变并不完整理。
数据中心网络和存储资产仍然保持着孤立和静态配置,很少有设施能够自动化统筹管理混合网络和存储硬件。
现多种解决方案并存的格局。
其主要差异体现在虚拟化管理层的能力上,后续该技术将围绕自动化运维、廉价、易扩展的存储、灵活智能的网络承载、灵活便捷的容灾等方面进一步优化。
而实现物理机、虚拟机、应用容器统一管理与能力提供的技术与产品尚处于探索阶段。
(2)软件定义存储(SDS):
把存储控制面与硬件面分离,使存储资源变得更灵活,使其更容易配置和使用存储资源。
SDS将硬件存储资源整合起来,并通过软件来定义这些资源。
用户能够根据应用策略来配置和使用存储服务,并将它们部署在一系列由供货商优化商用硬件乃至云中的多种硬件上。
软件定义存储实质上是利用存储虚拟化软件,将物理设备中的存储(无论是基于块、文件,还是对象)抽象为虚拟共享存储资源池,通过虚拟化层进行存储管理,可以按照用户的需求,将存储池划分为许多虚拟存储设备,并可以配置个性化的策略进行管理,跨物理设备实现灵活的存储使用模型。
SDS起步稍晚,标准化的研究以及产品的研发尚处在起步阶段,再加上传统存储厂商由于各自利益,对SDS的发展战略尚不明晰,SDS的发展仍然需要一定的时间。
(3)软件定义网络(SDN):
SDN是一种将网络控制功能与转发功能分离、实现控制可编程的新兴网络架构。
这种架构将控制层从网络设备转移到外部计算设备,使得底层的基础设施对于应用和网络服务而言是透明抽象的,网络可被视为一个逻辑的或虚拟的实体。
基于SDN构建云数据中心网络,可实现业务与网络的解耦,基于对网络的高层抽象,应用可通过编程直接定义网络行为;
通过集中的控制平面,实现对虚拟接入网络层的统一控制,并与计算、存储紧密协同,满足计算、存储资源的移动性要求;
SDN的开放编程特性支持基于网络现状和应用需求灵活调整网络流量路径,成为新型算法、设备及架构创新的孵化器。
SDN总体上处于发展早期,在数据中心内以叠加网技术为主流,通过在现有物理网络上构建虚拟的逻辑网络层,网络控制逻辑从底层物理硬件设备中解耦出来,交由虚拟网络层中集中的控制器进行统一处理;
用户可以根据实际业务需求灵活构建逻辑网络以及调整网络策略;
逻辑网络承载在物理网络之上,与底层物理网络的具体实现无关,两者相互独立。
(4)云操作系统:
SDDC的大脑,负责将计算、存储、网络资源依据策略进行自动化调度与统一管理、编排和监控,同时根据用户需求形成不同的服务并提供计费等功能。
云操作系统从功能上一般可分为资源管理、服务管理和运营管理三个主要功能模块,从技术实现上可分为商业化云操作系统和开源云操作系统两大类。
云操作系统市场成熟度不一,商用产品与开源项目各有应用。
以OpenStack为代表的开源解决方案凭借先进的技术架构、有效运作的开放社区与强大的生态,引领了云计算领域开放式创新的潮流,已逐步成长为行业主流,其开放性和兼容性契合了运营商对异构、大规模、可移植、互操作等方面的需求,为云计算的实施提供了强有力的支撑。
(5)IT基础设施:
主要包括服务器、存储、网络等硬件设备。
在SDDC软件定义技术的推动下,IT基础设施正在向开放、通用、标准、低值、灵活的方向发展,资源整合、调度与自动化协同均由上层软件实现,物理设备仅仅扮演执行的角色,使得基于通用服务器的超融合架构统一承载计算、存储、网络等资源和业务成为可能。
对于通用服务器而言,实现更高的性能、密度、集成度和能效以及模块化与组件化则是其重要技术发展趋势。
三、下一代数据中心存储技术思考
对数据中心而言,数据就是生命,新一代数据中心比以往任何时候都更加依赖于它。
传统数据中心烟囱式的架构,虽然部署管理复杂,但传统存储设备故障影响范围小,不会大范围蔓延,但在虚拟化、池化的过程中,数据集中存储,传统存储设备一旦发生故障,将是全局性的灾难;
同时业务和数据的汇聚,对传统存储系统的性能也提出了严峻挑战。
如何提高业务效率和敏捷性、降低风险,打破传统存储软硬件紧耦合所造成的割裂状况,是新一代数据中心建设要面临的难题,软件定义存储(SDS)正是在这种需求下应运而生。
软件定义存储(SDS)顾名思义就是将存储系统中典型的控制器功能抽出来由独立的软件来实现,这些功能包括卷管理、RAID、快照、卷拷贝、复制等。
软件定义存储允许用户不必被厂商锁定就可以采购存储系统硬件,如硬盘这样的存储介质(从质量和服务角度考虑,建议从原厂购买)。
如果存储控制器上的功能被抽离出来,这些功能就可以放在基础架构的任何一部分。
它可以运行在特定的硬件上,在Hypervisor内部,或者与虚机并行,形成真正的超融合架构。
SDS应如同一个生态系统,它将存储的功能从传统存储系统中抽象出来,通过软件实现,从存储系统中抽离出来单独部署,不再是硬件设备上的固件,通过软件定义,可管理来自不同厂商的所有的物理和虚拟存储资源,并按需进行自动配置。
软件定义存储应具有以下特征。
(1)自服务
通过定义标准的应用编程接口(API),进行存储的配置,可以满足应用程序和客户所需要的存储资源,无需人工干预。
虽然这种形式的配置在公共云存储环境中(如AmazonS3和新兴的云计算平台OpenStack)已经十分常见,但在企业的IT环境中还未实现。
一些存储厂商,包括EMC公司、惠普和NetApp,正逐渐提供基于API的配置,这种自服务特征将极大地方便应用系统管理员的配置和应用的集成,并有效地降低管理成本。
(2)存储虚拟化
存储虚拟化可以聚合异构存储资源到一个共享的存储池,打破传统存储系统烟囱式的现状,使所有存储设备中的存储容量得以充分利用,存储虚拟化可以实现数据跨异构孤岛,在因硬件故障进行数据迁移时,实现数据的无缝迁移,并方便管理。
(3)丰富的数据接口
SDS可以对外提供丰富的数据接口,如文件系统接口(NFS、CIFS等)、块接口(iSCSI、FC等)、对象接口(S3、SWIFI"
等)以及可以供大数据分析的HDFS接口。
丰富的数据接口可以为应用在存储的接口和协议方面提供更多的选择。
(4)异构存储设备的快速接入和统一管理
SDS的一个优势在于对异构存储设备的整合,不同类型的存储系统(如NAS、SAN、对象存储等)以及不同厂商的存储设备可以实现快速的接入和统一管理,这为存储虚拟化提供了丰富的存储资源,也为建立全局的管理视图创造了条件。
四、分布式文件系统思考与实践
分布式文件系统将连接在网络中的多台计算机组成一个统一整体供用户访问,这里的每台计算机就是系统中的单个节点。
分布式文件系统具有执行远程文件的存取能力,以透明方式对分布在网络中的文件进行管理和存取,用户在访问文件时不再需要知道和指定它们的实际物理位置。
分布式文件系统具有高可用性、高性价比、高可扩展性等优点。
在当前大多数分布式文件系统中,元数据管理和数据管理通常是分开的,从而,可以获取更高的系统扩展性和IO并发性。
分布式文件系统中,元数据管理模型在一定程度上能够决定系统的性能、可靠性、扩展性和稳定性等。
元数据管理模型可以划分为三种:
集中式元数据服务模型、分布式元数据服务模型和无元数据服务模型。
这三种服务模型各自都存在自身的优点与缺点,没有一种服务模型能够完全适应所有的应用负载,在实际的应用中,它们都各自在合适的领域发挥自身的优点。
文件系统最初设计时,仅仅是为局域网内的本地数据服务的。
而分布式文件系统将服务范围扩展到了整个网络。
不仅改变了数据的存储和管理方式,也拥有了本地文件系统所无法具备的数据备份、数据安全等优点。
判断一个分布式文件系统是否优秀,取决于以下三个因素:
(1)数据的存储方式。
例如有1000万个数据文件,可以在一个节点存储全部数据文件,在其他N个节点上每个节点存储1000/N万个数据文件作为备份;
或者平均分配到N个节点上存储,每个节点上存储1000/N万个数据文件。
无论采取何种存储方式,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参加 学术 讲座 学术报告