最新企业级缓行 高级格式化4KB扇区硬盘深度解析.docx
- 文档编号:3155353
- 上传时间:2022-11-18
- 格式:DOCX
- 页数:9
- 大小:24.09KB
最新企业级缓行 高级格式化4KB扇区硬盘深度解析.docx
《最新企业级缓行 高级格式化4KB扇区硬盘深度解析.docx》由会员分享,可在线阅读,更多相关《最新企业级缓行 高级格式化4KB扇区硬盘深度解析.docx(9页珍藏版)》请在冰豆网上搜索。
最新企业级缓行高级格式化4KB扇区硬盘深度解析
企业级缓行高级格式化4KB扇区硬盘深度解析
企业级缓行高级格式化4KB扇区硬盘深度解析
4K扇区引发的问题?
关于"高级格式化4K扇区硬盘"这个话题,我想很多读者已经不陌生了,下面先简单介绍一下市场现状:
目前,希捷和西部数据都已经推出了采用4K扇区(高级格式化)的硬盘产品,对于使用低版本操作系统(如:
WindowsXP)或者硬盘实用程序时"分区未对齐"可能出现的性能降低问题,这两家厂商采取的是不同的解决方法。
西部数据使用4K扇区(高级格式化)技术的640GB蓝盘(CaviarBlue)
西部数据提供了两种方案。
首先,只要在硬盘上短接7号和8号跳线,硬盘控制器芯片即可提供一个逻辑分区的偏移量,使LBA63变成LBA64,解决校准问题。
不过这种方案仅能针对全盘只有一个分区的情况(实用性不大)。
第二种方案,则是一款名为WDAlign的工具软件。
该工具可以移动分区和数据,"对齐"文件系统簇与4KB扇区。
推荐使用Windows5.x(2000、XP、Server2003)操作系统,或是需要磁盘镜像软件的用户使用该工具。
由于WDAlign需要移动全盘数据,因此最好在分区或操作系统安装完毕后即使用该工具进行迁移。
而希捷则提出了自己的技术"SmartAlign",宣称能够在硬盘内部实时、自动管理离散的扇区状况,并交给系统使用,不会造成任何延迟和性能损失。
当然了,最好的解决方案还是把系统升级到WindowsVista/7。
这样来看应该是希捷的做法更好一些,那么SmartAlign是否真的像宣传的那样有效?
希捷具体是如何实现的?
WD为什么没有采用类似的方式呢?
希捷Momentus72002.5英寸硬盘产品线
西部数据推出的第一款采用4K扇区的硬盘是3.5英寸绿盘(CaviarGreen),后来又逐渐加入了蓝盘(CaviarBlue)中的几款型号,希捷的4K扇区硬盘现在只有发布不久的2.5英寸Momentus750GB一款。
不过,所有参与IDEMA(国际磁盘驱动器设备与材料协会)的各主要硬盘制造商已经达成一致:
2011年1月1日起,面向渠道出货的所有台式机和笔记本硬盘(新推出的型号)都将采用高级格式标准。
值得注意的是:
这当中不包括对OEM客户出货和企业级硬盘,为什么呢?
高级格式硬盘扇区的扩大可以带来更高的密度和更大的容量,同时还有纠错能力的增强。
ECC校验码的集中和占用空间减少(下文中有详细说明)能够提高硬盘容量利用率,这一点还比较好理解,而纠错能力又是如何增强的呢?
除了"分区对齐"的问题之外,4K扇区硬盘还有其它可能会导致性能下降的因素吗?
我想这些问题应该是大家普遍比较关心的,希望您能够在本文接下来的几页中找到它们的答案.
概述
硬盘行业正在经历一次变革。
近年内,在存储密度大幅增长的同时,作为硬盘设计最主要因素之一的逻辑块格式化大小(也称为扇区)却仍然没有变化。
开始于2009年晚期,在2010年加速,2011年力争成为主流,硬盘公司正在从传统的512字节扇区迁移到更大、更高效的4096字节扇区(一般称为4K扇区),国际硬盘设备与材料协会(InternationalDiskDriveEquipmentandMaterialsAssociation,IDEMA)将之称为高级格式化。
下面我们将分别阐述此迁移的背景,指出为客户带来的长期利益,同时提出从512字节迁移到4K扇区的过程中要避免的潜在隐患。
背景
30多年来,硬盘上储存的数据都要格式化到小的逻辑块中,这种逻辑块称为扇区。
传统的扇区大小是512字节。
实际上,现代计算机系统很多的设计方面仍假设硬盘扇区采用此基础格式标准。
传统扇区格式中包含间隙(Gap)、同步(Sync)和地址标记(AddressMark)、数据和纠错代码(ECC)部分(见图1)。
图1.硬盘介质上的传统扇区布局此扇区布局的结构设计如下:
间隙(Gap)部分:
间隙,用于分隔扇区。
同步(Sync)部分:
同步标记,用于表示扇区开始处并提供计时对齐。
地址标记(AddressMark)部分:
地址标记,包含可识别扇区号和位置的数据。
还可提供扇区本身的状态。
数据部分:
数据,包含所有用户数据。
ECC部分:
ECC部分包含用于修复或复原读写过程可能受损的数据的纠错代码。
多年来,硬盘行业一直采用这种低级别的格式。
然而,随着硬盘容量的不断增长,扇区大小日渐成为提高硬盘容量和纠错效率方面的限制性设计因素。
例如,将以前的扇区大小和总容量的比率与最近硬盘的扇区大小和总容量的比率相对比就可以发现,扇区分辨率已变得非常低。
扇区分辨率(扇区大小和总存储大小的百分比)已经非常低,几乎可以忽略不计(见表1)。
表1.在一个可测量的总容量内的扇区分辨率。
管理小型离散数据时,分辨率越低越好。
但是,现代计算系统中的常用应用管理的都是大型数据块,实际上远比传统512字节扇区大小要大得多。
另外,随着区域密度的增加,小型512字节扇区在硬盘表面上占用的空间也将越来越小。
从纠错和介质缺陷风险方面看,更小的空间也会引发问题。
如图2所示,硬盘扇区中的数据占据的空间越小,错误纠正就会变得越困难,因为同样大小的介质缺陷对总体数据负载损害的百分比更高,因此需要更大的纠错强度。
图2.介质缺陷和区域密度(更高的区域密度使同样大小介质缺陷带来的危害更高)512字节扇区一般可纠正高达50字节长度的缺陷。
现在,硬盘开始通过先进的区域密度来提高错误纠正的上限。
因此,为了改善错误纠正和实现格式化效率,迁移到较大扇区是硬盘行业内的基本要求。
过渡到4K扇区(高级格式化)
数年来,存储行业一直在通力协作,致力于向较大扇区硬盘格式过渡;至少5年以前,希捷以及硬盘行业内的同行就已开始努力,并获得了卓越的成果(见图3)。
2009年12月,经过与IDEMA的通力合作,将高级格式化提名作为4K字节扇区标准的名称,并获得批准。
此外,所有硬盘制造商还承诺,自2011年1月开始,所发行的台式机和笔记本电脑产品的新型硬盘平台都采用高级格式化扇区格式。
在此之前,高级格式化硬盘将开始逐步进入市场。
从2009年12月起,西部数据就开始推出了高级格式化硬盘;有段时间,希捷也为OEM客户和品牌零售产品中提供过大扇区硬盘,其中值得关注的是USB连接外置硬盘,如SeagateFreeAgent系列。
图3.高级格式化标准发展的重要里程碑
4K扇区的长期利益
所有硬盘制造商一致同意,到2011年1月,实现向高级格式化扇区设计的过渡,因此,硬盘行业需要适应并采用此更改,以最小化潜在的负面作用。
短期内,最终用户不会明显感受到硬盘容量的增长。
但是,迁移到4K大小扇区后,肯定能为实现更高的区域密度、硬盘容量和更强大的纠错功能提供一条捷径。
通过降低错误纠正代码所用空间来提高格式化效率
图4显示了传统的512字节扇区布局。
其中,在每个512字节扇区中,都留有50字节与数据无关的开销用于ECC,以及另外15字节的开销用于间隙(Gap)、同步(Sync)和地址标记(AddressMark)部分。
这样就造成扇区格式化效率仅约为88%(512/(512+65))。
图4.传统512字节扇区布局
新的高级格式化标准使得4K字节扇区有了不小进步,在4K字节扇区中,8个传统512字节扇区合并为一个4K字节扇区(见图5)。
图5.高级格式化:
4K字节扇区布局
高级格式化标准用于间隙(Gap)、同步(Sync)和地址标记(AddressMark)的字节数与传统扇区相同,但将ECC字段增加至100字节。
这样,扇区格式化效率达到了97%(4096/(4096+115)),比传统扇区提高了将近10%。
这些格式化效率将逐渐发挥作用,有助于产生更高的容量和改善数据完整性。
可靠性和错误纠正
硬盘扇区的物理大小在不断缩减,所占空间也越来越少,但介质缺陷却没有同时减少。
图6中显示了我们认为很小的物体的图像。
但与硬盘读/写磁头的飞行高度相对而言,这些物体显得非常庞大。
比图中显示物体更小的微小颗粒也会造成硬盘的介质缺陷。
图6.磁头飞行高度的放大演示
高级格式化标准中的较大4K扇区可将ECC块大小增加一倍,从50字节增加到100字节,能够针对颗粒和介质缺陷为错误纠正效率和可靠性带来必要的改进。
从改进的格式化效率和更加强大的纠错功能的综合优势来看,向4K扇区的过渡很值得。
如何管理这种过渡,以最小的副作用获取长期利益,是硬盘行业的重点所在。
了解过渡到4K的影响
前面提到,在现代计算系统中,很多方面仍然假设扇区都是512字节。
要将整个行业过渡到新的4K标准,同时希望所有原来的假设一下子适应这种改变是不现实的。
随着原生4K扇区的实施,主机和硬盘会逐渐以4K块来交换数据。
那时,硬盘制造商将通过称为"512字节扇区模拟"的技术实现到4K扇区的过渡。
512字节扇区模拟
4K大小扇区的引入将主要依赖于512字节扇区模拟。
这个术语是指,将高级格式化中所用4K物理扇区转换为主机计算系统预期使用的传统512字节扇区的过程。
由于512字节模拟不会强制在传统计算系统中进行复杂的改变,因而是可行的。
但是这种模拟会对硬盘性能带来潜在的负面影响,特别是写入的数据与8个转换的传统扇区不对应时。
考虑到512字节模拟所需的读写过程,这种影响很明显。
模拟读写过程
以512模拟方式来读取4K扇区格式化硬盘中数据的过程非常直接,如图7所示。
图7.512字节模拟可能出现的读序列
可以在硬盘DRAM内存中读取4K数据块以及格式化主机所需的特定512字节虚拟扇区,因此这个过程不会明显影响到性能。
写过程更为复杂一些,特别是主机尝试写入的数据为4K物理扇区的子集时。
这时,硬盘必须首先读取包含主机写入请求目标位置的整个4K扇区,合并现有数据与新数据,然后重新写入整个4K扇区(见图8)。
图8.512字节模拟可能出现的写序列
在此情况下,硬盘必须执行额外的机械步骤:
读取4K扇区数据、修改其内容,然后重新写入数据。
此过程称为"读取-修改-写入"(read-modify-write)循环,但这个过程不够理想,因为它会对硬盘性能造成负面影响。
将"读取-修改-写入"情况的几率和频率降到最低是顺利无忧过渡到4K扇区的最重要因素。
"读取-修改-写入"预防
如前所述,在数据块小于或未对齐到4k扇区时,硬盘为此数据块发出写入命令,此时会发生"读取-修改-写入"的情况。
这种小于4K的写入请求称为超短帧。
512字节模拟中出现超短帧的根本原因有两个。
1.由于逻辑分区和物理分区未对齐,导致写入请求不对齐。
2.写入请求的数据小于4K
对齐硬盘分区和未对齐硬盘分区
到目前为止,我们尚未讨论主机系统和硬盘如何针对介质上的扇区位置进行通信。
我们现在就来介绍一下逻辑块地址(LogicalBlockAddress,LBA)。
每个512字节扇区都分配了唯一的LBA,根据硬盘大小,数字可以是从0到所需的数字。
主机会使用分配的LBA来请求特定的数据块。
主机请求写入数据时,会在写入结束时会返回一个LBA地址,告知主机数据的位置。
这对于4K扇区的过渡非常重要,因为主机LBA起点位置可以有八种可能性。
当LBA0与4K物理扇区中的第一个512字节虚拟块对齐时,512字节模拟的逻辑块到物理块对齐情况称为Alignment0。
另一种可能出现的对齐情况是,LBA0与4K物理扇区中第二个512字节虚拟块对齐。
这种情况称为Alignment1,图9比较了Alignment1与Alignment0两种对齐情况。
另外,还有六种可能出现的分区不对齐情况,会引起与Alignment1情况相似的"读取-修改-写入"事件。
图9.对齐情况
Alignment0情况与高级格式化标准中新的4K扇区完全符合。
因为硬盘能够轻松将8个相邻的512字节扇区映射到一个4K扇区。
实现此映射的方
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新企业级缓行 高级格式化4KB扇区硬盘深度解析 最新 企业级 缓行 高级 格式化 KB 扇区 硬盘 深度 解析