书签分享收藏举报版权申诉 / 20

立即下载加入VIP,免费下载

当前位置：首页 > 初中教育 > 学科竞赛 > IEEE 745浮点数标准.docx

IEEE 745浮点数标准.docx

文档编号：10554108
上传时间：2023-02-21
格式：DOCX
页数：20
大小：159.88KB

IEEE 745浮点数标准.docx

《IEEE 745浮点数标准.docx》由会员分享，可在线阅读，更多相关《IEEE 745浮点数标准.docx（20页珍藏版）》请在冰豆网上搜索。

IEEE 745浮点数标准.docx

IEEE745浮点数标准

标题:

解读IEEE标准754：

浮点数表示

解读IEEE标准754：

浮点数表示

如须转载请注明作者为*******************，并请保持文章的完整和提供转载出处。

更新：

20060623-06:

44增加了求最大非规格数的公式

20060622-23:

40修改了几处笔误，换掉了实验部分的那张大图，改用代码显示。

一、背景

　　在IEEE标准754之前，业界并没有一个统一的浮点数标准，相反，很多计算机制造商都设计自己的浮点数规则，以及运算细节。

那时，实现的速度和简易性比数字的精确性更受重视。

　　直到1985年Intel打算为其的8086微处理器引进一种浮点数协处理器的时候，聪明地意识到，作为设计芯片者的电子工程师和固体物理学家们，也许并不能通过数值分析来选择最合理的浮点数二进制格式。

于是Intel在请加州大学伯克利分校的WilliamKahan教授──最优秀的数值分析家之一来为8087FPU设计浮点数格式;而这个家伙又找来两个专家来协助他，于是就有了KCS组合（Kahn,Coonan,andStone）。

　他们共同完成了Intel的浮点数格式设计，而且完成地如此出色，以致于IEEE组织决定采用一个非常接近KCS的方案作为IEEE的标准浮点格式。

目前，几乎所有计算机都支持该标准，大大改善了科学应用程序的可移植性。

二、表示形式

　　从表面上看，浮点数也是一串0和1构成的位序列（bitsequence），并不是三头六臂的怪物，更不会咬人。

然而IEEE标准从逻辑上用三元组{S,E,M}表示一个数N,如下图所示：

　　N的实际值n由下列式子表示：

其中：

　　★n,s,e,m分别为N,S,E,M对应的实际数值,而N,S,E,M仅仅是一串二进制位。

　　★S（sign）表示N的符号位。

对应值s满足：

n>0时，s=0;n<0时，s=1。

　　★E（exponent）表示N的指数位，位于S和M之间的若干位。

对应值e值也可正可负。

　　★M（mantissa）表示N的尾数位，恰好，它位于N末尾。

M也叫有效数字位（sinificand）、系数位（coefficient）,甚至被称作“小数”。

三、浮点数格式

　　IEEE标准754规定了三种浮点数格式：

单精度、双精度、扩展精度。

前两者正好对应C语言里头的float、double或者FORTRAN里头的real、double精度类型。

限于篇幅，本文仅介绍单精度、双精度浮点格式。

　　★单精度:

N共32位，其中S占1位，E占8位，M占23位。

　　★双精度:

N共64位，其中S占1位，E占11位，M占52位。

　　值得注意的是，M虽然是23位或者52位，但它们只是表示小数点之后的二进制位数，也就是说，假定M为“010110011...”,在二进制数值上其实是“.010110011...”。

而事实上，标准规定小数点左边还有一个隐含位，这个隐含位通常，哦不，应该说绝大多数情况下是1，那什么情况下是0呢？

答案是N对应的n非常小的时候，比如小于2^（-126）（32位单精度浮点数）。

不要困惑怎么计算出来的，看到后面你就会明白。

总之，隐含位算是赚来了一位精度,于是M对应的m最后结果可能是"m=1.010110011...”或者“m=0.010110011...”

四、计算e、m

　　首先将提到令初学者头疼的“规格化（normalized）”、“非规格化（denormalized）”。

噢，其实并没有这么难的，跟我来！

掌握它以后你会发现一切都很优雅,更美妙的是，规格化、非规格化本身的概念几乎不怎么重要。

请牢记这句话：

规格化与否全看指数E！

　　下面分三种情况讨论E，并分别计算e和m:

　　1、规格化：

当E的二进制位不全为0,也不全为1时，N为规格化形式。

此时e被解释为表示偏置（biased）形式的整数,e值计算公式如下图所示：

　　上图中，|E|表示E的二进制序列表示的整数值,例如E为"10000100",则|E|=132,e=132-127=5。

k则表示E的位数，对单精度来说，k=8,则bias=127，对双精度来说，k=11,则bias=1023。

　　此时m的计算公式如下图所示：

　　标准规定此时小数点左侧的隐含位为1,那么m=|1.M|。

如M="101"，则|1.M|=|1.101|=1.625,即m=1.625

　　2、非规格化：

当E的二进制位全部为0时，N为非规格化形式。

此时e，m的计算都非常简单。

　　注意，此时小数点左侧的隐含位为0。

为什么e会等于（1-bias）而不是（-bias），这主要是为规格化数值、非规格化数值之间的平滑过渡设计的。

后文我们还会继续讨论。

　　有了非规格化形式，我们就可以表示0了。

把符号位S值1,其余所有位均置0后，我们得到了-0.0;同理，把所有位均置0,则得到+0.0。

非规格化数还有其他用途，比如表示非常接近0的小数，而且这些小数均匀地接近0,称为“逐渐下溢（graduallyunderflow）”属性。

　　3、特殊数值：

当E的二进制位全为1时为特殊数值。

此时，若M的二进制位全为0，则n表示无穷大，若S为1则为负无穷大，若S为0则为正无穷大;若M的二进制位不全为0时，表示NaN（NotaNumber），表示这不是一个合法实数或无穷，或者该数未经初始化。

五、范例

　　仔细研读第四点后，再回忆一下文章开头计算n的公式，你应该写出一个浮点编码的实际值n了吧？

还不能吗？

不急，我先给你示范一下。

我们假定N是一个8位浮点数，其中，S占1位，E占4位，M占3位。

下面这张表罗列了N可能的正数形式，也包含了e、m等值，请你对照着这张表，重温一下第四点，你会慢慢明白的。

说实在的，这张表花了我不少功夫呢,幸好TeX画表格还算省事！

　　这张表里头有很多有趣的地方，我提醒一下：

　　★看N列，从上到下，二进制位表示是均匀递增的，且增量都是一个最小二进制位。

这不是偶然，正是巧妙设计的结果。

观察最大的非规格数，发现恰好就是M全为1,E全为0的情况。

于是我们求出最大的非规格数为：

　　上面的公式中，h为M的位数（如范例中为3）。

注意，公式等号右边的第一项同时又是最小规格数的值（如范例中为8/512）;第二项则正是最小非规格数的值（如范例中为1/512）即该浮点数能表示的最小正数。

　　★看m列，规格化数都是1+x的形式，这个1正是隐含位1;而非规格化数隐含位为0,所以没有"1+"。

　　★看n列，非规格化数从上到下的增量都是1/512,且过渡到规格化数时，增量是平滑的，依旧是1/512。

这正是非规格化数中e等于（1-bias）而不是（-bias）的缘故，也是巧妙设计的结果。

再继续往下看，发现增量值逐渐增大。

可见，浮点数的取值范围不是均匀的。

六、实战

　　我们用一小段汇编来测试一下，浮点数在内存中是如何表示的。

测试环境：

GentooLinux2006.0/GNUassemblerversion2.16.1/GNUgdb6.4/AMDXP1600+。

如下所示

代码:

~/coding/assemble$ gdb

（gdb）list

1 .section.data

2 f1:

3 .float 5

4 f2:

5 .float 0.1

6 .section.text

7 .global_start

8 _start:

9 nop

10

（gdb）x/f&f1

0x80490a4:

5

（gdb）x/xw&f10x80490a4:

0x40a00000

（gdb）x/f&f20x80490a8:

0.100000001

（gdb）x/xw&f20x80490a8:

0x3dcccccd

（gdb）

　　从上面的gdb命令结果可以看出，浮点数5被表示为0x40a00000，二进制形式为（0100000010100000...00000000）。

红色数字为E，可以看出|E|=129>0,则e=129-bias=129-127=2；蓝色数字为M,且|E|>0，说明是规格化数，则m=|1.M|=|1.01000..000|=1.25;由n的计算公式可以求得n=（-1）^0*1.25*2^2 =5，结果被验证了。

　　同样，你也可以验证一下十进制浮点数0.1的二进制形式是否正确，你会发现，0.1不能表示为有限个二进制位，因此在内存中的表示是舍入（rounding）以后的结果，即0x3dcccccd,十进制为0.100000001，误差0.000000001由此产生了。

七、未完成

　　关于浮点数，还有很多东西（比如舍入误差、除零异常等等）值得我们深入探讨，但已经无法在此继续。

这篇文章的目的仅在初步解释IEEE标准754对浮点数的规定以及一些奇妙的地方。

写这篇文章花掉了我整天的时间，但也使我彻底记住了以前让我胆怯的东西──最重要的是，希望这篇文章对大家有点用处，也算我为计算机科学基础理论版以及Linuxsir.org做的一点贡献。

参考书目：

①:

RandallHyde,TheArtofAssemblyLanguage,Vol.1,4.2.1

②:

RandalE.Bryant,DavidR.O’Hallaron,ComputerSystemsAProgrammer’sPerspective（BetaDraft）,PartⅠ，Chapt.Ⅱ，2.4

③:

RechardBlum,ProfessionalAssemblyLanguage

主题词：

单片机数制转换器，单片机浮点数转换器

人们研制电子计算机的初衷就是为了用于科学计算。

时至今日，尽管现在单片机应用领域宽广、色彩缤纷，但复杂计算仍不可或缺的内容。

针的对定点数不能胜任复杂计算的缺点，人们在实践中约定了不同格式、不同精度的浮点数，实现了浮点运算。

因为计算机只能识别二进制数，完成二进制数的运算，所以我们所说的浮点数一般都是指二进制浮点数。

与定点数相比，浮点数能较好地兼顾表达式数值范围，能简捷地表示出很大或很小的数值。

浮点由阶码和尾数两部分组成，阶码为带符号的整数，尾数为小于1带符号的小数（如尾数的绝对值还满足大于或等于1/2，则称该浮点数为规格化浮点数）。

计算过程中主要以足够长的尾数来保证数据的精度，以阶杩来调整数模（绝对值）的大小（即改变小数点的位置），并自动进行符号处理。

因此浮点数具有精度高、数的表达范围宽等特点，特别适用于计算过程复杂、精度要求高的场合。

目前单片机常用的浮点数格式，不外乎有四种格式：

三字节格式、IEEE-754标准格式、IEEE-754标准变形1和IEEE-754标准变形2，

共4种格式。

作为单片机程序员来说，在编写程序时经常要检验程序中的浮点数运算结果是否正确，但手中又没有合适的检验工具，非常麻烦。

对此我就深有体会。

为此我收集整理有关浮资料，并编写了一款非常实用的转换工具，它能辅助你编写有关浮点数运算方便的程序，尤其是有关浮点数表格的制作，更是事半功倍。

你只需将要转换的十进制定点数编制成一个文本文件，利用FON浮点数转换器“载入”，如图

（2），点击一下转换按钮，顷刻间便可完成一个文件数据的转换。

也可将浮点数转换为十进制定点数，即逆转换。

FON浮点数转换器，我也在工作中使用了两年多，效果非常好，为节省了不少时间。

下面是浮点数转换器的部分截屏：

单个数据转换（图1）

多组数据转换（格式1）（图2）

多组数据转换（格式2）（图3）主要用于制作浮点数表格

多组数据逆转换（图4），此时的定点数会出现此尾数差异，并不影响精度

单片机浮点数格式说明

★MCS-51三字节格式：

浮点数格式如下：

地址 eb BY0 BY1

内容SEEEEEEEMMMMMMMMMMMMMMMM

用三个字节表示，第一个字节的最高位为数符S，正数为0，负数为1，其余七位为阶码（二进制补码形式）；第二字节为尾数的高字节；第三字节为尾数的低字节，尾数用双字节ＢＣＤ码纯小数（原码）来表示。

例：

已知a=-123.4；b=0.7577；c=56.34；d=1.276；

用ＢＣＤ码浮点数表示时，分别为a=831234H；b=007577H；c=025634H；d=011276H。

★MCS-51三字节浮点数规格化：

为了提高运算精度，正数的尾数最高位规定为1，负数的尾数的最高位规定为0，这种形式的浮点数为规格化数（又称浮点操作数）。

运算之前所有的浮点数都应转成规格化数。

*************************************************************

★IEEE-754标准的格式：

一个浮点数用两个部分表示，尾数和2的幂，尾数代表浮点上的实际二进制数，2的幂代表指数，指数的保存形式是一个0到255的8位值，指数的实际值是保存值（0到255）减去127，一个范围在-127到+128之间的值，尾数是一个24位值（代表大约7个十进制数），最高位MSB通常是1，因此省略不保存，一个符号位表示浮点数是正或负。

地址 eb BY0 BY1 BY2

内容 SEEEEEEEE.MMMMMMMMMMMMMMMMMMMMMMM

S（第31位）代表符号（数符）位1是负，0是正；

E偏移127的幂，二进制阶码=（EEEEEEEE）-127；

.小数点；

M24位的尾数保存在23位中，只存储23位，隐含最高位1。

此方法用最较少的位数实现了较高的有效位数，提高了精度。

零是一个特定值，幂是0尾数也是0。

阶码的计算方法：

阶码采用指数的移码，阶码=指数P+7FH

阶码（移码）eb=指数P+7FH

其中：

指数P=int（Z），Z=ln（A）/ln

（2）

由1位符号位、8位指数、23位有效数组成。

能表示的数据范围为：

±1.2×10^（-38）~3.4×10^38，超出范围为溢出。

精度为2-24即5.9×10-8。

-------------------------------------------------------------

如果eb=P+7EH，那么指数P=int（Z）+1，

（广洲天龙AVR单片机浮点数格式定义的移码为7EH，而IEEE-754标准定义的是7FH，故我们取移码为7FH）

-------------------------------------------------------------

*在由二进制浮点数转为十进制定点数时，注意在尾数的左边有一个省略的小数点和1，这个1在浮点数的保存中经常省略,但在还原时应加上去。

**************************************************************

★IEEE-754_1标准的格式：

地址 eb BY0 BY1 BY2

内容 PtEEEEEEES.MMMMMMMMMMMMMMMMMMMMMMM

Pt代表阶符，阶符视阶的正负而定；

S代表符号（数符）位，1是负，0是正；

.小数点在数符的右边；

E代表幂偏移，即指数偏差；

M24位的尾数保存在23位中，只存储23位，隐含最高位1。

阶码的计算方法：

（1）十进制整数（可带小数）：

阶码eb=指数P+7EH

其中：

指数P=int（Z）+1，Z=ln（A）/ln

（2）

（2）纯小数：

阶码eb=指数+7EH

其中：

指数P=int（Z），Z=ln（A）/ln

（2）

注：

IEEE-754_1主要用于PIC系列单片机浮点数格式

***************************************************************

★IEEE-754_2标准的格式：

地址 eb BY0 BY1 BY2

内容 PtEEEEEEES.MMMMMMMMMMMMMMMMMMMMMMM

Pt代表阶符，阶符视阶的正负而定；

S代表符号（数符）位1是负，0是正；

.小数点在数符的右边；

E代表幂偏移，即指数偏差；

M24位的尾数保存在23位中，只存储23位，隐含最高位1。

阶码采用1字节移码，以80H~0FFH表示0~127，以01H~7FH表示-127~-1。

阶码的计算方法：

（1）十进制整数（可带小数）：

阶码eb=指数P+80H

其中：

指数P=int（Z）+1，Z=ln（A）/ln

（2）

（2）纯小数：

阶码eb=指数+80H

其中：

指数P=int（Z），Z=ln（A）/ln

（2）

能表示的数据范围为：

5.8×10^（-39）~1.7×10^38，超出范围为溢出。

---------------------------------------------------------------

注：

Pt表示阶符，Pt=0表示阶码为正数；Pt=1表示阶码为负数

（如0.1的阶为-3，则阶码=（-3）+80H=7DH）

IEEE-754_1与IEEE-754_2只是阶码字节的内容不同，而尾数的内容是相同的。

----------------------------------------------------------------

例：

十进制数50.265化为32位规格化浮点数。

解A=50.265，则Z=ln50.265/ln2，P=int（Z）+1，故P=6；

X=A/2P=50.265/26=0.785390625，将定点小数：

0.785390625转为二进制数为：

110010010000111101011100B，取其24位，检查24位是否为1，否则，将二进制数左移，直至二进制数的最高位为1；隐含尾数整数的1，将二进制数的最高位改为数的数符位（正数为0，负数为1）。

则：

010010010000111101011100B=49H,0FH,5CH；

而阶码eb=P+80H=6+80H=86H

二进制浮点数为：

86H,49H,0FH,5CH

****************************************************************

★浮点BCD码的格式：

浮点ＢＣＤ码，是以纯小数（原码）来表示。

小数点的位置由阶来确定。

[阶符.阶码]，数符.尾数（4字节），即带符号的阶码与带符号的尾数。

阶符：

正数为“+”，可隐含；负数为“-”；

数符：

正数为“+”，可隐含；负数为“-”；

阶码：

根据小数点的位置来确定。

0.1-->阶符为“+”,数符为“+”，阶为00

0.01-->阶符为“-”,数符为“+”，阶为01

22.00-->阶符为“+”，数符为“+”，阶为02

-0.1-->阶符为“+”,数符为“-”，阶为00

-0.01-->阶符为“-”,数符为“-”，阶为01

-22.00-->阶符为“+”，数符为“-”，阶为02

阶-->这里所说的阶是十进制浮点数的阶,即为小数点的位置。

“+”阶小数点的位置向右移；“-”阶小数点的位置向左移。

如：

[阶符.阶码]，数符.尾数

-0.012345678，浮点BCD码为：

[-01]，-12345780H

0.012345678，浮点BCD码为：

[-01]，12345780H

0.12345678，浮点BCD码为：

[00]，12345780H

12345678，浮点BCD码为：

[08]，12345780H

-12345678，浮点BCD码为：

[08]，-12345780H

------------------------------------------------------------

注：

在单片机编程中定义为：

阶符：

正阶为00H，负阶为FFH

数符：

正数为00H，负数为FFH

为了与人们的习惯相一至，在这里仍采用“+，-”号来表示。

**************************************************************

★浮点数错误判断及提示：

以下是IEEE-754标准所能表达数据的范围，其它标准请参照，只溢出的范围有所不同而已。

FFFFFFFH不是一个数，提示：

"输入有误"

7F80000H正无穷大正溢出，提示：

"正溢出"

FF80000H负无穷大负溢出，提示：

"负溢出"

附注：

（1）IEEE标准是美国电子电气工程师协会定义的国际标准浮点数格式；

（2）符号-表示数据的正负，在最高有效位（MSB）。

负数的符号位为1，正数的符号位为0；

（3）有效数字-表示数据的有效数字，反映数据的精度。

有效数字一般采用规格化形式，是一个纯小数，所以也被称为尾数、小数或分数。

（4）阶码与阶之间的换算公式为：

移码（阶码）=补码（阶）+偏移量；阶=移码-偏移量

其中阶又称为指数；移码又称偏移码；80H（或7FH）为偏移量。

*********************************************************************************************************************

四种浮点数对照表

输入数据

51三字节

IEEE-754标准

IEEE-754_1

IEEE-754_2

0

000000H

00000000H

1

018000H

3F800000H

81000000H

-1

818000H

81800000H

0.5

008000H

3F000000H

80000000H

-0.5

808000H

80800000H

0.1

7DCCCDH

7D4CCCCDH

-0.1

FDCCCDH

7DCCCCCDH

π/180

7B8EFAH

7B0EFA35H

Ln2

00B172H

80317218H

01B505H

813504F3H

E≈2.7182818

02ADF8H

822D

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: IEEE 745浮点数标准 745 浮点标准

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：IEEE 745浮点数标准.docx
链接地址：https://www.bdocx.com/doc/10554108.html

IEEE 745浮点数标准.docx

热门标签