深入解析printf/spintf/snprintf中的类型转换

原創

2020-06-04 09:17

本文通过两个问题出发，跟踪汇编代码，阐明了函数 printf/spintf/snprintf中的类型转换的规律。

1 问题的提出

源码1:

#include <stdio.h>
f1()
{
        double x = -5.5625;
        printf("%d\n",x);                //输出为0，为什么？
}
main()
{
        f1();
}

源码2：

#include <stdio.h>
f1()
{
        int y=1;
        printf("%f\n",y);          //输出的值是随机的， 为什么？
}
main()
{
        f1();
}

分析这个问题之前，我们要首先了解浮点数在计算机中是如何存储的。

2 浮点数在计算机中的存储

在c语言中，浮点数有两种数据类型float和double，float占用32bit，double占用64bit。float的存储格式遵从IEEE R32.24，参见图1；而double的存储格式遵从R64.53，参见图2。

1.1 float

float x= -5.5625;

接下来，详细解析x在内存中的存储格式。-5.5625 的二进制表示为-101.1001，用二进制的科学计数法表示为-1.011001*2²，

●符号位

由于是负数，所以为1

●指数位

为2。由于指数部分采用8bit存储，取值范围为[-127,128]，指数部分采用加127存储，即在指数部分存储的数据为2+127=129，即10000001。

●尾数部分为011001。所以x在内存中存储格式见图3。对应的16进制整数为0xc0b20000。

1.2 double

double y = -5.5625;

-5.5625 的二进制表示为-101.1001，用二进制的科学计数法表示为-1.011001*2²，

●符号位

由于是负数，所以为1

●指数位

为2。由于指数部分采用11bit存储，取值范围为[-1023,1024]，所以指数部分采用加1023存储，即在指数部分存储的数据为2+1023=1025，即100 0000 0001。

●尾数部分

为011001。

所以y在内存中存储格式见图4。对应16进制整数为0xc01640000000 00 00。

3 分析问题

以下是利用gdb跟踪调试源码1的过程。发现，printf("%d\n",x);根本就没有把x由double类型转换为int类型，只是截取了x的低4个字节，并输出。

(gdb) b main
(gdb) r
Breakpoint 1, main () at 1.c:9
9               f1();
(gdb) display /i $pc
call   0x8048354 <f1>
(gdb) si
push   %ebp                  ;保存上层函数的栈的上下文
(gdb) si
mov    %esp,%ebp       ;保存上层函数的栈的上下文
(gdb) si
sub    $0x28,%esp        ;为函数f1分配的栈，大小为28字节
(gdb) si
double x = -5.5625;
fldl   0x8048480             ;把0x8048480存储的双精度浮点数置入浮点寄存器%st(0)
(gdb) p/x (char[8])*0x8048480
$1 = {0x0, 0x0, 0x0, 0x0, 0x0, 0x40, 0x16, 0xc0}  ;证明了内存0x8048480处存储常量-5.5625
(gdb) si
double x = -5.5625;
fstpl  0xfffffff8(%ebp)          ;把浮点寄存器%st(0)的值置入内存(%ebp-8)处
(gdb) info all-registers
st0            -5.5625  (raw 0xc001b200000000000000)  ;证明了%st(0)存储的浮点数为-5.5625
(gdb) si
printf("%x\n",x);
fldl   0xfffffff8(%ebp)    ;把内存(%ebp-8)处的双精度浮点数置入%st(0)，即-5.526
(gdb) 
printf("%x\n",x);
fstpl  0x4(%esp)                        ;把%st(0)中的值置入内存(%esp+4),即把printf的第二参数压栈
(gdb) i r esp
esp            0xbfb00320       0xbfb00320
(gdb) p/x (char[8])*0xbfb00324
$2 = {0x6c, 0x95, 0x4, 0x8, 0x38, 0x3, 0xb0, 0xbf}
(gdb) si
printf("%x\n",x);
movl   $0x8048478,(%esp)   ;把函数printf的第一个参数压入栈中，用栈来传递参数
(gdb) p/x (char[8])*0xbfb00324
;显示printf的第二个参数的值。printf的格式串中”%d”在指明第二参数是int类型,即使实际传递的;是double类型，也没有进行类型转换，即没有把x由double类型转换为int类型，printf在取值是
;直接读取前4个字节00 00 00 00，所以printf输出为0
$3 = {0x0, 0x0, 0x0, 0x0, 0x0, 0x40, 0x16, 0xc0} ;  
(gdb) si
printf("%x\n",x);
call   0x8048298 <printf@plt> ;调用printf函数
(gdb) p/x (char[8])*0xbfb00324
$4 = {0x0, 0x0, 0x0, 0x0, 0x0, 0x40, 0x16, 0xc0}

由此引申开来发现如下规律：

● %d/%x/%u --> float/double

利用%d/%x/%u输出float/double类型变量时，会得到意想不到的结果，因为不会进行类型转换，而是把变量截断为4个字节并输出。原因在前面已经给出。

● %f --> int

利用%f输出int变量，输出的值是随机的。

f1()
{
        int x = 1;
        printf("%f\n",x);  ;输出的值是随机的
}

对应的汇编代码：

movl    $1, -4(%ebp)
movl    -4(%ebp), %eax
movl    %eax, 4(%esp)  ;没有把x转换为float类型
movl    $.LC0, (%esp)
;printf会读取内存4(%esp)除的8个字节，由于后4个字节的值是随机的，所以输出的值是随机的
call    printf

●%d/%x/%u --> char/short

利用%d/%x/%u输出char/short类型变量时，会对char/short类型进行符号位扩展，扩展为4个字节。

f1()
{
         char x = 0x80;
        printf("%x\n",x);
}

对应的汇编代码：

movb    $1, -1(%ebp)
movsbl  -1(%ebp),%eax  ;把x符号扩展为4个字节
movl    %eax, 4(%esp)
movl    $.LC0, (%esp)
call    printf

4 结论

由于float/double存储机制迥异于char/short/int/long long的存储机制，所以利用%f来输出char/short/int/long long变量，或者是利用%d输出float/double变量，得到的结果会令你大吃一惊。所以我们在使用printf/sprintf/snprintf函数时，应该严格的按照参数的类型指定格式串。

5参考

[1] http://www.cnblogs.com/jillzhang/archive/2007/06/24/793901.html

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

深入解析printf/spintf/snprintf中的类型转换

1 问题的提出

2 浮点数在计算机中的存储

1.1 float

1.2 double

3 分析问题

4 结论

5参考

python列出centos7内存使用前50的进程信息

Garnet：微软官方基于.NET开源的高性能分布式缓存存储数据库

Java响应式编程

评估统计算法在银行伪造钞票检测中的价值

dynamo和cassandra區別

如何將進程/線程綁定到固定的CPU核

optics算法

bit-wise索引原理(2012/7/3)

數字證書基礎-X.509協議

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結