今天在研究C++的时候在Mac上随手写了些例子,结果发现一个关于printf很有趣的现象:
先定义一个模板:
template<tyepname type>class data_count{
type a;
type b;
public:
data_count(type A,type B):a(A),b(B){}
type add(){return a+b;}
type sub(){return a-b;}
}
使用一下这模板:
data_count<char> c('a','b');
printf("check it %c",c.add());
一切正常,于是我突发奇想改了一下printf语句:
printf("check it %s",c.add());
系统直接报了 EXC_BAD_ACCESS,非法访问内存?
我不确定是否因为模板类的问题,所以再试了一下:
printf("check it %s",'c');
此时clang报出警告: Format specifies type 'char*' but the argument has type 'char' (clang的错误信息简直比gcc好太多了,特别在出现链接错误的时候)
我没管,直接跑起来,结果运行时报出 EXC_BAD_ACCESS的错误,果然是因为printf中%s与%c的不同造成的。
去扒代码:
static int printf(const char *fmt, ...)
{
va_list args;
int i;
va_start(args, fmt);
write(1,printbuf,i=vsprintf(printbuf, fmt, args));
va_end(args);
return i;
}
这是Linux源码中实现的printf(没找Mac下的,因为这种代码原理应该都是一样的),思路很简单:将变参(va_list)中的所有参数组装好,全部写到1(stdout)的FD中从而输出到屏幕。这里貌似只有vsprintf会访问内存导致BAD_ACCESS了,vasprintf函数的代码很长,其中访问内存的地方有不少,结合报错的汇编语句:
0x7ff8b9a8732 pxor %xmm0,%xmm0 //将xmm0寄存器清零
0x7ff8b9a8732 pcmpeqb (%rdi),%xmm0 //将rdi寄存器指向的内存的内容与 xmm0 作比较
来看,应该是某个与0比较的操作导致的,而且显示是在 strlen()函数中的出现的。
由此可以推断出,应该是vsprintf中的这一段:
case 's':
s = va_arg(args, char *);
len = strlen(s);
if (precision < 0)
precision = len;
else if (len > precision)
len = precision;
导致的,vsprintf查看到格式符有 %s 后,就找对应的参数,直接对其进行调用 strlen 查看其长度去了。根据我的分析,情况应该是这样的:
printf中遇到%s后,就把对应位置的参数当做是char* 指针对待,对其调用strlen查看其长度,然后当这个参数只是char的时候,就会把字符内容当做指针地址,而一个char的取值在0-255之间,属于用户空间不能访问的内存地址,所以系统就直接报错了。
其实这些细微之处还挺有趣的。