燕双鹰终于输了,输在码农做的子弹有BUG,俄罗斯转轮有风险|布尔表达式和布尔类型
扫描二维码
随时随地手机看文章
上一篇文章《C语言bool占用4个字节?汇编之下无秘密|带你看extern》分析在C99标准下bool类型占用1Byte,而不是1bit,C语言 不存在内存长度小于8bit的数据类型,思考:
1、如果bool类型高7bit不是0,使用bool类型是否出现匪夷所思的结果?
2、执行if判断bool类型时,它判断的是所有8比特?还是最低比特?
接下来我分享一个奇特的案例现象,并在从反汇编角度去解释现象产生原因。
1. 俄罗斯转轮
玩个勇敢者的赌枪游戏——俄罗斯转轮。
左轮手枪弹槽筛入一颗子弹,快速旋转弹槽,合上弹槽,朝着对方脑袋开枪,活下来的胜利。接下来友请赌枪游戏必胜客“燕双鹰”。
燕双鹰:“我有个习惯,会杀死向自己开枪的人,哪怕他的枪里没有子弹……”
我:“等等燕大侠,没抢、没抢。解放了70年咯,1966年在大会堂玻璃被子弹击穿事件后,周总理就下达指令全民禁枪、民众自愿上缴枪械。”
燕双鹰:“那为什么请我出场?”
我:“21世纪国家科研、资本家压榨都讲成本,没有枪械,可以模拟呀。自动驾驶不一定都需要先造车再去马路上跑,完全能建立3D场景,在游戏虚拟环境下训练自动驾驶算法。同样赌枪游戏也能模拟。
“子弹放在8bit寄存器里,寄存器相当于弹槽,最低比特相当于蓄势待发的子弹。下面是游戏的源代码。”
传入0:表示抢里没有子弹。
传入1:表示子弹在第1激发位置。
传入2:表示子弹在第2激发位置。
传入4:表示子弹在第3激发位置。
燕双鹰:“明白,来~咱们弄点刺激的,随机放入2颗子弹如何,编剧从来没允许我在赌抢上输过。”
我:“大侠且慢,暖男郭先生说冲动是魔鬼,咱们1颗子弹试试水。”
筛入1颗子弹,子弹落入第2激发位置,扣动扳机,屏幕上显示“false:燕双鹰赢”。燕双鹰脸上漏出招牌式微笑。
下一刻屏幕紧跟着输出“true:Bang 燕双鹰你输了”,燕双鹰眉头显出深深的“川”字纹。
各位看官,你能想到燕双鹰中弹原因吗?当然,如果你能保证绝对不会往布尔类型传递0/1以外的值,本文不用继续往下读。
all: @gcc bool-char.c -g @objdump a.out -S > a.dis @./a.out 0 @./a.out 1 @./a.out 2 @./a.out 3
2. 汇编解释
接下来解释燕双鹰为什么会输。
同样的代码在x86、ARM、mips架构下用gcc编译,执行结果都一样,至于汇编我只解释x86架构下的指令。
两条件表达式的汇编都差不多,唯一区别是第一条多一个异或指令。
movzbl -0x9(%rbp),%eax:以4Byte方式载入数据到eax寄存器,eax是32bit寄存器,eax存储的是弹槽子弹位置。
test %al, %al:al寄存器的值和它自己“与”操作,al是eax的低8bit寄存器。只要al寄存器8bit不全为0,则返回真。
test指令和and指令都是执行“与”操作,不过test指令会影响3个标志位:SF(执行后数据的正负)、ZF(执行后结果是否为0)、PF(执行后二进制1的个数是否为偶数),and指令不会修改他们, 本文关注的是ZF标志位。
xor $0x1,%eax:仅对eax寄存器的最低比特执行异或。
C代码“if(!a)”的感叹号“!”被编译器翻译成xor和test的组合。注意到了吗,只要eax不是0或1,两条指令都会执行。
2.1. 执行if(!a)
如果eax=0x00,则xor结果eax=0x01;test返回真
如果eax=0x01,则xor结果eax=0x00;test返回假
如果eax=0x02,则xor结果eax=0x03;test返回真
2.2. 执行if(a)
如果eax=0x00,test返回假
如果eax=0x01,test返回真
如果eax=0x02,test返回真
3. 小白才写得出的代码
看官或许会想:“正常情况谁会这么写例子上的垃圾代码,往bool传递0/1以外的数据,八成是作者为了水文章瞎弄文案。”
“No No No。”
6年前我曾今写过一个C函数,函数需要传递bool类型“指针”。在同事眼里:“布尔类型嘛,懂~,老熟人咯。”
于是,他强制转换char为bool,向我的函数传递变量指针。
绝大多数C语言学习者的实操平台要么是Keil C51、要么是Trubo C,两个编译环境都使用C89标准,按照C89的套路,bool类型通常都是重新定义char得来(typedef char bool),殊不知bool类型已经被C99正式收编,GCC也给它名份,成了C语言家族的第9房小妾(其他妻妾包括char、short、int、long、float、double、void、指针)。
void fun(bool *a){ if (!*a) { printf("false\r\n"); } if (*a) { printf("true\r\n"); }}int main(int argc, char **argv) { char in = 2; fun((bool*)&in); return 0;}
若同事规规矩矩的向布尔类型赋值0(false)或1(true)还好,可谁曾想到他某次传递一个2进去,一个表达式凭什么既可能是true、也同时是false呢?
$ ./a.out falsetrue
猜测同事把布尔类型和布尔表达式搞混了:
布尔类型:只观察最低比特。
布尔表达式:非0即是真。
4. 指令修改
从汇编角度来说,如果“test %al, %al”能改成“test %0x1, %al”就没有匪夷所思的问题了,如此一来应该会降低CPU的效率,毕竟执行指令还需要一个立即数,我没搞过编译器也没设计过CPU,纯属瞎猜,能搞编译器的家伙都是大牛的存在,咱们吃瓜的参合个啥!