问题引出
C语言中,在需要用到16进制数据的时候,可以通过printf
函数的%x
格式打印数据的16进制形式。在某些位标记、位操作的场合,需要用到2进制格式的数据,但printf
函数不能输出2进制格式,虽然可以通过使用itoa
或_itoa
的方法转为2进制的字符串打印,但显示的长度是不固定的,无法显示有效数位前面的0。
例如:现在需要打印数字258的2进制格式,且需要将32位全部显示出来,即想要得到结果00000000 00000000 00000001 00000010
,而使用_itoa
的方法和打印结果为:
1 2 3 4
| int a = 258; char s[32]; _itoa(a, s, 2); printf("a --> %s\n", s);
|
不是我们想要的格式!
数据存储原理探析
那要怎么办呢?自己写个小程序吧,思路如下:
首先弄清楚数据在计算机中是如何存储的,对应int型数字,在32或64位计算机中都占4个字节,而计算机中的数据存储是以字节(Byte)为单位,1个字节包含8个位(bit),例如,数字258的16进制形式为0x00000102
,2进制形式为:00000000 00000000 00000001 00000010
,其在计算机内存中的存储方式如图所示:
右侧的16进制数是内存的地址,向上递增,方框里的二进制数是内存单元实际存储的字节内存,我们可以通过程序测试验证一下,因为unsigned char或char类型在系统是占用一个字节,因此可以定义该变量的指针,分别指向int的4个字节,打印其内存地址和实际存储的内存进行验证,代码如下:
1 2 3 4 5 6 7 8 9 10
| int a = 258;
unsigned char *p1 = (unsigned char*)&a; unsigned char *p2 = (unsigned char*)&a+1; unsigned char *p3 = (unsigned char*)&a+2; unsigned char *p4 = (unsigned char*)&a+3; printf("[a] p1:%x, %d\r\n", p1, *p1); printf("[a] p2:%x, %d\r\n", p2, *p2); printf("[a] p3:%x, %d\r\n", p3, *p3); printf("[a] p4:%x, %d\r\n", p4, *p4);
|
运行结果:
1 2 3 4
| [a] p1:5216f804, 2 [a] p2:5216f805, 1 [a] p3:5216f806, 0 [a] p4:5216f807, 0
|
可以看出,随着地址的增加,存储的内存依次是2、1、0、0,对应数字258的从底到高的4个字节的值,另外每次运行程序,变量a的地址是自动分配的,所以每次的输出与上面示意图的地址是不同的,但都是4个连续增加的地址值。
另外补充一下,这是一种小端字节序的存储方法,即将一个数据的低字节存储在内存的低地址,或理解为先存储数据的低字节。与之对应的是大端字节序存储方式,即先存储数据的高位字节,类似与我们书写数字时从左到右先写高位数字一样。由于计算机先处理地位字节的效率比较高,因此计算机内部的数据处理均采用小端字节序,而为了方便人的阅读,除了计算机内部处理,其它场合是采用大端字节序的。可通过下面的示意图助记:
另外,需要区分一点,无论大端还小端字节序,在一个字节的内部的8位2进制数,都是按照人类的习惯从左到右存放,如00000010
在字节中也是按照这样存储的,不需要反过来。
C代码实现
分析了这么多,可以编写代码来输出一个数字的2进制格式形式了。具体的代码实现:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
| void printf_bin(int num) { int i, j, k; unsigned char *p = (unsigned char*)&num + 3;
for (i = 0; i < 4; i++) { j = *(p - i); for (int k = 7; k >= 0; k--) { if (j & (1 << k)) printf("1"); else printf("0"); } printf(" "); } printf("\r\n"); }
|
数字258的实际运行效果:
1
| 00000000 00000000 00000001 00000010
|
对应unsigned char型的数字,如果只需要显示8位2进制数,可以对上述小程序简化:
1 2 3 4 5 6 7 8 9 10 11 12 13 14
| void printf_bin_8(unsigned char num) { int k; unsigned char *p = (unsigned char*)#
for (int k = 7; k >= 0; k--) { if (*p & (1 << k)) printf("1"); else printf("0"); } printf("\r\n"); }
|
数字12的运行效果
关于负数
上面测试的都是正数,当然,对于负数,也是可以显示的,因为负数在计算机中是以对应正数的补码来存储的,因而显示的2进制数也是补码形式,这里顺便再复习一下补码:
对于负数-9,对应的正数位9,9的原码,反码,补码如下:
这里只画出8位示意,int型数字实际是占32位,对应的高位全是0或1。
使用程序测试一下-9的2进制格式输出:
1
| 11111111 11111111 11111111 11110111
|
可以正确显示。
完整测试代码
下面是整个本文的整个测试程序:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92
| #include <stdio.h> #include <stdlib.h>
void printf_bin(int num) { int i, j, k; unsigned char *p = (unsigned char*)&num + 3;
for (i = 0; i < 4; i++) { j = *(p - i); for (int k = 7; k >= 0; k--) { if (j & (1 << k)) printf("1"); else printf("0"); } printf(" "); } printf("\r\n"); }
void printf_bin_8(unsigned char num) { int k; unsigned char *p = (unsigned char*)#
for (int k = 7; k >= 0; k--) { if (*p & (1 << k)) printf("1"); else printf("0"); } printf("\r\n"); }
int main() { int a = 258; int b = -9; printf("定义int a=%d, int b=%d\r\n", a, b);
unsigned char *p1 = (unsigned char*)&a; unsigned char *p2 = (unsigned char*)&a+1; unsigned char *p3 = (unsigned char*)&a+2; unsigned char *p4 = (unsigned char*)&a+3; printf("\r\n查看a的每个字节的地址与内容:\r\n"); printf("[a] p1:%x, %d\r\n", p1, *p1); printf("[a] p2:%x, %d\r\n", p2, *p2); printf("[a] p3:%x, %d\r\n", p3, *p3); printf("[a] p4:%x, %d\r\n", p4, *p4);
p1 = (unsigned char*)&b; p2 = (unsigned char*)&b + 1; p3 = (unsigned char*)&b + 2; p4 = (unsigned char*)&b + 3; printf("\r\n查看b的每个字节的地址与内容:\r\n"); printf("[b] p1:%x, %d\r\n", p1, *p1); printf("[b] p2:%x, %d\r\n", p2, *p2); printf("[b] p3:%x, %d\r\n", p3, *p3); printf("[b] p4:%x, %d\r\n", p4, *p4);
printf("\r\na的2进制格式(显示32位):\r\n"); printf_bin(a); printf("\r\nb的2进制格式(显示32位):\r\n"); printf_bin(b);
unsigned char c = 12; printf("\r\n定义unsigned char c=%d\r\n", c); printf("c的2进制格式(显示8位):\r\n"); printf_bin_8(c);
printf("\r\n使用_itoa函数显示2进制格式\r\n"); char s[32]; _itoa(a, s, 2); printf("a --> %s\n", s); _itoa(b, s, 2); printf("b --> %s\n", s); _itoa(c, s, 2); printf("c --> %s\n", s);
getchar();
return 0; }
|
运行结果:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
| 定义int a=258, int b=-9
查看a的每个字节的地址与内容: [a] p1:a739f4d4, 2 [a] p2:a739f4d5, 1 [a] p3:a739f4d6, 0 [a] p4:a739f4d7, 0
查看b的每个字节的地址与内容: [b] p1:a739f4f4, 247 [b] p2:a739f4f5, 255 [b] p3:a739f4f6, 255 [b] p4:a739f4f7, 255
a的2进制格式(显示32位): 00000000 00000000 00000001 00000010
b的2进制格式(显示32位): 11111111 11111111 11111111 11110111
定义unsigned char c=12 c的2进制格式(显示8位): 00001100
使用_itoa函数显示2进制格式 a --> 100000010 b --> 11111111111111111111111111110111 c --> 1100
|