全国咨询热线:400-618-4000 | 股票代码:839976

C/C++:教你快速理解大端和小端

更新时间:2018年01月24日15时06分 来源:传智播客

学习底层编程或逆向的童鞋,肯定对这两个名词并不陌生吧?!今天就给大家介绍一下这两个概念.

科普:

大端和小端,老外叫 Big-Endian 和 Little-Endian,其实指的都是同一个东东在计算机界,表示数据在存储器中的存放顺序。不同的 CPU、操作系统对待数据的存储方式各有不同,但一般常见的操作系统都是小端,而通讯协议则是大端。

但并不是说系统是小端形式存储,文件就一定要采用小端的形式,不同的应用程序对于自身数据的存储方式也各有千秋(自家数据爱咋放咋放,有些还打乱了加密呢),比如:

* Adobe PS -- 大端

* BMP -- 小端

* GIF -- 小端

* JPEG -- 大端

* MacPaint -- 大端

* RTF -- 小端

那么小端和大端有什么区别呢?举个栗子大家就明了了:

比如 0x12345678 这个数:

* 大端法在内存中按字节依次存放为:12 34 56 78

* 小端法在内存中按字节依次存放为:78 56 34 12

解释:

大端:较高的有效字节存放在较低的存储器地址,较低的有效字节存放在较高的存储器地址。

比如整型变量 0x12345678 占 4 个字节,那么根据内存地址从小到大它们的存放方式如下:

小端:较高的有效字节存放在较高的的存储器地址,较低的有效字节存放在较低的存储器地址。所以整型变量 0x12345678 根据内存地址从小到大它们的存放方式如下:

转换:

我们发现一个字节是可以存放两个十六进制的数字的(一个字节最大可以存放的数是 0xFF),那如果给你一个十进制数(比如 112233),如何快速地知道它在内存中是如何存放的呢?

l 大端法很容易,直接将它转换成十六进制,然后依次存放即可:0x0001B669

l 小端法则比较麻烦,步骤依次如下:

* 转换成十六进制数(0x0001B669)

* 将八位数字的低四位和高四位互换(0xB6690001)

* 在低四位和高四位中,分别进行两两互换(0x69B60100)

如何检测你的机器是大端还是小端?

前边已经说过,常见的个人电脑大多数都是使用小端,但是我们都是我改变世界的程序猿,不妨考虑小如何使用代码来分辨?

其实不难,通过将int强转为插入单字节,判断其实储存位置:

#include

int main()

{

int a = 0x2233;

char *b = (char *)&a;

if (*b == 0x22)

{

printf("大端!\n");

}

else

{

printf("小端!\n");

}

return 0;

}

彩蛋

大端和小端,事实上是来源于 Jonathan Swift 的《格列佛游记》一书。

以下是 Jonathan Swift 在 1726 年关于大小端之争历史的描述:

……我下面要告诉你的是,Lilliput 和 Blefuscu 这两大强国在过去 36 个月里一直在苦战。战争开始是由于以下的原因:我们大家都认为,吃鸡蛋前,原始的方法是打破鸡蛋较大的一端,可是当今皇帝的祖父小时候吃鸡蛋,一次按古法打鸡蛋时碰巧将一个手指弄破了,因此他的父亲,当时的皇帝,就下了一道敕令,命令全体臣民吃鸡蛋时打破鸡蛋较小的一端,违令者重罚。老百姓们对这项命令极为反感。历史告诉我们,由此曾发生过 6 次叛乱,其中一个皇帝送了命,另一个丢了王位。这些叛乱大多都是由 Blefuscu 的国王大臣们煽动起来的。叛乱平息后,流亡的人总是逃到那个帝国去寻救避难。据估计,先后几次有 11000 人情愿受死也不肯去打破鸡蛋较小的一端。关于这一争端,曾出版过几百本大部著作,不过大端派的书一直是受禁的,法律也规定该派的任何人不得做官……

在他那个时代,Swift 是在讽刺英国(Lilliput)和法国(Blefuscu)之间持续的冲突。Danny Cohen,一位网络协议的早期开创者,第一次使用这两个术语来指代字节顺序,后来这个术语就被广泛地接纳了。

好, 今天的知识点讲解就到这里, 希望大家学习愉快!

本文版权归传智播客C/C++学院所有,欢迎转载,转载请注明作者出处。谢谢!
作者:传智播客C/C++学院
首发:http://www.itcast.cn/c/