`
zhaohaolin
  • 浏览: 984219 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

高位字节优先 低位字节优先

 
阅读更多

自第一台计算机诞生,其最小存储单元就被永久的定格了——一个由8个比特(bit)组成的称为字节(byte)的单位。计算机的所有内存以字节数组的方式进行编址。
当一个逻辑上长于一个字节的整形数据放置在内存中时(比如16位,32位,和64位的整数),计算机设计者需要考虑这些字节的存储顺序。一些体系结构的设计者选择了将字节的逻辑顺序与物理顺序一致,即将逻辑上较低的字节放置在物理上较低的字节上;另外一些设计者则选择了将字节的逻辑顺序与物理顺序相反,即将逻辑上较低的字节放置在物理上较高的字节上。前者被称为“little endian”,比如Intel x86系列;后者则被称为“big endian”,比如Motorola的PowerPC以及Sun Sparc。还有一些平台同时支持两种方案,由开发者决定使用哪一种。
两种选择为底层开发者带来了一定的困扰。比如,两个字节顺序不一致的平台之间进行通信,或者在两个字节顺序不一致的平台之间移植系统。这都是跨平台的例子,对于这些情况,字节顺序的问题是不能回避的。对于仅仅在一种平台上进行开发的程序员而言,如果它能够避免强制类型转换(比如将字节数组强制转换为一个长整数),一贯的以逻辑顺序来操作大于一个字节的整数,应该可以回避这个问题。但由于C语言是一种非常灵活的语言,有时候通过强制类型转换可以让代码非常精简,甚至达到非常巧妙的效果,所以,要求C程序员完全回避这个问题,几乎是不现实的。
由于Little Endian提供了逻辑顺序与物理顺序的一致性,让编程者摆脱了不一致性所带来的困扰,C语言开发者可以无所顾忌的按照自己的意愿进行强制类型转换,所以现代体系结构几乎都支持Little Endian。但Big Endian也有其优点,尤其对于汇编程序员:他们对于任意长度的整数,总是可以通过判断Byte 0的bit-7来查看一个整数的正负;对于Little Endian则不得不首先知道当前整数的长度,然后查看最高byte的bit-7来判断其正负。对于这种情况,big endian的开发者可以写出非常高效的代码。
两派的支持者争论不休,正像他们所支持名词(big endian和little endian)的典故所讲述的那样:Little Endian和Big Endian这两个名词来源于Jonathan Swift的《格利佛游记》其中交战的两个派别无法就应该从哪一端--小端还是大端--打开一个半熟的鸡蛋达成一致。:)在那个时代,Swift是在讽刺英国和法国之间的持续冲突,Danny Cohen,一位网络协议的早期开创者,第一次使用这两个术语来指代字节顺序,后来这个术语被广泛接纳了(摘自《深入理解计算机系统》)。
需要特别指出的是,通常所提到的Little Endian和Big Endian仅仅指字节顺序。在硬件设计者的术语中,对于一个字节内部的bit顺序也分Little Endian和Big Endian,但对于程序员而言,这些bit顺序的不同是透明的,也就是说,程序员只需要按照逻辑顺序来看待和操作字节内部的bit即可。
Endian的不同不仅仅带来字节顺序的不同,还有更多的问题。如果C程序员在定义一个结构体时,使用了bitwise的域定义,比如:
struct foo {
 int  a:3;
 int b:7;
 int c:13;
 int d:9;
};
这个结构体的一个对象会占用4个字节。由于a,b,c,d的类型都是int,所以他们都在以int32为单位的整数上分配bit,另外,由于他们的bit数量正好等于int32的bit数,所以,它们都分配于一个int所占用的空间。关键问题在于这些字节在这4个字节内是分配顺序是怎么样的?
对于little endian,其分配顺序与逻辑顺序是一致的,即在byte[0]的bit[0~2]上分配a,在byte[0]的bit[3,7]以及byte[1]的bit[0,1]上分配b,依次类推。
对于big endian,其方案会带来很大的问题。其分配顺序为:
字节物理顺序:从低到高;
字节内bit顺序:从高到底;
也就是说,big endian在bitwise的分配方案上,从字节顺序到bit顺序都反过来了(因为其正向存储顺序为:字节从高到底,bit从低到高(从程序员的观点看))。换句话说:big endian的bit分配顺序为,按照bit的逻辑顺序,从高到底进行分配。
          
                     |--------|--------|--------|--------|
Logical Byte Order   | byte 3 | byte 2 | byte 1 | byte 0 |
                     |--------|--------|--------|--------|
Bitwise allocation   |-a-|---b---|------c------|----d----|
请注意,并不是硬件平台使用的这种方案,而是C语言编译器。这是一种荒谬的方案,我想可能是C语言编译器的早期开发者希望通过编译器屏蔽掉big endian和little endian在bitwise allocation上的差异,而都与物理存储顺序一致。但由于其采用了bit order的反向分配,反而加剧了这种差异,随后的编译器为了保持兼容,也只好将错误延续了下来。
基于这种原因,在C语言中直接使用bitwise的方式定义结构体是一种危险的方式,因为这些代码是平台依赖的。当进行跨平台移植的时候必须重新定义这些结构体。
有两种方式可以消除这种风险:
1、使用逻辑移位的方式来操作bit;以上面的例子为例,我们可以这么做:
struct foo {
 int value;
};
#define SET_A(f,a)  do { (f) |= ((a)&0x7); } while(0)
#define SET_B(f,b)  do { (f) |= (((b)&0x7F)<<3); } while(0)
#define SET_C(f,c)  do { (f) |= (((c)&0x1FFF)<<10); } while(0)
#define SET_D(f,d)  do { (f) |= (((d)&0x1FF)<<23); } while(0)
#define GET_A(f)  ((f)&0x7)
#define GET_B(f)  (((f)>>3)&0x7F)
#define GET_C(f)  (((f)>>10)&0x1FFF)
#define GET_D(f)  (((f)>>23)&0x1FF)
2、对于big endian,我们可以使用相反的顺序来声明bitwise fields。仍然以上例为例:
#if LITTLE_ENDIAN
#define BITWISE(type,a,b,c,d)  type a, b, c, d
#else
#define BITWISE(type,a,b,c,d)  type d, c, b, a
#endif
struct foo {
 BITWISE(int, a:3, b:7, c:13, d:9);
};
对于little endian,逻辑顺序与物理顺序一致,只需要按照原样定义;而对于big endian,由于其整体的bit顺序恰好与逻辑顺序是相反的,所以,我们将顺序反过来,使其bit的分配顺序与逻辑顺序一致即可。
 

分享到:
评论

相关推荐

    CRC校验,高位在前,低位在后.zip

    输入为字符串,返回为标准的crc16校验码,高位在前,低位在后

    S7-200SMART PLC中如何交换一个字WORD的高低字节?.docx

    S7-200SMART PLC中如何交换一个字WORD的高低字节?

    一个字拆分成高低字节;;

    一个字拆分成高低字节 西门子1200的库,添加到博图v14sp1及以上版本软件的全局库文件夹中,在程序中即可调用;

    python的数字转字节和字节转数字【有正负】

    高位在前:'big' 低位在前:little 最高位为符号: 有符号:True 无符号:False 如: &gt;&gt;&gt;(1024).to_bytes(2,'big') b'\x04\x00' &gt;&gt;&gt;(-1024).to_bytes(2,'big') Traceback (most recent call last): File ,

    MFC详解之网络编程

    可以利用MAKEWORD(x,y)宏(其中x是高位字节,y是低位字节)方便地获取该参数的正确值。 LPWSADATA lpWSAData //[out]指向WSADATA结构体的指针,该函数用其加载的库版本有关的信息填在这个结构体中。 );

    基于大端法、小端法以及网络字节序的深入理解

    小端法(Little-Endian)就是低位字节排放在内存的低地址端即该值的起始地址,高位字节排放在内存的高地址端。 2.大端法(Big-Endian)就是高位字节排放在内存的低地址端即该值的起始地址,低位字节排放在内存的高地址端...

    兼容C# VB.net的TripleDES加解密的java源码

    而DotNET转换后,无前二字节,低位在前,高位在后。因此,为与DotNET一致,Java用unicode参数取得字节数组后须再次处理!同理,DotNET的unicode字节数组转换到JAVA字符串前,要调换高地位字节,之后带Unicode参数...

    BIG5编码表又称大五码,是繁体中文字符集编码标准,共收录13060个中文字。

    高位字节使用了0x81-0xFE,低位字节使用了0x40-0x7E,及0xA1-0xFE。在BIG5的分区中: 8140-A0FE 保留给使用者自定义字符(造字区) A140-A3BF 标点符号、希腊字母及特殊符号。其中在A259-A261,收录了度量衡单位用字:兙兛...

    C语言指针的定义和使用

    windows电脑在做数据存储时采用小端对齐(低位数据放在低位内存地址,高位数据放在高位内存地址)。 大端对齐:低位数据放在高位内存地址,高位数据放在低位内存地址。 计算机的字节顺序模式分为大端数据模式和小端...

    谈到字节排序的问题.doc

    谈到字节排序的问题.doc 大端 小端 高位 低位

    大小端判断代码解析详解

    大端模式:高位字节存在低位地址上 小端模式:高位字节存在高位地址上

    keil c 单片机串口通信多字节收发

    串口是计算机上一种非常通用设备通信的协议...高位和低位不真正的检查数据,简单置位逻辑高或者逻辑低校验。这样使得接收设备能够知道一个位的状态,有机会判断是否有噪声干扰了通信或者是否传输和接收数据是否不同步。

    big、CString_int_string_char数据类型之间的转换

    big、CString_int_string_char等数据类型之间的转换.pdf

    高低位互换 C51程序

    使用说明: 某种情况下,我们需要将一个数的高低位互换,也就是说将一个数的第0位与第七位互换,第1位与第六位互换。以此类推。一时想不出,这里有两种算法。 有仿真文件。将一个数给a。转换成b。...

    Android 和 windows C/C++/QT通讯时字节存储

    ava:采用大端字节序存储数据【低地址存放数据的高位,高地址存放数据的低位,数据高位存放在数组的前面】 windows(intel平台):采用小端字节序存储数据【低地址存放数据的低位,高地址存放数据的高位,数据的高位...

    DS18B20内部数据结构.doc

    "序号 "暂存器内容 "EEPROM " "0 "温度值低位字节 " " "1 "温度至高位字节 " " "2 "TH/用户寄存器字节1 "TH/用户寄存器字节1 " "3 "TL/用户寄存器字节2 "TL/用户寄存器字节2 " "4 "配置寄存器 "配置寄存器 " "5 ...

    台达PLC中的寄存器如何进行高低位调换?.docx

    台达PLC中的寄存器如何进行高低位调换?

    关于大小端、位域的一些概念详解

    大小端: 对于像C++中的char这样的数据类型,它本身就是占用一个字节的大小,不会产生什么问题。但是当数制类型为int,在32bit的系统中...小端:(Little-Endian)就是把数字的高位字节放在高位的地址上,低位字节放在

    微机期末复习卷

    或在字操作时,由低位字节向高位字节有进位或借位,则AF=1,否则AF=0。 (4) ZF 零标志。若运算结果为0,则ZF=1,否则ZF=0。 (5) D 方向标志。若用指令置DF=1,则串操作指令就为自动减量指令,也就是从高地址向低...

    Protocol Buffers协议编码规则

    Protocol Buffers之所以...3.Varints方法用Litte-Endian(小端)字节序(低位字节排放在内存的低地址端,高位字节排放在内存的高地址端)。 示例,300用Varints序列化的结果是1010 1100 0000 0010,解码过程如下所示 ...

Global site tag (gtag.js) - Google Analytics