先说两个单词byte和octet
他们都可以翻译成字节,区别就是octet是指八位字节,而byte根据系统的不同,位数也可能会不同。
下面的内容翻译自Wikipedia,但并不完整
http://en.wikipedia.org/wiki/GSM_03.38
在移动技术中,GSM 03.38或者3GPP 23.038是一个基于蜂窝电话在GSM的短消息服务使用的字符集。
信息通过默认GSM7-bit字母表,8-bit数据字母表和16-bit UTF-16字母表编码方式发送
对于GSM手持设备和网络元素,GSM 7-bit字母表是被强制支持的
但是,像阿拉伯语、汉语、韩语或者日语中的字符,必须被编码成16-bit UTF-16字符编码或者扩展的国家语言转换表
GSM信息标准编码是在23.038中建议的7 bit 默认字母表
7-bit字符必须被编码成字节并遵循下面3中包装方式之一:
CBS:使用这种编码方式,小区广播服务中,一条SMS中最多可以发送93个字符(最多包装82字节)
SMS:使用这种编码方式,在GMS网络中,一条SMS中最多可以发送160个字符(最多包装140字节)
USSD:使用这种编码方式,非结构化补充数据业务的SMS信息中,最多可以发送182个字符(最多包装160字节)
GSM 8位数据编码
8-bit数据编码模式处理信息作为原始数据。根据标准,这是编码的字母表是用户特定的
UCS-2编码
这种编码允许用户使用更大范围的字符和语言
UCS-2可以表现最常用的拉丁语和西方字符
一个单一的使用这种编码的SMS GSM信息最多可以有70个字符(140字节)
很多GSM智能手机上,没有UCS-2编码的明确预设置。
默认情况下,使用7-bit编码,直到输入了一个不在GSM 7-bit表中的字符
这种情况下,整个信息使用UCS-2编码方式重新编码,并且一条信息的最大长度立即由160减少到70
编辑短信时,智能手机应该显示已经使用的字符数和最大字符数。当一条信息确实超出了最大限制,信息将被按着包含信息的各个部分的多条连续的SMS发送(在每一部分中使用开始的几个字符包含一个序列号)这些部分之后将在收件人那里重新组装。一些GSM智能手机当需要发送多条短消息时,对需要发送的信息数量将会警告用户。
国家语言转换表
根据将要写入文本语言的不同,这些表格允许使用不同的字符集
对于一个给定的信息,表格的选择是在一个SMS信息的用户数据头部分中选定的
并且可以指定整个文本或者单一字符
使用转换表,一个信息的字符仍然能使用7-bit编码,但是可以使用一个不同的集合来正确显示重音和语言特定的字符
编码到136个字节中(140字节减去用来指示转换表和语言代码的使用的用户数据头需要的4字节)
最多为155个字符(136 * 8 / 7)
对法语、希腊语、俄语、保加利亚语、阿拉伯语、希伯来语和大多数中部欧洲语言需要比默认7-bit标准字符集和默认7-bit扩展字符集更广的范围的语言来说,仍然没有定义国家语言转化表
如果有任何字符不能用默认的GSM 7-bit字符集表示,信息将会被自动使用UCS-2重新编码,代价是一条信息可能会被分成超过两条(当一条信息被分割成多个部分,用户数据头还需要一些字节用来指示每部分的序号)
虽然GSM 03.38的一个修订版中已经为德语、英语、意大利语、西班牙语、荷兰语、瑞典语、丹麦语、芬兰语、挪威语、希腊语和土耳其语的小区广播系统(CBS)定义了数据编码方案,之后的版本中又添加了匈牙利语、波兰语、捷克语、希伯来语、阿拉伯语、俄语和冰岛语,但是没有为这些语言定义编码表。目的是单纯的为了识别信息的语言
日语的基本假名、朝鲜朝鲜文字母或者中国的汉语也没有语言转换表
在日本这通常不是个问题,因为日本信息使用GSM和WAP之外的其他的标准
转贴请保留以下链接
本人blog地址
相关推荐
GSM 03.38 协议(7.05 版 6.01版 4.00版)
gsm03.40 gsm03.38 gsm11.11
含:GSM03.38(字符和特定语言信息) GSM03.39(短消息中心和短消息实体间连接的接口协议) GSM 03.40(点对点短消息业务技术实现) 及GSM 07.07(AT 命令集)
最新 GSM 短消息规范 03.38 最新 GSM 短消息规范 03.38
GSM全球移动通信系统中文版GSM全球移动通信系统中文版GSM全球移动通信系统中文版GSM全球移动通信系统中文版GSM全球移动通信系统中文版GSM全球移动通信系统中文版
此文档为GSM模块 SIM900x系列的调试文档。内容详细。望采纳
一个用c实现的7bit编码和解码,在短息编解码中比较有用。
短信息收发有关的规范主要包括GSM 03.38、GSM 03.40和GSM 07.05
短信息收发有关的规范主要包括GSM 03.38、GSM 03.40和GSM 07.05。前二者着重描述SMS的技术实现(含编码方式),后者则规定了SMS的DTE-DCE接口标准(AT命令集)。短信息的收发共有三钟方式:Block方式, Text方式和PDU方式...
Digital cellular telecommunications system (Phase 2+); Alphabets and language-specific information (GSM 03.38 version 7.2.0 Release 1998)
GSM编码规范 Digital cellular telecommunications system (Phase 2+); Alphabets and language-specific information (GSM 03.38 version 7.2.0 Release)
基于GSM短消息的编解码及编码实现 短消息是由ETST(欧洲电信标准委员会)所制定的一个规范(GSM03.40和GSM03.38)。论文描述了在PDU 模式下收发短信的编解码过程并给出核心部分的代码实现。
SMS是由Etsi所制定的一个规范(GSM 03.40 和 GSM 03.38)。
The SMS message, as specified by the Etsi organization (documents GSM 03.40 and GSM 03.38), can be up to 160 characters long, where each character is 7 bits according to the 7-bit default alphabet....
与我们讨论的短消息收发有关的规范主要包括GSM 03.38、GSM 03.40和GSM 07.05。前二者着重描述SMS的技术实现(含编码方式),后者则规定了SMS的DTE-DCE接口标准(AT命令集)。 一共有三种方式来发送和接收SMS信息:Block ...
与我们讨论的短消息收发有关的规范主要包括GSM 03.38、GSM 03.40 和GSM 07.05。前二者着重描述SMS的技术实现(含编码方式),后者则规定了SMS的DTE-DCE接口标准(AT命令 集)。 一共有三种方式来发送和接收 SMS 信息:...
SMS是由Etsi所制定的一个规范(GSM 03.40 和GSM 03.38)。当使用7-bits编码时,它可以发送最多160个字符;但用8-bit编码,最多可以发送140个字符,通常无法直接通过手机显示;还有用16-bit编码时,最多70个字符
字符编码转换的工具(根据3GPP 03.38,11.11附录等协议),可以把字符转换成ascii,8 bit,7 bit,UCS2,UTF-8编码。 在做手机软件开发的时候,调试WMS,Phone book,STK等模块可能会用的到。
SMS是由Etsi所制定的一个规范(GSM 03.40和GSM 03.38)。当使用7-bits编码的时候它可以发送最多160个字符;8-bit编码(最多140个字符)。通常无法直接通过手机显示;通常被用来作为数据消息,例如:smart messaging中的图片...
字符编码转换的工具(根据3GPP 03.38,11.11附录等协议),可以把字符转换成ascii,8 bit,7 bit,UCS2,UTF-8编码。 在做手机软件开发的时候,调试WMS,Phone book,STK等模块可能会用的到。