MySQL字符编码 - rj0801zxh - ITeye博客

`

rj0801zxh

浏览: 277249 次
性别:
来自: 湖南

最近访客更多访客>>

liaojiyong

u011130870

lic0112

zs245584910

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

iron0313：很好，正是我需要的，谢谢
WdatePicker日期控件显示年月日时分秒
tianbo77：我有一个类似的问题，不知道大神是否还能看到，帮助一下，以下是错 ...
javax.xml.ws.WebServiceException: Unable to create JAXBContext
ctlove1323： ...
hh24:mi:ss与hh24:mm:ss的区别
xb12369：感谢分享
PL/SQL记住登陆密码
luodan12：请问楼主解决了吗？求。
java.lang.LinkageError: You are loading old SAAJ from jar,解决方案_Java

MySQL字符编码

博客分类：

MySQL

阅读更多

思路：让服务器端和客户端的字符集保持一致。
服务器端的编码是由字符集(Character Set)和校对规则(Collation)决定的。
（以下摘自 MySQL 5.1 手册。更多内容可参见：http://dev.mysql.com/doc/refman/5.1/zh/charset.html）
字符集是一套符号和编码。校对规则是在字符集内用于比较字符的一套规则。让我们使用一个假想字符集的例子来区别清楚。
假设我们有一个字母表使用了四个字母：‘A’、‘B’、‘a’、‘b’。我们为每个字母赋予一个数值：‘A’=0，‘B’= 1，‘a’= 2，‘b’= 3。字母‘A’是一个符号，数字0是‘A’的编码，这四个字母和它们的编码组合在一起是一个字符集。
假设我们希望比较两个字符串的值（在if……else语句中我们经常做值的比较）：‘A’和‘B’。比较的最简单的方法是查找编码：‘A’为0，‘B’为1。因为0 小于1，我们可以说‘A’小于‘B’。我们做的仅仅是在我们的字符集上应用了一个校对规则。校对规则是一套规则（在这种情况下仅仅是一套规则）：“对编码进行比较。”我们称这种全部可能的规则中的最简单的校对规则为一个binary（二元）校对规则。
但是，如果我们希望小写字母和大写字母是等价的，应该怎样？那么，我们将至少有两个规则：（1）把小写字母‘a’和‘b’视为与‘A’和‘B’等价；（2）然后比较编码。我们称这是一个大小写不敏感的校对规则。比二元校对规则复杂一些。
在实际生活中，大多数字符集有许多字符：不仅仅是‘A’和‘B’，而是整个字母表，有时候有许多种字母表，或者一个东方的（比如中文、日文、韩文、藏文、泰文等等）使用上千个字符的书写系统，还有许多特殊符号和标点符号。并且在实际生活中，大多数校对规则有许多个规则：不仅仅是大小写不敏感，还包括重音符不敏感（“重音符” 是附属于一个字母的符号，象德语的‘Ö’符号）和多字节映射（例如，作为规则‘Ö’=‘OE’就是两个德语校对规则的一种）。
（以上摘自MySQL 5.1 手册。更多内容可参见：http://dev.mysql.com/doc/refman/5.1/zh/charset.html）
MySQL 4.1.x开始支持以下这些事情
使用多种字符集(Character Set)来存储字符
使用多种校对规则(Collation)来比较字符串
在同一台服务器、同一个数据库或甚至在同一个表中使用不同字符集或校对规则来混合字符串
允许定义任何级别的字符集和校对规则
MySQL 4.1及以上版本的字符集支持(Character Set Support)有两个方面：字符集(Character Set)和校对规则(Collation)。字符集和校对规则有4个级别的默认设置：服务器(server)，数据库(database)，数据表(table)和连接(connection)。
MySQL 中是根据下面几个变量确定服务器端和客户端用的什么字符集：
character_set_client　　　客户端字符集
character_set_connection　客户端与服务器端连接采用的字符集
character_set_results　　　SELECT查询返回数据的字符集
character_set_database　　数据库采用的字符集
也就是说，只要保证这几个变量采用一致的字符集，就不会出现乱码问题了。
查看系统的字符集用下面的命令：
mysql> SHOW VARIABLES LIKE 'character_set_%';
+--------------------------+-----------------------------------------+
| Variable_name | Value |
+--------------------------+-----------------------------------------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | E:\usr\MySQL Server 5.0\share\charsets\ |
+--------------------------+-----------------------------------------+
8 rows in set (0.00 sec)
可以看到，我的这几个变量都是一致的。但如果不一致呢？网上许多教程告诉你“你set names下就解决了”。
那么set names是什么呢？ set names实际上就是同时设置了character_set_client,character_set_connection,character_set_results这三个系统变量。
例如在mysql命令行上输入 set names 'gbk' 命令等同于：
SET character_set_client = gbk;
SET character_set_connection = gbk;
SET character_set_results = gbk;
很多情况下，这样设置了之后就能把乱码问题解决了。但是还是不能完全避免出现乱码的可能，为什么呢？
因为character_set_client，character_set_connection这两个变量仅用与保证与character_set_database编码的一致，而character_set_results则用与保证SELECT返回的结果与程序的编码一致。
例如，你的数据库(character_set_database)用的是utf8的字符集，那么你就要保证character_set_client，character_set_connection也是utf8的字符集。
而你的程序也许采用的并不是utf8，比如你的程序用的是gbk，那么你若把character_set_results也设置为utf8的话就会出现乱码问题。此时你应该把character_set_results设置为gbk。这样就能保证数据库返回的结果与你的程序的编码一致。
到此应该就可以解决绝大多数我们遇到的乱码问题了，另外还必须强调的是，有时候乱码的出现有可能是以上几种原因混合造成的。
总而言之，我们应当尽量的保证数据库中的数据是正确的，就是客户端到服务器端或者服务器端到客户端转换的过程中不要产生乱码，那么问题处理起来就相对简单了。
为便于大家记忆，总结为以下四点：
1、要保证数据库中存的数据与数据库编码一致，即数据编码与character_set_database一致。
2、要保证通讯的字符集与数据库的字符集一致，即character_set_client，character_set_connection与character_set_database一致。
3、要保证SELECT的返回与程序的编码一致，即character_set_results与程序编码一致。
4、要保证程序编码与浏览器编码一致，即程序编码与<meta http-equiv="Content-Type" content="text/html; charset=？" />一致。
附：
1、MySQL服务器能够支持多种字符集。可以使用SHOW CHARACTER SET语句列出可用的字符集：
mysql> show character set;
+----------+-----------------------------+---------------------+--------+
| Charset | Description | Default collation | Maxlen |
+----------+-----------------------------+---------------------+--------+
| big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 |
| dec8 | DEC West European | dec8_swedish_ci | 1 |
| cp850 | DOS West European | cp850_general_ci | 1 |
| hp8 | HP West European | hp8_english_ci | 1 |
| koi8r | KOI8-R Relcom Russian | koi8r_general_ci | 1 |
| latin1 | cp1252 West European | latin1_swedish_ci | 1 |
| latin2 | ISO 8859-2 Central European | latin2_general_ci | 1 |
| swe7 | 7bit Swedish | swe7_swedish_ci | 1 |
| ascii | US ASCII | ascii_general_ci | 1 |
| ujis | EUC-JP Japanese | ujis_japanese_ci | 3 |
| sjis | Shift-JIS Japanese | sjis_japanese_ci | 2 |
| hebrew | ISO 8859-8 Hebrew | hebrew_general_ci | 1 |
| tis620 | TIS620 Thai | tis620_thai_ci | 1 |
| euckr | EUC-KR Korean | euckr_korean_ci | 2 |
| koi8u | KOI8-U Ukrainian | koi8u_general_ci | 1 |
| gb2312 | GB2312 Simplified Chinese | gb2312_chinese_ci | 2 |
| greek | ISO 8859-7 Greek | greek_general_ci | 1 |
| cp1250 | Windows Central European | cp1250_general_ci | 1 |
| gbk | GBK Simplified Chinese | gbk_chinese_ci | 2 |
| latin5 | ISO 8859-9 Turkish | latin5_turkish_ci | 1 |
| armscii8 | ARMSCII-8 Armenian | armscii8_general_ci | 1 |
| utf8 | UTF-8 Unicode | utf8_general_ci | 3 |
| ucs2 | UCS-2 Unicode | ucs2_general_ci | 2 |
| cp866 | DOS Russian | cp866_general_ci | 1 |
| keybcs2 | DOS Kamenicky Czech-Slovak | keybcs2_general_ci | 1 |
| macce | Mac Central European | macce_general_ci | 1 |
| macroman | Mac West European | macroman_general_ci | 1 |
| cp852 | DOS Central European | cp852_general_ci | 1 |
| latin7 | ISO 8859-13 Baltic | latin7_general_ci | 1 |
| cp1251 | Windows Cyrillic | cp1251_general_ci | 1 |
| cp1256 | Windows Arabic | cp1256_general_ci | 1 |
| cp1257 | Windows Baltic | cp1257_general_ci | 1 |
| binary | Binary pseudo charset | binary | 1 |
| geostd8 | GEOSTD8 Georgian | geostd8_general_ci | 1 |
| cp932 | SJIS for Windows Japanese | cp932_japanese_ci | 2 |
| eucjpms | UJIS for Windows Japanese | eucjpms_japanese_ci | 3 |
+----------+-----------------------------+---------------------+--------+

分享到：

从一个jsp页面跳转到另一个jsp页面中文参 ... | WebService------常见异常

2012-06-11 21:51
浏览 848
评论(0)
分类:数据库
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

MySQL字符编码及乱码解决方案.txt: MySQL字符编码及乱码解决方案 · 使用多种字符集来存储字符串 · 使用多种校对规则来比较字符串 · 在同一台服务器, 同一个数据库或甚至在同一个表中使用不同字符集或校对规则来混合字符串 · 允许定义任何级别...

教程：修改mysql字符编码成为UTF8.docx: 教程：修改mysql字符编码成为UTF8

Unity3D教程：修改mysql字符编码成为UTF82: 163、一般就算设置了表的默认字符集为utf8并且通过UTF-8编码发送查询，你会发现存入数据库的仍然是乱码。解决方法是在发送查询前执行一下下面这句：

Honye#notes#MySQL字符编码1: 查看MySQL数据库的编码C:\Program Files\MySQL\MySQL Server 5.5\bin\mysql.exe Ver 14.14 Dis

MySQL字符编码设置方法: 主要介绍了MySQL字符编码设置方法的相关资料,需要的朋友可以参考下

微信开发中mysql字符编码问题: 本文给大家介绍微信开发过程中mysql字符编码问题，本文介绍的非常详细，感兴趣的朋友一起来学习吧

Mysql字符集编码详解: Mysql数据库乱码问题彻底解决针对JAVA

mysql批量修改字符编码: mysql批量修改字符编码,可以把整个数据库的所有表的charset统一设置为utf-8的。

MySQL修改默认字符集编码的方法: 查看MySQL字符集的命令是“show variables like ‘%char%’;”。以MySQL5.6为例，默认的字符集为：在工作中需要将字符集全部修改为utf8。以下是修改的方法： 1.打开安装目录，默认在“C:\Program Files\...

php字符编码确定: php+mysql字符编码确定

mysql修改数据库编码(数据库字符集)和表的字符编码的方法: 修改数据库mysql字符编码为UTF8 步骤1：查看当前的字符编码方法代码如下:mysql> show variables like’character%’; +————————–+—————————-+ |Variable_name |Value | +————————–+...

MySQL字符编码设置: 　修改mysql的编码方式可以有以下几个：　1.通过配置文件修改my.ini(windows下)或/etc/my.cnf(linux下) 　分别添加如下内容　[mysqld] 　character_server_set=utf8 　[mysql] 　default-character-set=utf...

修改MySQL默认字符集编码: 　查看MySQL字符集的命令是“show variables like '%char%';”。　以MySQL5.6为例，默认的字符集为：　在工作中需要将字符集全部修改为utf8。　以下是修改的方法：　1.打开安装目录，默认在“C:Program...

MYSQL字符集与乱码问题分析: 详细介绍了字符编码的渊源，解释了MySQL中字符编码

Linux 下设置mysql数据库为utf8编码的方法: 如果您已经有了现有的数据库，需要确认字符编码和排序规则： SHOW VARIABLES LIKE 'character%'; SHOW VARIABLES LIKE 'collation%'; 如果结果不是 UTF-8，可以使用以下命令将数据库改为 UTF-8 编码： ALTER ...

SQLyog MysqL汉化界面可设字符编码: MysqL的汉化界面，功能全面，可以设置存储的字符编码方式。

MySql函数－取一个字符串分隔后指定位置的子字符串: 一、函数功能：对字符串进行分隔数组，取指定顺序位置的子字符串，支持左右双向获取，支持默认值返回，附有测试用例二、函数格式：fn_get_split_val(in_str varchar,in_delimiter varchar,in_order int,in_default ...

深入UTF8字符编码.doc: UTF8字符编码：windows编码、文本工具的字符编码、Java编译器的字符编码、MySql的UTF8编码

Global site tag (gtag.js) - Google Analytics