tonysmith 发表于 2013-1-15 08:12:18

mysql查看数据库字符集

Mysql查看编码方式专题 
 
   
 
Mysql查看编码方式专题
一、查看数据库的字符集
show variables like 'character\_set\_%';
输出:
+--------------------------+--------+
| Variable_name            | Value  |
+--------------------------+--------+
| character_set_client     | latin1 |
| character_set_connection | latin1 |
| character_set_database   | latin1 |
| character_set_filesystem | binary |
| character_set_results    | latin1 |
| character_set_server     | latin1 |
| character_set_system     | utf8   |
+--------------------------+--------+
结合以下的编码表我们发现当前的数据库系统的编码:
 
latin1_bin  
 
西欧 (多语言), 二进制  
 
 
 
binary  
 
二进制  
 
 
以上是我在linux环境中的查看的结果编码集了。我现在WIN平台上面查看编码集结果如:
+--------------------------+--------+
| Variable_name            | Value  |
+--------------------------+--------+
| character_set_client     | utf8   |
| character_set_connection | utf8   |
| character_set_database   | utf8   |
| character_set_filesystem | binary |
| character_set_results    | utf8   |
| character_set_server     | utf8   |
| character_set_system     | utf8   |
+--------------------------+--------+
为什么会出现不一致的情况呢?在我本机上面是显示的UTF-8.而在LINUX上面居然是
 
二、通过命令修改其编码
创建数据库指定数据库的字符集
mysql>create database mydb character set utf-8;#直接指定其编码
直接通过命令进行修改
set character_set_client=utf8;
set character_set_connection=utf8;
set character_set_database=utf8;
set character_set_results=utf8;
set character_set_server=utf8;
修改完了之后再查询
show variables like 'character\_set\_%';
+--------------------------+--------+
| Variable_name            | Value  |
+--------------------------+--------+
| character_set_client     | utf8   |
| character_set_connection | utf8   |
| character_set_database   | utf8   |
| character_set_filesystem | binary |
| character_set_results    | utf8   |
| character_set_server     | utf8   |
| character_set_system     | utf8   |
+--------------------------+--------+
结果全部都调整修改成UTF-8了!
修改完了之后我看 select * from address_address; 出现乱码了!Django也乱码
 
三、解决数据导入导出的乱码问题
#create database nginxdjango;
# use nginxdjango;
# show variables like 'character\_set\_%';
#打印输出居然是如下
+--------------------------+--------+
| Variable_name            | Value  |
+--------------------------+--------+
| character_set_client     | latin1 |
| character_set_connection | latin1 |
| character_set_database   | latin1 |
| character_set_filesystem | binary |
| character_set_results    | latin1 |
| character_set_server     | latin1 |
| character_set_system     | utf8   |
+--------------------------+--------+
依旧是latin编码的。
OK。我将其编码设置一下
set character_set_client=utf8;
set character_set_connection=utf8;
set character_set_database=utf8;
set character_set_results=utf8;
set character_set_server=utf8;
再查询一下其编码格式为:
+--------------------------+--------+
| Variable_name            | Value  |
+--------------------------+--------+
| character_set_client     | utf8   |
| character_set_connection | utf8   |
| character_set_database   | utf8   |
| character_set_filesystem | binary |
| character_set_results    | utf8   |
| character_set_server     | utf8   |
| character_set_system     | utf8   |
+--------------------------+--------+
现在将数据导进来
source /python/django/sql/nginxdjango.sql;
其中的 nginxdjango.sql 其编码也是utf-8 格式的!
 
导进来 数据库查看居然还是乱码不过程序跑起来是正常了!
 
 
 
 
 
 
MySQL字符集编码的类型种类
gb2312_chinese_ci和gbk_chinese_ci以及gb2312_bin,gbk_bin的区别
gb2312_chinese_CI : 只支持简体中文
gb2312_BIN   :而gb2312_bin可以说是gb2312_chinese_ci的一个子集,
而且gb2312_BIN是二进制存储.区分大小写数据库编码格式就意义不一样了
gbk_chinese_CI   支持简体中文和繁体
gbk_bin   解释同gb2312_BIN     对应gbk_chinese_CI
PS:GBK包括了简体与繁体两种类型
 
附表:
mysql字符集和整理列表
 
armscii8 (ARMSCII-8 Armenian)  
 
armscii8_bin  
 
亚美尼亚语, 二进制  
 
armscii8_general_ci  
 
亚美尼亚语, 不区分大小写  
 
ascii (US ASCII)  
 
ascii_bin  
 
西欧 (多语言), 二进制  
 
ascii_general_ci  
 
西欧 (多语言), 不区分大小写  
 
big5 (Big5 Traditional Chinese)  
 
big5_bin  
 
繁体中文, 二进制  
 
big5_chinese_ci  
 
繁体中文, 不区分大小写  
 
binary (Binary pseudo charset)  
 
binary  
 
二进制  
 
cp1250 (Windows Central European)  
 
cp1250_bin  
 
中欧 (多语言), 二进制  
 
cp1250_croatian_ci  
 
克罗地亚语, 不区分大小写  
 
cp1250_czech_cs  
 
捷克语, 区分大小写  
 
cp1250_general_ci  
 
中欧 (多语言), 不区分大小写  
 
cp1251 (Windows Cyrillic)  
 
cp1251_bin  
 
西里尔语 (多语言), 二进制  
 
cp1251_bulgarian_ci  
 
保加利亚语, 不区分大小写  
 
cp1251_general_ci  
 
西里尔语 (多语言), 不区分大小写  
 
cp1251_general_cs  
 
西里尔语 (多语言), 区分大小写  
 
cp1251_ukrainian_ci  
 
乌克兰语, 不区分大小写  
 
cp1256 (Windows Arabic)  
 
cp1256_bin  
 
阿拉伯语, 二进制  
 
cp1256_general_ci  
 
阿拉伯语, 不区分大小写  
 
cp1257 (Windows Baltic)  
 
cp1257_bin  
 
巴拉克语 (多语言), 二进制  
 
cp1257_general_ci  
 
巴拉克语 (多语言), 不区分大小写  
 
cp1257_lithuanian_ci  
 
立陶宛语, 不区分大小写  
 
cp850 (DOS West European)  
 
cp850_bin  
 
西欧 (多语言), 二进制  
 
cp850_general_ci  
 
西欧 (多语言), 不区分大小写  
 
cp852 (DOS Central European)  
 
cp852_bin  
 
中欧 (多语言), 二进制  
 
cp852_general_ci  
 
中欧 (多语言), 不区分大小写  
 
cp866 (DOS Russian)  
 
cp866_bin  
 
俄语, 二进制  
 
cp866_general_ci  
 
俄语, 不区分大小写  
 
cp932 (SJIS for Windows Japanese)  
 
cp932_bin  
 
日语, 二进制  
 
cp932_japanese_ci  
 
日语, 不区分大小写  
 
dec8 (DEC West European)  
 
dec8_bin  
 
西欧 (多语言), 二进制  
 
dec8_swedish_ci  
 
瑞典语, 不区分大小写  
 
euckr (EUC-KR Korean)  
 
euckr_bin  
 
朝鲜语, 二进制  
 
euckr_korean_ci  
 
朝鲜语, 不区分大小写  
 
gb2312 (GB2312 Simplified Chinese)  
 
gb2312_bin  
 
简体中文, 二进制  
 
gb2312_chinese_ci  
 
简体中文, 不区分大小写  
 
gbk (GBK Simplified Chinese)  
 
gbk_bin  
 
简体中文, 二进制  
 
gbk_chinese_ci  
 
简体中文, 不区分大小写  
 
geostd8 (GEOSTD8 Georgian)  
 
geostd8_bin  
 
乔治亚语, 二进制  
 
geostd8_general_ci  
 
乔治亚语, 不区分大小写  
 
greek (ISO 8859-7 Greek)  
 
greek_bin  
 
希腊语, 二进制  
 
greek_general_ci  
 
希腊语, 不区分大小写  
 
hebrew (ISO 8859-8 Hebrew)  
 
hebrew_bin  
 
希伯来语, 二进制  
 
hebrew_general_ci  
 
希伯来语, 不区分大小写  
 
hp8 (HP West European)  
 
hp8_bin  
 
西欧 (多语言), 二进制  
 
hp8_english_ci  
 
英语, 不区分大小写  
 
keybcs2 (DOS Kamenicky Czech-Slovak)  
 
keybcs2_bin  
 
捷克斯洛伐克语, 二进制  
 
keybcs2_general_ci  
 
捷克斯洛伐克语, 不区分大小写  
 
koi8r (KOI8-R Relcom Russian)  
 
koi8r_bin  
 
俄语, 二进制  
 
koi8r_general_ci  
 
俄语, 不区分大小写  
 
koi8u (KOI8-U Ukrainian)  
 
koi8u_bin  
 
乌克兰语, 二进制  
 
koi8u_general_ci  
 
乌克兰语, 不区分大小写  
 
latin1 (cp1252 West European)  
 
latin1_bin  
 
西欧 (多语言), 二进制  
 
latin1_danish_ci  
 
丹麦语, 不区分大小写  
 
latin1_general_ci  
 
西欧 (多语言), 不区分大小写  
 
latin1_general_cs  
 
西欧 (多语言), 区分大小写  
 
latin1_german1_ci  
 
德语 (字典), 不区分大小写  
 
latin1_german2_ci  
 
德语 (电话本), 不区分大小写  
 
latin1_spanish_ci  
 
西班牙语, 不区分大小写  
 
latin1_swedish_ci  
 
瑞典语, 不区分大小写  
 
 
 
 
 
latin2 (ISO 8859-2 Central European)  
 
latin2_bin  
 
中欧 (多语言), 二进制  
 
latin2_croatian_ci  
 
克罗地亚语, 不区分大小写  
 
latin2_czech_cs  
 
捷克语, 区分大小写  
 
latin2_general_ci  
 
中欧 (多语言), 不区分大小写  
 
latin2_hungarian_ci  
 
匈牙利语, 不区分大小写  
 
latin5 (ISO 8859-9 Turkish)  
 
latin5_bin  
 
土耳其语, 二进制  
 
latin5_turkish_ci  
 
土耳其语, 不区分大小写  
 
latin7 (ISO 8859-13 Baltic)  
 
latin7_bin  
 
巴拉克语 (多语言), 二进制  
 
latin7_estonian_cs  
 
爱沙尼亚语, 区分大小写  
 
latin7_general_ci  
 
巴拉克语 (多语言), 不区分大小写  
 
latin7_general_cs  
 
巴拉克语 (多语言), 区分大小写  
 
macce (Mac Central European)  
 
macce_bin  
 
中欧 (多语言), 二进制  
 
macce_general_ci  
 
中欧 (多语言), 不区分大小写  
 
macroman (Mac West European)  
 
macroman_bin  
 
西欧 (多语言), 二进制  
 
macroman_general_ci  
 
西欧 (多语言), 不区分大小写  
 
sjis (Shift-JIS Japanese)  
 
sjis_bin  
 
日语, 二进制  
 
sjis_japanese_ci  
 
日语, 不区分大小写  
 
swe7 (7bit Swedish)  
 
swe7_bin  
 
瑞典语, 二进制  
 
swe7_swedish_ci  
 
瑞典语, 不区分大小写  
 
tis620 (TIS620 Thai)  
 
tis620_bin  
 
泰语, 二进制  
 
tis620_thai_ci  
 
泰语, 不区分大小写  
 
ucs2 (UCS-2 Unicode)  
 
ucs2_bin  
 
Unicode (多语言), 二进制  
 
ucs2_czech_ci  
 
捷克语, 不区分大小写  
 
ucs2_danish_ci  
 
丹麦语, 不区分大小写  
 
ucs2_estonian_ci  
 
爱沙尼亚语, 不区分大小写  
 
ucs2_general_ci  
 
Unicode (多语言), 不区分大小写  
 
ucs2_icelandic_ci  
 
冰岛语, 不区分大小写  
 
ucs2_latvian_ci  
 
拉脱维亚语, 不区分大小写  
 
ucs2_lithuanian_ci  
 
立陶宛语, 不区分大小写  
 
ucs2_persian_ci  
 
波斯语, 不区分大小写  
 
ucs2_polish_ci  
 
波兰语, 不区分大小写  
 
ucs2_roman_ci  
 
西欧, 不区分大小写  
 
ucs2_romanian_ci  
 
罗马尼亚语, 不区分大小写  
 
ucs2_slovak_ci  
 
斯洛伐克语, 不区分大小写  
 
ucs2_slovenian_ci  
 
斯洛文尼亚语, 不区分大小写  
 
ucs2_spanish2_ci  
 
传统西班牙语, 不区分大小写  
 
ucs2_spanish_ci  
 
西班牙语, 不区分大小写  
 
ucs2_swedish_ci  
 
瑞典语, 不区分大小写  
 
ucs2_turkish_ci  
 
土耳其语, 不区分大小写  
 
ucs2_unicode_ci  
 
Unicode (多语言), 不区分大小写  
 
ujis (EUC-JP Japanese)  
 
ujis_bin  
 
日语, 二进制  
 
ujis_japanese_ci  
 
日语, 不区分大小写  
 
utf8 (UTF-8 Unicode)  
 
utf8_bin  
 
Unicode (多语言), 二进制  
 
utf8_czech_ci  
 
捷克语, 不区分大小写  
 
utf8_danish_ci  
 
丹麦语, 不区分大小写  
 
utf8_estonian_ci  
 
爱沙尼亚语, 不区分大小写  
 
utf8_general_ci  
 
Unicode (多语言), 不区分大小写[查看列编码常看到这样的编码格式的!] 
 
utf8_icelandic_ci  
 
冰岛语, 不区分大小写  
 
utf8_latvian_ci  
 
拉脱维亚语, 不区分大小写  
 
utf8_lithuanian_ci  
 
立陶宛语, 不区分大小写  
 
utf8_persian_ci  
 
波斯语, 不区分大小写  
 
utf8_polish_ci  
 
波兰语, 不区分大小写  
 
utf8_roman_ci  
 
西欧, 不区分大小写  
 
utf8_romanian_ci  
 
罗马尼亚语, 不区分大小写  
 
utf8_slovak_ci  
 
斯洛伐克语, 不区分大小写  
 
utf8_slovenian_ci  
 
斯洛文尼亚语, 不区分大小写  
 
utf8_spanish2_ci  
 
传统西班牙语, 不区分大小写  
 
utf8_spanish_ci  
 
西班牙语, 不区分大小写  
 
utf8_swedish_ci  
 
瑞典语, 不区分大小写  
 
utf8_turkish_ci  
 
土耳其语, 不区分大小写  
 
utf8_unicode_ci  
 
Unicode (多语
 
 
 
新篇:2010-03-09
MySQL中默认字符集的设置有四级:服务器级,数据库级,表级 。最终是字段级 的字符集设置。注意前三种均为默认设置,并不代码你的字段最终会使用这个字符集设置。所以我们建议要用show create table table ; 或show full fields from tableName; 来检查当前表中字段的字符集设置。
MySQL中关于连接环境的字符集设置有  Client端,connection, results 通过这些参数,MySQL就知道你的客户端工具用的是什么字符集,结果集应该是什么字符集。这样MySQL就会做必要的翻译,一旦这些参数有误,自然会导致字符串在转输过程中的转换错误。基本上99%的乱码由些造成。
1. 数据库表中字段的字符集设置 。show create table TableName 或 show full columns from tableName
mysql> show create table t1;
mysql> show full columns from t1; 查看列的编码类型
3. 查看数据库的编码格式
show create database test;
输出:CREATE DATABASE `test` /*!40100 DEFAULT CHARACTER SET utf8 */
2. 当前联接系统参数  show variables like 'char%'
mysql> show variables like 'char%';
1. 中文,请确保 表中该字段的字符集为中文兼容:
 big5     | Big5 Traditional Chinese
 gb2312   | GB2312 Simplified Chinese
 gbk      | GBK Simplified Chinese
 utf8     | UTF-8 Unicode
[其它补充]
修改数据库的字符集
   mysql>use mydb
   mysql>alter database mydb character set utf-8;
创建数据库指定数据库的字符集
   mysql>create database mydb character set utf-8;
页: [1]
查看完整版本: mysql查看数据库字符集