六狼论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博账号登陆

只需一步,快速开始

搜索
查看: 93|回复: 0

db2汉字存储

[复制链接]

升级  17.33%

18

主题

18

主题

18

主题

秀才

Rank: 2

积分
76
 楼主| 发表于 2013-1-25 21:50:25 | 显示全部楼层 |阅读模式
转自:http://topic.csdn.net/u/20090326/09/d8c05960-4c7f-49ef-900d-04a1ef1eb024.html
大家可能都知道,数据库的varchar字段在保存中文时,字段最大长度和可以保存的字符的最大数量可能是不相等的。

在Oracle中,varchar(100)可以保存50个纯汉字或100个纯字母或者数字。如果希望长度100的varchar保存100个汉字,可以将字段类型设置为nvarchar(这个不太确定,但是oracle确实有这个功能。n表示国际化的意思)

而在db2尤其是as400服务器下的db2,是怎么个情况,今天我们进行了一下测试。下面是测试报告:


  数据库VARCHAR字段长度设置测试报告
测试时间:2009-01-16 14:00
测试用例:
  数据库表:UserInfo 字段:password varchar(32)

操作记录:
执行SQL:
insert into usrinfo(id,usr_id,password) values('xxxx','xxxx','我使中国热我使中国热我使中国热我'); --失败 16汉字
insert into usrinfo(id,usr_id,password) values('xxxx','xxxx','我使中国热我使中国热我使中国热'); --成功 15汉字
update usrinfo set password='我使中国热我使中国热我使中国热1' where id='xxxx'; --失败 15汉字1数字
update usrinfo set password='我使中国热我使中国热我使中国热a' where id='xxxx'; --失败 15汉字1字母


update usrinfo set password='012345678901234567890123456789' where id='xxxx'; --成功 30数字
update usrinfo set password='01234567890123456789012345678901' where id='xxxx'; --成功 32数字
update usrinfo set password='012345678901234567890123456789我' where id='xxxx'; --失败 30数字1汉字


update usrinfo set password='0123456789我使中国热0123456789' where id='xxxx'; --成功 20数字5汉字  
select length(password) from usrinfo where usr_id='xxxx' ---32  


update usrinfo set password='0我1使2中3国4热' where id='xxxx'; --成功
select length(password) from usrinfo where usr_id='xxxx' ---25


结论:
  1 每个汉字占用2个字符空间
  2 每段汉字再额外占用2个字符空间(可能是辨别标识?)
  3 每个字母或数字占用1个字符空间

----->假设需要保存1000个字(汉字、字母、数字都允许),那么数据库字段最少的长度应该是:
  最极限的情况是:单个汉字和字母(数字)连续间隔出现,即形式如下:
  汉1字2是3好a.......(假设总字符数是x,x是偶数)
  那么汉字个数是x/2,字母数字个数是x/2,为保证该字段的insert和update不报错,字段最少的长度是===>
  x/2*2 汉字占用字符数
  +  
  x/2*1 字母数字占用字符数
  +
  x/2*2 每段汉字占用的标识位数
  =2.5x

  ===================>>>所以,如果需求要求可输入1000个字符,那么数据库保证不出错误的长度应该是2500,而不是我们通常认为的2000!!
您需要登录后才可以回帖 登录 | 立即注册 新浪微博账号登陆

本版积分规则

快速回复 返回顶部 返回列表