GBK

GBK_6分词条

GBKGBK
GBK全名为汉字内码扩展规范,英文名Chinese Internal Code Specification。K 即是“扩展”所对应的汉语拼音(KuoZhan)中“扩”字的声母。

GBK 亦采用双字节表示,总体编码范围为8140-FEFE,首字节在81-FE 之间,尾字节在40-FE 之间,剔除 xx7F一条线。总计23940 个码位,共收入21886个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号883 个。

目录 [隐藏]

GBK 概述

       

GBKGBK
1993年Unicode 1.1版本推出,收录了中国大陆台湾日本韩国通用字符集汉字,总共有20,902个。

中国大陆订定了等同于Unicode 1.1版本的“GB 13000.1-93”“信息技术 通用多八位编码字符集(UCS) 第一部分:体系-{}-结构与基本多文种平面”。

由于GB 2312-80只收录了6763个汉字,有不少汉字,如部分在GB 2312-80推出以后才简化的汉字(如“-{啰}-”),部分人名用字(如中国前总理朱镕基的“-{镕}-”字),台湾及香港使用的繁体字日语朝鲜语汉字等,并未有收录在内。中文电脑开发商,于是利用了GB 2312-80未有使用的编码空间,收录了所有出现在Unicode 1.1及GB 13000.1-93之中的汉字,制定了GBK编码。

根据西方资料,GBK最初是由微软对GB2312的扩展,也就是CP936字码表 (Code Page 936)的擴展(原來的CP936和GB 2312-80一模一樣),最初出现于Windows 95简体中文版中,由于Windows产品的流行和在大陆广泛被使用,中华人民共和国国家有关部门将其作为技术规范。注意GBK并非国家正式标准,只是国家技术监督局标准化司、电子工业部科技与质量监督司发布的“技术规范指导性文件”。虽然GBK收录了所有Unicode 1.1及GB 13000.1-93之中的汉字,但是编码方式与Unicode 1.1及GB 13000.1-93不同。仅仅是GB 2312到GB 13000.1-93之间的过渡方案。

GBK 后续

       

中华人民共和国国家标准总局2000年推出了GB 18030-2000标准,以取代GBK。GB 18030-2000除了保留了全部GBK编码的汉字外,还增加了大约一百个汉字及四位元组编码空间。请参看GB 18030-2000

GBK 引入标准

       

GBKGBK的编码图
随着信息技术在各行业应用的深入,GB 2312收录汉字数量不足的缺点已经初步显露出来。例如:"镕"字现在是高频率使用字,而GB 2312却没有为它编码,因而,政府、新闻、出版、印刷等行业和部门在使用中感到十分不便。1995年,全世界大多数的PC操作系统都实现了16/32位。GB 13000.1的实现出现了一线曙光。一方面为了对GB 2312进行扩充,一方面顺应当时技术的发展向GB 13000.1推进,同时兼顾当时最广泛采用GB2312内码系统。原电子部和原国家技术监督局联合颁布了指导性技术文件《汉字内码扩展规范》1.0版,即GBK。

在汉字处理系统中,由于GB 2312需要经常性的使用转移序列规则,最广泛使用的实际是经过GB 2312+8080H移位后的内码模式。因为如不使用转义序列规则,GB2312规定的一个汉字字符的交换码用两个ASCII图形字符编码的表示方法,在中国最初的计算机上实现中西文信息兼容时会造成汉字内码与汉字交换码的不一致性。为解决这一问题,国内外推出了十多种计算机汉字内码制式,最常用的就是两字节内码制式,而在其中以高位为“1”的两字节内码应用最广(所以要移位8080H),它是把汉字交换码两字节高位置“1”而成,例如在CC-DOS系统中。台湾的CNS 11643、日本的JIS 0203等标准也是采用同样方式来实现。

GBK 编码原理

       
GBK在GB 2312内码系统的基础上进行了扩充,其内码空间为0x8140 ~ 0xFEFE,去除第二字节的0x7F(192个码位),总共23940个码位。它收录了GB 13000.1-1993的全部20902个CJK统一汉字,包括GB 2312的全部6763个汉字。此外,它增补编码了52个汉字,13个汉字结构符(在ISO/IEC 10646.1: 2000中称为表意文字描述符)和一些常用部首与汉字部件。在GBK的内码系统中,GB 2312汉字所在码位保持不便,这样,保证了GBK对GB 2312的完全兼容。同时,GBK内码与GB 13000.1代码一一对应,为GBK向GB 13000.1的转换提供了解决办法。

GBKGBK

GBK码位空间示意图

GBK 补充举例

       

理想语认定国际通用标准的键盘符号是GBK图符,各自都有基本读音,参见如下表格:
(常用的如国际专利IPO数字代码,包括 短信爱情数字密码字母符号,也都是 可以 转化 念读的, 理想语'意筋表述只是 只需在前面 加上 双合键符缀WS, 例如WS520 我爱你 :)
英理 Bi Pi EyM EyF Di Ti EyN EyL Ji Ky EyQu Yi Jy Kj EyKeSi Wh Eh Yk Ey Ea Zy Xi EySi Vi Eo
键符 B P M F D T N L G K H E J Q X Y I U A R Z C S V O
汉音 Bo Po Mo Fo De Te Ne Le Ge Ke He Ee Ji Qi Xi Yi Ii Ui Ai Ri Za Ca Sa Va O~) 波 泼 摸 佛 的 特 呢 勒 戈 科 喝 鹅 鸡 器 西 衣 支 吃 石 日 杂 擦 洒 Va 喔)
汉理 Do Te Nf Lm Gg Kk Hh Zz Uu Aa
数串 11 22 33 44 55 66 77 88 99 00
汉音 垛 特 能 拦 供 口 海 长 出 沙
数符 1    2   3   4    5   6   7   8    9   0 
汉音 Yi Er Sm Si Wu Lj Qi Ba Jj Ai
变音 Yp Eh S~ S~ W~ L~ Q~ B~ J~ A~
英音 Wc Tu TuLi Fo FhWu XiKeSi SyVc EyTe Nh TyN
上述是短信的 爱情数字密码 经常使用的 :)

GBK 相关链街

       

微软CP936编码表
方正GBK字库内码表

GBK 相关词条

       

国家标准代码
GB 2312-80
GB 13000.1-93
GB 18030-2000

GBK 参考资料

       

[1] http://cn.netor.com/m/box200408/m40440.asp?BoardID=40440
[2] http://www.qihoo.com/wenda.php?kw=GBK&do=search&noq=q
[3] http://www.wiki.cn/wiki/GBK

附图

上传图片 

互动百科的词条(含所附图片)系由网友上传,如果涉嫌侵权,请与客服联系,我们将按照法律之相关规定及时进行处理。如需转载,请注明来源于www.hudong.com

其他内容来源:
http://www.wiki.cn/wiki/GBK
被引用: GBK已被如下媒体引用 我来补充
开放分类: 我来补充

讨论区

更多>>

编辑者

共2人协作

相关词条

汉字编码国家标准
大五码
朝语
字库
朝鲜语
部首输入法
汉语
UNICODE
极点五笔输入法
IPTV
更多

Copyright © 2005-2009 hudong.com Ltd. All Rights Reserved. 互动在线 版权所有