字符集
字符集,或称字集,是指文字的集合;将固定数目的文字编序,以方便作通讯、教育、资讯处理等用途。
字符集通常有两种,一是专为电脑资讯处理而设,如:ASCII、Unicode、GB 2312、大五码(Big5)、CNS 11643等。一是作其他用途的,如教育用的生字表、通讯用的电报码等。
字符集和编码(Encoding)不同。字符集只是文字的集合,不一定适合作网络传送、处理,有时须经编码(Encode)後才能应用。如CNS 11643和GB 2312可以使用ISO 2022、EUC等标准编码。Unicode可依不同需要以UTF-8、UTF-16、UTF-32等方法编码。有些字符集如Big5通常不须额外编码即可使用,故Big5既是字符集又是编码。
常用电脑字符集
ASCII
ISO 10646/Unicode
GB 2312
GBK
GB 18030
Big5
香港增补字符集(HKSCS,是Big5的扩充版本)
国家标准中文交换码 (CNS 11643)
CCCII
JIS X 0201(半角日语假名)
JIS X 0208(日语汉字字集,可以使用ISO 2022、Shift JIS或EUC编码)
ISO 8859
常用教育、出版、特殊用途字符集
中国大陆
现代汉语常用字表
现代汉语通用字表
台湾
常用国字标准字体表
次常用国字标准字体表
香港
常用字字形表
日本
常用汉字
当用汉字
教育汉字
人名用汉字
常用通讯用字符集
中文电码
)

