您当前的位置:首页 > 淘宝百科

gbk编码查询(GBK代码怎么查)

时间:2023-01-31 00:01:40

本文目录

  • GBK代码怎么查
  • 计算机GBK汉字输入法速查字典的内容简介
  • 什么是GBK编码它的作用是什么
  • 怎样知道汉字的GBK码(在不用任何软件的情况下)

GBK代码怎么查

char gbk= “任意汉字“; 任 BYTE(gbk)*256+gbk意 BYTE(gbk)*256+gbk

计算机GBK汉字输入法速查字典的内容简介

计算机GBK汉字输入法速查字典由科学出版社出版,共212.2万字,收录了国家标准GB18030-2000中的基本GBK集的全部中、日、韩汉字21003个汉字,包括汉字部首、笔顺、笔画数与四角号码,Unicode与GBK内码,拼音、五笔字型86版、五笔字型98版、五笔画、郑码与双拼。另外,还包括四角笔划汉字输入码。读者可以选用拼音、部首或四角号码多种方式快速检索或查阅汉字编码,还可以通过附录中的“GBK内码索引”直接用GBK内码来查找汉字,适合查阅汉字的部首、笔顺、笔画数与四角号码等属性,还可以随时查阅五笔、郑码等输入码,方便输入汉字。全拼输入法适合听打,因学习门槛低适合大多数用户学习,但因为速度慢,一些用户选用双拼提高速度,为方便用户学习,字典中全拼、双拼选自Windows 95/98/XP系统自带输入法。但因为拼音重码多,要提高速度,五笔86版输入法一直是广大形码用户与打字员的首选,但也有不少用户选择更加规范的五笔98版。郑码编码选自Windows 95/98/XP系统挂接的输入法,该版本也一直没有升级。为方便手机用户使用,该字典还提供了五笔画、笔顺等。排版方法计算机GBK汉字输入法速查字典每汉字单独成条。字条汉字用大字排印,第1行接着是拼音、四角号码、部首与笔画数。例如:“瓄du 14186 王部 19画”,在部首后注有“部”字,在笔画数后注有“画”字。字条第2行开始列出“五86”、“五98”、“五笔画”、“郑码”、“双拼”、“笔顺”、“角笔”、“U”、“GBK”共9种编码。其中:“五86”表示五笔字型86版编码,“五98”表示五笔字型98版编码,“五笔画”表示五笔画编码,“双拼”表示微软双拼编码,“角笔”表示四角笔划汉字输入码,“U”表示Unicode内码,“GBK”表示GBK内码。例如:“五86:gflm 五98:gflm 五笔画:11214 郑码:cbll 双拼:du 笔顺:1121121252212511134 角笔: U:74C4 GBK:AD7B”。检索方法本字典提供了汉语拼音编码索引、部首索引和四角号码索引,并在最后提供了GBK内码索引。部首查字法采用的部首依据《汉字统一部首表(草案)》,共201部。使用部首查字时,先在“部首目录”中查找该字所属部首、再按部首笔画数查到部首索引表中的页码,然后在索引表中按该字的“余部”(除部首外的剩余部分)的笔画数,查到该字在字典正文中的页码。部首索引表后备有“难检字笔画索引”,可查部首检索中难检的字。

什么是GBK编码它的作用是什么

GBK 是又一个汉字编码标准,全称《汉字内码扩展规范》(GBK),英文名称 Chinese Internal Code Specification ,中华人民共和国全国信息技术标准化技术委员会 1995 年 12 月 1 日制订,国家技术监督局标准化司、电子工业部科技与质量监督司 1995 年 12 月 15 日联合以技监标函 229 号文件的形式,将它确定为技术规范指导性文件,发布和实施。这一版的 GBK 规范为 1.0 版。GB 即“国标”,K 是“扩展”的汉语拼音第一个字母。 GBK 向下与 GB 2312 编码兼容,向上支持 ISO 10646.1 国际标准,是前者向后者过渡过程中的一个承上启下的标准。 ISO 10646 是国际标准化组织 ISO 公布的一个编码标准,即 Universal Multilpe-Octet Coded Character Set(简称 UCS),大陆译为《通用多八位编码字符集》,台湾译为《广用多八位元编码字元集》,它与 Unicode 组织的 Unicode 编码完全兼容。ISO 10646.1 是该标准的第一部分《体系结构与基本多文种平面》。我国 1993 年以 GB 13000.1 国家标准的形式予以认可(即 GB 13000.1 等同于 ISO 10646.1)。 ISO 10646 是一个包括世界上各种语言的书面形式以及附加符号的编码体系。其中的汉字部分称为“CJK 统一汉字”(C 指中国,J 指日本,K 指朝鲜)。而其中的中国部分,包括了源自中国大陆的 GB 2312、GB 12345、《现代汉语通用字表》等法定标准的汉字和符号,以及源自台湾的 CNS 11643 标准中第 1、2 字面(基本等同于 BIG-5 编码)、第 14 字面的汉字和符号。 一、字汇 GBK 规范收录了 ISO 10646.1 中的全部 CJK 汉字和符号,并有所补充。具体包括: 1. GB 2312 中的全部汉字、非汉字符号。 2. GB 13000.1 中的其他 CJK 汉字。以上合计 20902 个 GB 化汉字。 3. 《简化字总表》中未收入 GB 13000.1 的 52 个汉字。 4. 《康熙字典》及《辞海》中未收入 GB 13000.1 的 28 个部首及重要构件。 5. 13 个汉字结构符。 6. BIG-5 中未被 GB 2312 收入、但存在于 GB 13000.1 中的 139 个图形符号。 7. GB 12345 增补的 6 个拼音符号。 8. 汉字“○”。 9. GB 12345 增补的 19 个竖排标点符号(GB 12345 较 GB 2312 增补竖排标点符号 29 个,其中 10 个未被 GB 13000.1 收入,故 GBK 亦不收)。 10. 从 GB 13000.1 的 CJK 兼容区挑选出的 21 个汉字。 11. GB 13000.1 收入的 31 个 IBM OS/2 专用符号。 二、码位分配及顺序 GBK 亦采用双字节表示,总体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个。 全部编码分为三大部分: 1. 汉字区。包括: a. GB 2312 汉字区。即 GBK/2: B0A1-F7FE。收录 GB 2312 汉字 6763 个,按原顺序排列。 b. GB 13000.1 扩充汉字区。包括: (1) GBK/3: 8140-A0FE。收录 GB 13000.1 中的 CJK 汉字 6080 个。 (2) GBK/4: AA40-FEA0。收录 CJK 汉字和增补的汉字 8160 个。CJK 汉字在前,按 UCS 代码大小排列;增补的汉字(包括部首和构件)在后,按《康熙字典》的页码/字位排列。 2. 图形符号区。包括: a. GB 2312 非汉字符号区。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符号外,还有 10 个小写罗马数字和 GB 12345 增补的符号。计符号 717 个。 b. GB 13000.1 扩充非汉字区。即 GBK/5: A840-A9A0。BIG-5 非汉字符号、结构符和“○”排列在此区。计符号 166 个。 3. 用户自定义区:分为(1)(2)(3)三个小区。 (1) AAA1-AFFE,码位 564 个。 (2) F8A1-FEFE,码位 658 个。 (3) A140-A7A0,码位 672 个。 第(3)区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性。 三、字形 GBK 对字形作了如下的规定: 1. 原则上与 GB 13000.1 G列(即源自中国大陆法定标准的汉字)下的字形/笔形保持一致。 2. 在 CJK 汉字认同规则的总框架内,对所有的 GBK 编码汉字实施“无重码正形”(“GB 化”);即在不造成重码的前提下,尽量采用中国新字形。 3. 对于超出 CJK 汉字认同规则的、或认同规则尚未明确规定的汉字,在 GBK 码位上暂安放旧字形。这样,在许多情况下 GBK 收入了同一汉字的新旧两种字形。 4. 非汉字符号的字形,凡 GB 2312 已经包括的,与 GB 2312 保持一致;超出 GB 2312 的部分,与 GB 13000.1 保持一致。 5. 带声调的拼音字母取半角形式。

怎样知道汉字的GBK码(在不用任何软件的情况下)

在不用任何软件的情况下算出汉字的GBK码那你可以申请吉尼斯世界记录了。了解下: GBK 是又一个汉字编码标准,全称《汉字内码扩展规范》(GBK),英文名称 Chinese Internal Code Specification ,中华人民共和国全国信息技术标准化技术委员会 1995 年 12 月 1 日制订,国家技术监督局标准化司、电子工业部科技与质量监督司 1995 年 12 月 15 日联合以技监标函 229 号文件的形式,将它确定为技术规范指导性文件,发布和实施。这一版的 GBK 规范为 1.0 版。GB 即“国标”,K 是“扩展”的汉语拼音第一个字母。 GBK 向下与 GB 2312 编码兼容,向上支持 ISO 10646.1 国际标准,是前者向后者过渡过程中的一个承上启下的标准。 ISO 10646 是国际标准化组织 ISO 公布的一个编码标准,即 Universal Multilpe-Octet Coded Character Set(简称 UCS),大陆译为《通用多八位编码字符集》,台湾译为《广用多八位元编码字元集》,它与 Unicode 组织的 Unicode 编码完全兼容。ISO 10646.1 是该标准的第一部分《体系结构与基本多文种平面》。我国 1993 年以 GB 13000.1 国家标准的形式予以认可(即 GB 13000.1 等同于 ISO 10646.1)。 ISO 10646 是一个包括世界上各种语言的书面形式以及附加符号的编码体系。其中的汉字部分称为“CJK 统一汉字”(C 指中国,J 指日本,K 指朝鲜)。而其中的中国部分,包括了源自中国大陆的 GB 2312、GB 12345、《现代汉语通用字表》等法定标准的汉字和符号,以及源自台湾的 CNS 11643 标准中第 1、2 字面(基本等同于 BIG-5 编码)、第 14 字面的汉字和符号。 一、字汇 GBK 规范收录了 ISO 10646.1 中的全部 CJK 汉字和符号,并有所补充。具体包括: 1. GB 2312 中的全部汉字、非汉字符号。 2. GB 13000.1 中的其他 CJK 汉字。以上合计 20902 个 GB 化汉字。 3. 《简化字总表》中未收入 GB 13000.1 的 52 个汉字。 4. 《康熙字典》及《辞海》中未收入 GB 13000.1 的 28 个部首及重要构件。 5. 13 个汉字结构符。 6. BIG-5 中未被 GB 2312 收入、但存在于 GB 13000.1 中的 139 个图形符号。 7. GB 12345 增补的 6 个拼音符号。 8. 汉字“○”。 9. GB 12345 增补的 19 个竖排标点符号(GB 12345 较 GB 2312 增补竖排标点符号 29 个,其中 10 个未被 GB 13000.1 收入,故 GBK 亦不收)。 10. 从 GB 13000.1 的 CJK 兼容区挑选出的 21 个汉字。 11. GB 13000.1 收入的 31 个 IBM OS/2 专用符号。 二、码位分配及顺序 GBK 亦采用双字节表示,总体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个。 全部编码分为三大部分: 1. 汉字区。包括: a. GB 2312 汉字区。即 GBK/2: B0A1-F7FE。收录 GB 2312 汉字 6763 个,按原顺序排列。 b. GB 13000.1 扩充汉字区。包括: (1) GBK/3: 8140-A0FE。收录 GB 13000.1 中的 CJK 汉字 6080 个。 (2) GBK/4: AA40-FEA0。收录 CJK 汉字和增补的汉字 8160 个。CJK 汉字在前,按 UCS 代码大小排列;增补的汉字(包括部首和构件)在后,按《康熙字典》的页码/字位排列。 2. 图形符号区。包括: a. GB 2312 非汉字符号区。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符号外,还有 10 个小写罗马数字和 GB 12345 增补的符号。计符号 717 个。 b. GB 13000.1 扩充非汉字区。即 GBK/5: A840-A9A0。BIG-5 非汉字符号、结构符和“○”排列在此区。计符号 166 个。 3. 用户自定义区:分为(1)(2)(3)三个小区。 (1) AAA1-AFFE,码位 564 个。 (2) F8A1-FEFE,码位 658 个。 (3) A140-A7A0,码位 672 个。 第(3)区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性。 三、字形 GBK 对字形作了如下的规定: 1. 原则上与 GB 13000.1 G列(即源自中国大陆法定标准的汉字)下的字形/笔形保持一致。 2. 在 CJK 汉字认同规则的总框架内,对所有的 GBK 编码汉字实施“无重码正形”(“GB 化”);即在不造成重码的前提下,尽量采用中国新字形。 3. 对于超出 CJK 汉字认同规则的、或认同规则尚未明确规定的汉字,在 GBK 码位上暂安放旧字形。这样,在许多情况下 GBK 收入了同一汉字的新旧两种字形。 4. 非汉字符号的字形,凡 GB 2312 已经包括的,与 GB 2312 保持一致;超出 GB 2312 的部分,与 GB 13000.1 保持一致。 5. 带声调的拼音字母取半角形式。

汉字

最新文章