• 正在加载中...
  • ISO 10646

    ISO/IEC 10646 是一个字符集的国际标准编号,全称 Information technology -- Universal Coded Character Set (UCS) ,缩写为UCS。中文常翻译作通用多八位编码字符集。这个标准用于世界上各种语言文字的书面形式的表示、传送、交换、处理、储存、输入和展示,也包含了附加符号 。

    编辑摘要

    目录

    标准 /ISO 10646 编辑

    ISO/IEC 10646标准由国际标准化组织(ISO)和国际电工委员会(IEC)旗下的 编码字符集委员会(ISO/IECJTC 1/SC 2-Coded Character Sets)发布,用来实现全球所有文种的统一编码   。该标准被广泛应用于电子化地表示、传输、交换、处理、储存、输入及显现世界上各种语言的书面形式以及附加符号。

    国际标准化组织于1993年发表 ISO/IEC 10646 国际编码标准的首个版本,第一部分名叫ISO/IEC 10646-1:1993 - Information technology -- Universal Multiple-Octet Coded Character Set (UCS) -- Part 1: Architecture and Basic Multilingual Plane   。它收录了 20902 个汉字表意字符。2000年10月发表了第一部分的新版,名叫ISO/IEC 10646-1:2000 - Information technology -- Universal Multiple-Octet Coded Character Set (UCS) -- Part 1: Architecture and Basic Multilingual Plane   ,新增收了6,582个汉字表意字符于扩展A区里。ISO/IEC 10646 的第二部分在 2001 年发表,名叫ISO/IEC 10646-2:2001 - Information technology -- Universal Multiple-Octet Coded Character Set (UCS) -- Part 2: Supplementary Planes   ,增收了 42711个汉字表意字符于扩展区B里。

    重要性 /ISO 10646 编辑

    为了在电脑及电子装置内处理各地区本身的字符,世界各地采用了不同的编码标准。例如香港及台湾使用繁体字,通常采用大五码。中国内地使用简体字,通常采用国标码。可惜,各种不同的编码标准互不兼容,一个编码在不同的编码标准内可能代表不同的字符。

    当某台电脑上发出的电子资讯传到另一电脑上时,假若两台电脑采用了不同的编码标准,即使通过转码,也可能会出现乱码或某些字符不能正确地显示等问题   。而制订 ISO/IEC 10646 国际编码标准的目的,便是为了提供一套统一的字符编码标准,包含世界上所有文字,使电子通讯及资料交换不需转码,并且可以在一个电脑平台上处理多种语言文本。

    采用该标准后,世界各地不同的电脑系统之间便能更准确地储存、处理、传递及显示各种语文的电子资讯,从而加强各地间电子资讯的流通及推动 电子交易的进行。

    背景及现状 /ISO 10646 编辑

    ISO 10646由ISO/IEC JTC1/SC2/WG2制定   。ISO/IEC JTC1是一个信息技术(IT) 方面的联合委员会,由国际电工委员会(IEC)与国际标准化组织(ISO)协作而构成的。目的是协调IEC和ISO在IT行业中的相关标准。 ISO/IEC JTC1/SC2 是负责编码字符集的国际标准化组织分支机构,由ISO/IEC JTC1建立。 其下有一个称为ISO/IEC JTC1/SC2/WG2的工作组。WG2国际标准化组织工作组 的任务就是为了制定编码字符集UCS - 通用多八位编码字符集 - 亦即是ISO/IEC 10646标准。ISO/IEC JTC1/SC2/WG2/IRG,简称IRG,是表意字符工作小组, 负责与ISO/IEC 10646中表意文字有关的工作。

    ISO 10646国际编码标准的2000年版本,ISO/IEC 10646-1:2000,已于2000年10月发表   。当中包括ISO/IEC 10646-1:1993内的20,902个汉字字符之外,又增补了 6,582个汉字字符(在扩展区A)。所有在香港增补字符集(HKSCS)中包含,但仍未在现有ISO 10646标准中收纳的字符,已被提交到表意字符工作小组 (IRG)以加入未来的ISO/IEC 10646版本中。

    扩充ISO/IEC 10646-1:1993的表意字符集工作是分阶段进行的,依次为扩展区A、 扩展区B及扩展区C等阶段。扩展区A收纳了6,582个汉字字符,已于2000年10月发表   。扩展区B亦已随ISO/IEC 10646-1:2001发表   ,其字符主要来源于《康熙字典》、《汉语大字典》内的汉字。表意文字工作小组正致力于扩展区C的工作,发表日期待定。

    与Unicode /ISO 10646 编辑

    Unicode是统一码的意思,由一个名为 Unicode联盟的学术学会的机构制订的字符编码系统。Unicode为世界上的每个字符提供了平台无关、程序无关、语言无关的唯一编码   。

    Unicode与ISO/IEC 10646国际编码标准从内容上来说是同步一致的。在1991年,Unicode学术学会与ISO国际标准化组织决定共同制订一套适用于多种语言文本的通用编码标准。Unicode与ISO/IEC 10646国际编码标准于1992年1月正式合作发展一套通用编码标准。自此以后,两个组织便一直紧密合作,同步发展Unicode及ISO/IEC 10646 国际编码标准   。

    Unicode3.0版本与ISO/IEC 10646 国际编码标准所包含的字符及使用的编码是相同的,包括东亚的汉字字符。统一码3.0版本已于2000年2月由Unicode联盟正式推出,当中收纳了49,194个来自世界各地不同语言的字符,其中包含27,484个汉字字符。此外,国际标准化组织提供 ISO 10646 国际编码标准内的字符及编码资料,Unicode 学术学会则对这些字符及编码资料提出应用的方法以及语义资料作补充。

    在Unicode3.1版已于2001年发表,除了Unicode 3.0 版中的49194个字符,又增加了44,946个新字符,其中42,711个为汉字字符。

    Unicode 7.0已于2014年6月16日发布,与ISO/IEC 10646:2012标准加上修订版1和修订版2同步,新增2,834个字符   ,总计112,956个字符,其中汉字字符74,616个   。

    附图

     

    添加视频 | 添加图册相关影像

    互动百科的词条(含所附图片)系由网友上传,如果涉嫌侵权,请与客服联系,我们将按照法律之相关规定及时进行处理。未经许可,禁止商业网站等复制、抓取本站内容;合理使用者,请注明来源于www.baike.com。

    登录后使用互动百科的服务,将会得到个性化的提示和帮助,还有机会和专业认证智愿者沟通。

    互动百科用户登录 注册
    此词条还可添加  信息模块

    WIKI热度

    1. 编辑次数: 8次 历史版本
    2. 参与编辑人数: 8
    3. 最近更新时间:2019-04-10 22:59:17

    贡献光荣榜

    更多

    相关词条

    互动百科

    扫码下载APP