Unicode®Standard 10.0版发布!

Unicode®Standard 10.0版发布!

2017年6月20日,Unicode标准10.0版现正式发布。这是第一次在同一天发布核心规范和数据文件。10.0版添加了8518个字符,共计136690个字符,包括4种新的文字,总共139种文字,以及56个新的表情符号。

新增文字

10.0版中新增的文字1和字符增强了对于较少使用的语言和世界范围内独特书写需求的支持,包括:

  • Masaram Gondi——印度中部及东南部书写Gondi语的文字
image.png
  • 女书——20世纪下叶前中国妇女用来书写诗歌等的文字
  • 索永布文字和Zanabazar Square——历史悠久的佛教文字,用于书写梵文,藏文,蒙古文
  • 用于写叙利亚马拉雅拉姆语2的叙利亚字母
image.png
  • 伊斯玛仪派3Khoja社群4用于将阿拉伯文字译成古吉拉特文的古吉拉特语5符号
image.png
  • 日本使用的一套285个变体假名字符(平假名字符在历史上的变体)
image.png
变体假名与父表意文字对比
image.png
其他变体假名示例
  • 中日韩统一表意文字扩展区F(7473个汉字)
image.png
中日韩统一表意文字扩展区F范围为 U+2CEB0–U+2EBE0,本张示例为U+2CEB0-U+2CEFF

新增符号(重要)

  • 比特币符号
image.png
比特币符号,U+20BF
  • 一组Typicon6标记和符号
image.png
Typicon Kavyka 符号
  • 56个表情符号

包括法师、椰子、西兰、花仙子、吸血鬼、三明治、饺子、筷子等等

image.png
新增的56个Emoji
image.png
饺子,U+1F95F
image.png
筷子,U+1F962

新增Unicode规范(重要)

  • UTS#10,Unicode排序算法 - 排序Unicode文本
  • UTS#39,Unicode安全机制 - 减少Unicode欺骗
  • UTS#46,Unicode IDNA兼容性处理 -对非ASCII URL的 兼容性处理

Unicode 10.0包含许多更改,一些Unicode标准的附件对Unicode 10.0进行了修改,通常是与字符属性的更改一致,特别是UAX#14UAX#29UAX#31的变化。 此外,UAX#50 - 竖排文本布局,已被引入并作为标准的一部分。


Unicode标准是世界各地所有现代软件和通信的基础,包括所有现代操作系统,浏览器,笔记本电脑和智能手机以及互联网和Web(URL,HTML,XML,CSS,JSON等),其相关标准和数据亦构成了通用区域数据存储库(Common Locale Data Repository, CLDR)和Unicode国际组件(International Components for Unicode, ICU)的基础。

包括239个新的表情符号在内的所有额外的8518个字符,现在可供采用,以帮助Unicode学术学会在弱势语言数字化方面的工作。

Unicode学术学会是一个非盈利的慈善组织,是为发展、扩展和推广使用Unicode标准而建立的,Unicode学术学会设立了现代软件产品和标准文本的表示法。学术学会的会员代表了广泛领域的计算机和资讯工业的公司和组织,包括Adobe、Apple、EmojiXpress、Facebook、Google、孟加拉国政府、印度政府、华为、IBM、微软、Monotype Imaging、Netflix、阿曼苏丹国宗教事务部、Oracle、马拉国家发展研究所、SAP,赛门铁克、Tamil Virtual University、加利福尼亚大学(伯克利分校),以及超过一百名助理、联络人员和个人会员。学术学会只由会员提供资金。Unicode学 术学会的会员资格开放给世界上 任何支持Unicode标准和希望协助其扩展和执行的组织及个人。大家都可通过捐赠来支持学术学会的重要工作。


  1. 文字,Script,在Unicode中指用于在一个或多个书写系统中表示文本信息的字母和其他书写符号的集合。

  2. 叙利亚马拉雅拉姆语,Suriyani Malayalam,也被称作Karshoni或Syriac Malayalam,是一种以叙利亚文字的变体形式书写的马拉雅拉姆方言,在印度的喀拉拉邦的圣托马斯基督教徒中受到欢迎。

  3. 伊斯玛仪派,Ismaili,伊斯兰教什叶派的支派之一。

  4. Khoja社群,居住于在印度古吉拉特邦、马哈拉施特拉邦、拉贾斯坦邦等地,亦有迁徙定居东非、欧洲和北美。

  5. 古吉拉特语,是印欧语系印度-伊朗语族的印度-雅利安语支,为印度22种官方语言与14种地区性语言之一,同时也是巴基斯坦少数民族语言。

  6. Typicon,来自俄罗斯东正教和其他东正教以及希腊拜占庭礼天主教会使用的礼拜书。

Some rights reserved
Except where otherwise noted, content on this page is licensed under a Creative Commons Attribution 4.0 International license