关于《香港电脑汉字参考字形》

关于《香港电脑汉字参考字形》

香港特别行政区政府在今年5月发布了《香港增补字符集—2016》,新增了24个字符,并配合ISO/IEC 10646:2014 第二修订版,进一步解决了编码标准不统一和字数不足的问题。前几天,作为特区政府“数码21”策略的一部分,《香港电脑汉字参考字形》发布了,这是继2002年发布《香港电脑汉字楷体字形参考指引》和《香港电脑汉字宋体 (印刷体)字形参考指引》之后,特区政府对字形指引的最新文件。

image.png
以前香港的小学教科书上使用字体和电脑显示字体不同,前者符合香港教育学院的《常用字字形表》,后者符合台湾字形规范的字形。

什么是《香港电脑汉字参考字形》?

《香港电脑汉字参考字形》是从字符层面着眼,以一致规律为基本原则,制定的一套适用于香港的电脑汉字字形1,力求更清晰显示ISO/ IEC 10646国际编码标准中H-列2的字形,供业界参考的文件。该文件收录的香港电脑汉字,涵盖《香港增补字符集—2016》和大五码字符集所有汉字。需要注意的是,出于美学考虑,不同字体在设计上或有差异,故此文件并非为香港社会的日常用字订立规范,也不限制字体软件开发商所采用的风格,只是详细比较了香港字形3与大五码4字形5、台湾教育部公布的国字标准字体宋体的字形(台宋字形)6的差异,并列举有别于大五码字形、台宋字形的香港部件及有关字符,以便对照参考。另外这一文件也仅涵盖汉字部分,不涉及汉字字形问题的非汉字符号并不包含其中。

《香港电脑汉字参考字形》的发展历程

汉字发展历史悠久,应用地域广泛,是一套复杂多元的书写符号。这套书写符号的特色之一,是有些字一字多形,即使用同一字体,一个字也可有不同的写法。电脑软件开发商开发汉字字型产品时,选用的字形也互有区别。

上世纪九十年代,中文电脑开始普及,香港因汉字书写系统与台湾大致相同,普遍采用台湾的中文电脑平台,并沿用台湾电脑业界订立的大五码编码标准。以大五码字形为依据而开发的产品,成为香港的主导字型产品。不过,就书写规律而言,香港惯用的字形与台湾大五码字形不尽相同。

2002年,特区政府与中文界面咨询委员会合作,编订一套以部件为基础的《香港电脑汉字楷体字形参考指引》和《香港电脑汉字宋体(印刷体)字形参考指引》,供业界参考,以推动业界开发符合香港惯常书写方式的汉字字型产品。

2016年7,香港特区政府与中文界面咨询委员会再度合作,出版《香港电脑汉字参考字形》。 该文件从字符层面着眼,提供一套涵盖《香港增补字符集—2016》和大五码字符集所有汉字的电脑汉字参考字形,,以补充之前两份基于部件的字形参考指引的不足之处。

如何对比字形差别?

原则

比较香港字形与台湾字形的差异,依照ISO/IEC 10646中的等同规则8,即:

细微风格差异

基于美学考虑,不同字体在设计上或有细微风格差异,这些差异不视作字形区别,不被列入《香港电脑汉字参考字形》指引之中。

image.png
左为文鼎香港细明体,右为思源宋体繁体中文。可见针对香港地区开发的字体在“不必遵守”之处支持有限。截至本文发布之时,思源宋体的繁体中文尚未发布支持香港字符及字形的版本。

字形差异

笔形不同9起笔或收笔位置不同(穿出与不穿出)、笔画转折处不同(突出与不突出)、笔画相对位置不同笔画相对长度不同笔数不同、部件或字义不同(部件形似,容易混淆)、结构不同,一律视作字形区别。

image.png
笔形不同之竖与撇之差异

这里与香港字形对比的是台湾工业标准《电脑用中文字型与字码对照表》中的大五码字形和台湾“教育部”《国字标准字体宋体母稿—教育部字序》收录的台宋字形。

之所以与台湾的标准比较有几个原因:

  1. 《香港电脑汉字参考字形》的参考文献包含“台湾教育部”《国字标准字体宋体母稿—教育部字序》。
  2. 如上文所述,上世纪九十年代电脑兴起,香港直接使用台湾的字符集等标准,香港增补字符集即在大五码基础上扩展修改。
  3. 大五码本身存在不少问题,包括某些字形部件不统一、字符字形对应错误等问题,对照比较亦是修正相关错误。

原捺笔变形为顿点法则

若字符包含一笔或多笔捺笔,有些捺笔会收敛为顿点,这是香港字形的重要法则:

  1. “让“——凡捺笔的右面尚有其他部件,该捺笔一律收敛为顿点,没有例外:image.png
  2. “入”“水”这两个部件的捺笔通常会保留。
  3. 凡含捺笔的部件被包围,该捺笔收敛为顿点:image.png 但“内”的捺笔则根据第二条而得以保留。凡捺笔的下面尚有其他部件,该捺笔一般收敛为顿点:image.png ,较平而盛载着其他部件者,可称为“平捺”,不收敛:image.png 凡上部为左撇右捺而空的部件,形成覆盖下部之势,该右捺保留:image.png 字的上部为左右结构,而右面有捺。此捺笔是否保留,视乎上部与下部的相对宽度而定。下比上宽时让为顿:image.png 相反,包括下部属上窄下宽的情况则捺笔保留:image.png 据此法则,上部含相同部件的字,视乎下部部件,右上部的字形可能有所不同:image.png
  4. 基于“一字不两捺”原则,凡为平捺所盛载的其他捺笔让为顿点:image.png。 然据第二条,平捺所盛载的,其捺笔不让,如。据4. b,若所盛载者为左撇右捺而中空的部件,形成覆盖下部之势,则该捺笔得以保留,如
  5. 同样基于“一字不两捺”原则,凡上部为左撇右捺而中空的部件,形成覆盖下部之势,下部所含之捺笔让为顿点:image.png。然下部平捺则仍不让,如。此外据第二条,下部的「水」的捺也不让,如
  6. 部件“大”及几个近似部件,在一定的条件下捺笔收敛为顿点。三者,条件为其上有其他部件使捺笔受压至高不及字半,捺笔收敛为顿点,如。而尖、戾的捺笔则由于高度能及半而得以保留。则凡与其他部件拼合,本身的捺笔均收敛为顿点,如等。然若有关部件左右重复并排,则作为整个字最后一笔的捺笔得以保留:如𡘙。须注意,部件的情况不能推及部件,为独立部件,不在上述四个部件之列,即使受压如,捺笔也仍然保留。

《香港电脑汉字参考字形》的意义

其实这一文件只具有指引作用,并非强制标准。但这一文件的制定,是众多专家学者以及包括一般市民在内的许多人共同完成的,参照了许多资料,力求在保留汉字原始历史风貌的同时,承载香港的文化,并以较为统一的形式与国际标准接轨。这在东亚国家或地区对文字字形的规范制定中是非常重要的一部分,将对于香港公共空间的文字环境有深远影响。


  1. 字形:根据GB/T 12200.2–94《汉语信息处理词汇02部分:汉语和汉字》,字形特指构成每个方块汉字的可识别抽象图形符号,为实际图形的抽象表示。构成汉字字形的要素是笔画、笔数、汉字部首和部件,以及其相对位置等。

  2. H-列:中日韩统一表意文字区中每个码位都有多个字形,并以整列形式列出,旨在清楚地显示某一个国家或地区所用的字符。香港使用的汉字即载于H-列。

  3. 香港字形:Hong Kong Chinese Character Glyph,即该文件所载的香港惯用电脑汉字字形

  4. 大五码:Big-5,台湾和香港普遍采用的中文编码工业标准。

  5. 大五码字形:台湾工业标准《电脑用中文字型与字码对照表》中显示的字形。

  6. 台宋字形:台湾教育部公布的《国字标准字体宋体母稿—教育部字序》中所收汉字的字形。

  7. 在特区政府咨询科技总监办公室网站刚发布文章时为2017年,与文件存在差别,后予以修正:image.png

  8. 等同规则:ISO/IEC 10646 Information technology – Universal Coded Character Set (UCS) Annex S (informative) Procedure for the unification and arrangement of CJK Ideographs所定义的一套规则,据此规则,读音和意义相同而形体不同的等同汉字不会分别编码,只要不违反等同规则,ISO/IEC 10646国际编码标准不限制同一码位汉字的具体字形。

  9. 笔形:根据GF 3001–1997《信息处理用GB13000.1字符集汉字部件规范》,笔形指笔画的具体形状。Unicode 的中日韩笔画分布于U+31C0至U+31EF: image.png

Some rights reserved
Except where otherwise noted, content on this page is licensed under a Creative Commons Attribution 4.0 International license