思源黑体 vs 思源宋体

原文:Source Han Sans vs Source Han Serif

作者:Dr. Ken Lunde (小林剣)

时间:2017 年 5 月 8 日

译按:本文除了介绍思源黑体和思源宋体的区别,另宣布发布思源宋体 1.001 版

注意⚠️ 本译文获得原作者授权,转载请注明来源

几乎每有机会,不论是通过这个博客还是通过公开演讲,我都已经非常明确表示,Adobe 命名的 Source Han 字体家族与相对应的 Google 命名的 Noto CJK 字体家族共享相同的字形集。然而需要进一步解释的是,Source Han SansSource Han Serif 这两种字体的设计有何不同。 这就是这篇文章的主题。

作为这些泛中日韩字体家族的项目架构师,我掌握开发过程中使用的所有数据,并为每个释出做准备。 因此,我可以提供一些在别处找不到的有用的信息。

名称和字重

因为思源字体家族内的字体风格和设计不同,他们的名称也必须不同,包括 7 种字重。思源黑体的 Normal 字重对应的思源宋体则是 SemiBold。Google 方面有他们的字重命名特点。

有趣的事,可以预见,有些人在思源宋体的繁体中文名称本地化方面有些歪曲,他们或许更期待使用「思源明体」。其实以「宋」代「明」是有意为之。请注意,思源宋体是一款泛中日韩字体,繁体中文的范围仅限大五码1。因此,如下一节将要讲到的,在尝试使用超过大五码范围的表意文字时,遵循简体中文惯例而非繁体中文的可能性相对较高。换句话说,在繁体中文名称里使用「宋」也算一种温和微妙的提醒。

对区域标准的覆盖

第一点,也是很重要的一点,思源字体家族在表意文字方面的覆盖范围,几乎达到了各区域标准的上限。特别是中国大陆的 GB 180302、台湾的大五码、日本的JIS 标准3,以及韩国的KS X 10014和 KS X 10025。思源黑体和思源宋体目前的区别在于,前者至少编码位置上支持香港增补字符集6,而后者出于填补URO7的目的,只包含少量的香港字形。

还有一点很重要,一旦试图使用超出特定区域标准范围的表意文字,可能无法保证其字形能否遵循该地区惯例。

Unicode 版本

思源黑体大约是三年前发布的,正好在 Unicode 7.0 版发布之后。我们悄悄加入了四个表意文字——U+9FCD 鿍,U+9FCE 鿎,,U+9FCF 鿏,U+9FD0 鿐,这四个文字当时预计被编入在下个版本的 Unicode 中,并且被视为足够稳定的支持。实际上在次年 6 月,它们与另外五个从 U+9FD1 到 U+9FD5 的表意文字 。被编入了 Unicode 8.0 版中。

Unicode 目前的版本是 9.0,而 10.0 版预计下个月发布。

思源宋体在上个月发布,包含 Unicode 8.0 版的五个表意文字,以及添加到 9.0版中,预计下个月将包含在 10.0 版中的几个字符。其中包含这包括与 Adobe-Japan1-68中汉字相对应的 3 个扩展-F 的表意文字。

思源宋体的附加字符字符支持方面,有 53 个:

U+03C2 (1.1)、U+2B95 (7.0)、U+312E (10.0)、U+312F (11.0?)、U+9FD1 至 U+9FD5 (8.0)、U+9FD6 至 U+9FEA (10.0)、U+1F12F (10.0)、U+1F19B 至 U+1F1AC (9.0)、U+1F23B (9.0)、U+2D544 (10.0)、U+2E278 (10.0),以及 U+2E6EA (10.0)。

U+312F 被认为有足够稳定支持,预计编入 Unicode 11.0 版。

image.png

当然,你可以预期这些增加的字符会在思源黑体 2.000 版中支持,不过我对包含香港字形 U+9FD2 深表怀疑。

Unicode 异体字序列

思源黑体和思源宋体的 Unicode 异体字序列 在 Format 14 'cmap' 子表9中被指定,在两个重要的方面有所不同。

首先,思源宋体的简体中文字体和字体实例包含 9 个与 中日韩兼容表意文字对应的标准化的异体字。请阅读我的博客的这篇文章中的 Event #4 以了解相关背景知识。

其次,思源宋体包含 3 个 Adobe-Japan 1 IVSes(表意文字异体字序列)10,他们的基本字符在扩展-F 中,预计在 7 月被注册。详情请参阅PRI #349

image.png

思源黑体 2.000 版将包含这些重要而强大的微调。虽然最新的简体中文字体和字体示例不包含 9 个标准异体字,但我向这个项目添加了SourceHanSans_CN_sequences.txt Unicode 异体字序列定义文件。

错误——已知的和新的

当开发包含大量字形的字体时,不可避免地存在出现错误的可能性。鉴于字符数量庞大,我会说我确信这两款字体的设计中都潜藏着错误。这是理所当然的。

幸运的是,像这些托管在 GitHub 上的开源项目,有着很好的报告和跟踪问题的机制。我对那些发现和报告问题的人表示感谢。一些错误报告可能被视为对字体设计的吹毛球次,这些问题取决与设计人员决定是否解决,以及如何解决。剩下的则是亟待解决的真正的错误。

底线是,如果某些东西看起来像一个错误,那么可能是,特别是当比较两个字体时,字形上有着明显不同。谨慎的做法是报告问题,然后让我或设计师做出决定。 同时要记住,标准不是没有错误的

字形共享

字体的可跨语言共享的程度取决于两个主要因素:字体样式和字体设计。在本段的语境中,字体风格一般意义上最好描述为是否是衬线字体。字体设计是指使该字体与基于相同字体风格的其他字体设计区别开来的实际设计的细节。

不论字体设计如何,一些表意文字的字形往往超过一种,至少在设计黑体和宋体时。U+5973 女 就是一个很好的例子,展示了一个共享的日语/朝鲜语字形和单独的中国大陆和台湾字形:

image.png

以下图片示例说明了基于字体设计的字形共享的差异,因此与无衬线设计的 U+91D1 金,单独的日语/朝鲜语字形和中国大陆/台湾字形相比,衬线设计仅包括为所有语言提供的单个字形:

image.png

额外的日本字形

思源字体家族的初衷是包含大约 6000 个额外的日本字形,这超过了 JIS 和 Adobe-Japan1-6 中的标准。 在思源黑体中,这些额外的日本字形中有超过 4000 个需要在 1.000 版之前被删除,以便为有据且重要的繁体中文字形腾出空间。

因为思源宋体在 1.000 版中没有提供有意义的香港字体支持,所以包含了 6000 个左右的额外日本字形。 请注意,作为 2.000 版更新的一部分,其中约 4000 个将被删除,以便为有意义地支持香港所需的附加香港字形腾出空间,这引导我们进入本文的最后一部分。

这样做的实际效果是,当比较当前的思源黑体和思源宋体时,特别是在使用日语和朝鲜语字体和字体实例时,或这些语言被标记时,一些字符的字形可能会有所不同。

特殊字形

一个词 → Biáng

香港字形

思源黑体支持符合香港增补字符集—2008 标准的码位,但其字形并不一定符合香港的规范。 我们决定等到香港增补字符集—2016 能够提供更有意义的支持时,将以适当的字形和单独的香港字体和字体实例的形式出发布。

对于思源宋体,我们决定将对香港的支持推迟到 2.000 版,主要是为了避免做最后需要重复作业。 包含的少量香港字形是为了填补空缺。 我的预估是,需要增加约 4500 个新的香港字形,以提供足够的支持。

回想起来,包含额外日本表意文字似乎是一个好主意,因为它们是支持额外字形的一个很好的缓冲区。 最后可以删除其中一些,为更为关键的字形腾出空间。

思源宋体Adobe版(Source Han Serif) 与 Google 版(Noto Serif CJK Version 1.001)

最后,我想宣布,今天,思源宋体 Adobe 版(Source Han Serif)和 Google 版(Noto Serif CJK 1.001 版)发布11,包含这些最新的字体实例,以及 Multiple-Family Super OTC 版本。本文的一些细节基于思源宋体 1.001 版。

请享用!

🐡


  1. 大五码:Big5,繁体中文社区中最常用的电脑汉字字符集标准,共收录 13060 个汉字,早期非官方标准,后来在台湾和香港地区官方化。

  2. GB 18030:全称:国家标准 GB 18030-2005《信息技术 中文编码字符集》,是中华人民共和国现时最新的变长度多字节字符集。对GB 2312-1980完全向后兼容,与GBK基本向后兼容;支持 GB 13000(Unicode)的所有码位;共收录汉字 70244 个。

  3. JIS 标准:日本工业规格,这里特值思源字体家族支持的  JIS X 0208(七位元及八位元之双字节资讯交换用符号化汉字集)、JIS X 0213(七位元及八位元之双字节资讯交换用符号化扩展汉字集)和 JIS X 0212(资讯交换用汉字符号—补助汉字)。

  4. KS X 1001:韩国用于书写的谚文和汉字的字符编码规格。包含谚文2350字、汉字4888字、英文字母、数字和假名合计8226字。

  5. KS X 1002:韩国信息交换符号扩展集,最新标准为 2001 年发布的 KS X 1002:2001。

  6. 香港增补字符集:HKSCS(Hong Kong Supplementary Character Set),是香港政府基于大五码扩展的字符集标准,是现时香港的中文信息交换内码标准。最新版本为2009年12月推出的 HKSCS-2008,收录5009个字符。

  7. UROUnified Repertoire and Ordering,参照中日韩统一表意文字。

  8. Adobe-Japan1-6:完全支持目前的 JIS 的 PostScript 字符集标准。

  9. cmap:Character To Glyph Index Mapping Table,字符到字形索引映射表,OpenType 字体表之一,定义字符代码与字体中使用的字形索引值的映射。

  10. cmap:Character To Glyph Index Mapping Table,字符到字形索引映射表,OpenType 字体表之一,定义字符代码与字体中使用的字形索引值的映射。

  11. Sans-serif & Serif:无衬线字体和衬线字体,来自西文的字体设计风格概念,大体上相对的汉字字体是黑体和宋体,但这种对应并不十分严谨。