本文是写作风格的详细规范。
本文明确了文本的组织方式、固定格式等内容,以便整理和校对。事实上,这些规则大多来自语感和排版惯例。您没有必要在初次参与贡献之前强迫自己学习本指南。
本指南仅面向简体中文环境下的技术文档写作。
下列定义适用于本文。(按字母顺序排序)
阿拉伯数字 (Arabic numerals) 指 0、1、2、3、4、5、6、7、8、9 这十个符号。
| Symbol | Code |
|---|---|
| 0 | U+0030 |
| 1 | U+0031 |
| 2 | U+0032 |
| 3 | U+0033 |
| 4 | U+0034 |
| 5 | U+0035 |
| 6 | U+0036 |
| 7 | U+0037 |
| 8 | U+0038 |
| 9 | U+0039 |
夹注符号 (brackets) 是为提示或突显而将文本夹注起来的一类成对符号的总称。夹注符号包括引号、括号、书名号。
中文 (Chinese characters) 和 CJK characters (Chinese, Japanese, and Korean characters) 是同义词,指位于 Unicode 中与 CJK Unified Ideographs 相关的 block 的字符。详见 The Unicode Standard, Chapter 18。参看 Unihan Database
截止至 Unicode 13.0.0,它包括
| Range | Block |
|---|---|
| 4E00–9FFF | CJK Unified Ideographs |
| 3400–4DBF | CJK Unified Ideographs Extension A |
| 20000–2A6DF | CJK Unified Ideographs Extension B |
| 2A700–2B73F | CJK Unified Ideographs Extension C |
| 2B740–2B81F | CJK Unified Ideographs Extension D |
| 2B820–2CEAF | CJK Unified Ideographs Extension E |
| 2CEB0–2EBEF | CJK Unified Ideographs Extension F |
| 30000–3134F | CJK Unified Ideographs Extension G |
| F900–FAFF | CJK Compatibility Ideographs |
| 2F800–2FA1F | CJK Compatibility Ideographs Supplement |
英文 (English) 指 ASCII 中 A 至 Z,和 a 至 z,共 52 个字符;即 Unicode 中 U+0041 至 U+005A,和 U+0061 至 U+007A。详见 Unicode Character Code Charts 的 C0 Controls and Basic Latin。
英文是西文的一种。
语段 (expression) 指语言片段,是对各种语言单位(如词、短语、句子、复句等)不做特别区分时的统称。此定义来自 GB/T 15834-2011。
标点符号 (punctuation) 是辅助文字记录语言的符号,是书面语的有机组成部分,用来表示语句的停顿、语气以及表示某成分(主要是词语)的特定性质和作用。数学符号、货币符号、校勘符号、辞书符号、注音符号等特殊领域的专门符号不属于标点符号。此定义来自 GB/T 15834-2011。
常见的标点符号有
| 中文 | 英文 |
|---|---|
| , | , |
| 。 | . |
| ! | ! |
| ? | ? |
| : | : |
| ; | ; |
| ( | ( |
| ) | ) |
注意
英文中常见的引号 (quotation marks) 有 double 和 single 两对,且都有 curly 和 straight 两种形式。
Symbol Code Name " U+0022 Quotation Mark ' U+0027 Apostrophe “ U+201C Left Double Quotation Mark ” U+201D Right Double Quotation Mark ‘ U+2018 Left Single Quotation Mark ’ U+2019 Right Single Quotation Mark
- U+0022 是 straight double quotation mark。
- U+0027 是 straight single quotation mark。
- U+201C 和 U+201D 是 curly double quotation mark,且是中文的双引号。
- U+2018 和 U+2019 是 curly single quotation mark,且是中文的单引号。
A script is a collection of letters and other written signs used to represent textual information in one or more writing systems. For example, Russian is written with a subset of the Cyrillic script; Ukranian is written with a different subset. The Japanese writing system uses several scripts. 此定义来自 Glossary of Unicode Terms。
一种用于书写一种或多种语言的文字系统。此定义来自《英汉计算机技术大辞典》(白英彩. 英汉计算机技术大辞典[M]. 上海: 上海交通大学出版社, 2001.),仅供参考。
空格 (space) 指字符 U+0020。
西文 (Western scripts) 指拉丁文 (Latin)、希腊文 (Greek)、西里尔文 (Cyrillic),以及它们的衍生物,是欧洲、美洲和大洋洲通行的文字的统称。
规则总结为 3 点:
- 左侧优先。
- 行内短语无影响。
- 夹注符号内部独立。
正常情况下,简体中文的技术文档都是从左向右书写的。于是,插入点左侧的字符决定 script。
简体中文的技术文档的默认 script 是 Hans。有关 script code 的信息在 UAX #24 和 ISO 15924。
在写作时,句子中经常会出现与当前 script 不同的字符,这些字符会组成外来语短语,它们不改变 script,仿佛与句中其他字符在相同的 script,进而不影响标点符号等的使用,本文称这种现象是行内短语无影响。
示例
英文内嵌入了中文:
The Chinese word for crisis is 危机, however, believe it or not, this word suggests that crisis and opportunity come together.
中文内嵌入了英文:
将 review、merge 等行为组合到一起,便诞生了一种协作方式,叫做 pull request。
中文内嵌入了英文和阿拉伯数字:
Arabic numerals 通常指 0、1、2、3、4、5、6、7、8、9 这十个符号。
中文内嵌入了英文和希腊字母:
正反费米子只能成对产生或消失,而玻色子(π、K、γ 等)可以任意数目产生或消失。
夹注符号内部的语段是相对独立的。该语段自身决定夹注符号内部的 script。
示例
括号内是英文:
如果幺正矩阵的元素都是实数,则称为正交矩阵 (orthogonal matrix)。
括号内是中文:
定态下,粒子在空间的概率密度 ρ 不随时间改变(与 t 无关)。
书名号内是中文:
It is the position of this character in the 《康熙字典》 used in the four-dictionary sorting algorithm.
按下列优先级应用规则。如果前一项缺少所需项目,就去后一项查询,查到为止;如果全都没有,表明暂不做要求。引文链接在文末“参考”部分。
- 本文规定的项目
- Microsoft Writing Style Guide
- 阮一峰《中文技术文档的写作规范》
除了后文各章节介绍的方面,还请注意下列事项:
- 虽然 Microsoft Writing Style Guide 主要适用于英文,但是其中不少内容也适用于中文。
- Commas | Microsoft Style Guide
- Capitalization | Microsoft Style Guide
- 注意语段的长度、语气、语态。参看
- Writing step-by-step instructions | Microsoft Style Guide
- Headings | Microsoft Style Guide
- Lists | Microsoft Style Guide
- 祈使句较常见,以“你”作主语的句子较少用。
- 通常,粗体、斜体带有一定的语气。
- 使用粗体表示强调 (strong importance),使内容醒目。
- 粗体对应的 HTML element 是
<strong>,此处引述其逻辑意义来说明粗体的语气:这个元素表征“内容强烈的重要性 (strong importance for its contents)”。
- 粗体对应的 HTML element 是
- 使用斜体表示着重、轻微的突显 (change spoken emphasis)。
- 斜体对应的 HTML element 是
<em>,此处引述其逻辑意义来说明斜体的语气:这个元素标记出需要用户重读突出的内容 (for words that have a stressed emphasis)。
- 斜体对应的 HTML element 是
- 从无障碍性上考虑,粗体比斜体更实用。
- 定义概念时,加粗该词。
- 在较长的句子、段落中,可以设置专有名词为粗体,以使之有别于正文。
- 在较长的句子、段落中,可以设置专业术语为斜体,以使之有别于正文。
示例
命令行程序不能双击打开!
示例
标准对此没有要求,但行业建议使用 48 V 电压。
示例
如果幺正矩阵的元素都是实数,则称为正交矩阵 (orthogonal matrix)。
当语段内出现作品、章节、网页的名称时,
- 书籍、刊物、政策文件、blog、电影、音乐、诗歌等作品的名称
- 英文的,使用 粗斜体。例如
Microsoft Writing Style Guide
- 中文的,按 GB/T 15834-2011 的规定使用书名号。例如
《中文技术文档的写作规范》
- 英文的,使用 粗斜体。例如
- 一部作品内部的章节的名称
- 使用双弯引号 (curly double quotation mark) 夹注起来。
- 使用正文的样式,也可以使用斜体,一篇文章内应当一致。
- 无法归入上述类别的网页的名称
- 使用正文的样式,并且设置为指向目标网页的链接。
- 根据具体项目规定的引文格式,统一整理网页的名称。本文使用的格式为
文章名 | 作者名 | 网站名
- 定义概念时,它的全称应当在句子内部出现至少一次,使用单数形式(除非该词必须为复数),并且加粗。这样,读者能够知道其规范拼写、大小写。
- 纯中文的词语没有大小写的问题,于是,也可以出现在句首。
- 翻译自外文的词语必须注明其英文。如果该词的起源不在英语,还应当注明其原生写法。
- 专业术语首次出现时,应当同时给出定义,定义应当通俗易懂、不失严谨。可以仅设置指向定义的链接,而不必插入全文。
- 纯中文的句子,按 GB/T 15834-2011 的规定。
- 纯英文的句子,按 Microsoft Writing Style Guide 的规定。
当一个句子中出现多种 script 的字符时,使用下面列出的标点符号规则:
- 插入点的 script 决定所用的标点符号的 script。
- 夹注符号跟随内部。
- 中文与西文之间、中文与数字之间留一个空格。
- 中文与西文标点符号之间应该留适当的空格。通常,将中文视作西文,按西文的语法和排版规则分析,确定空格,参看“行内短语无影响”。
- 连续的中文内、西文与中文标点(不包括夹注符号)之间没有空格,除非
- 不加空格会导致编译错误。
- 不加空格会导致无法区分专有名词和普通名词。
- 特殊的排版规定。
- 如果不确定,就用英文标点,并搭配适当的空格。
夹注符号内部的 script,决定夹注符号的 script。参看“夹注符号内部独立”。
示例
括号内是英文:
如果幺正矩阵的元素都是实数,则称为正交矩阵 (orthogonal matrix)。
括号内是中文:
定态下,粒子在空间的概率密度 ρ 不随时间改变(与 t 无关)。
括号内是中文:
Zhang San (张三) is a Chinese name.
引号内是日文:
This technology was eventually used to design the glyphs for kanji in the 「小塚明朝」 typeface design.
下面列出一些较少见、但仍需稍加关注的事情:
- 西文字符总是半角。不要使用全角西文字符,它们是历史遗留问题。(如果使用日语输入法输入西文,记得检查设置。)
- 慎用强调。不应该大片地使用强调,因为这容易使读者困惑。(如果一定要这样做,三思。)
- 汉语词语(不含专业术语)的意义应当参考由中国社会科学院语言研究所词典编辑室编写、商务印书馆出版的《现代汉语词典》。
- 在英语中,bold、italic 都是形容词 (adjective)。在汉语中,习惯上,加粗是动词,粗体是名词,斜体是名词。
- “建议”和“推荐”作动词时:
- 建议做某事。
- 推荐某物。
本指南参考了下列文件(按权重由高到低排序):
- Microsoft Writing Style Guide
- Markdown reference | Contributor Guide | Microsoft Docs
- The Unicode Standard
- 《标点符号用法》 (GB/T 15834-2011)
- 《出版物上数字用法》 (GB/T 15835-2011)
- 中文技术文档的写作规范 | 阮一峰
- MDN Web 文档写作规范(中文版)
- Requirements for Chinese Text Layout 中文排版需求 | W3C
- Wikipedia:Manual of Style | Wikipedia
文中示例也参考了下列页面(按字母顺序排序):