linuxdebug/Documentation/translations/zh_TW/admin-guide/unicode.rst

175 lines
6.9 KiB
ReStructuredText
Raw Normal View History

2024-07-16 15:50:57 +02:00
.. SPDX-License-Identifier: GPL-2.0
.. include:: ../disclaimer-zh_TW.rst
:Original: Documentation/admin-guide/unicode.rst
:譯者:
吳想成 Wu XiangCheng <bobwxc@email.cn>
胡皓文 Hu Haowen <src.res@email.cn>
Unicode統一碼支持
======================
英文版上次更新2005-01-17版本號 1.4
此文檔由H. Peter Anvin <unicode@lanana.org>管理是Linux註冊名稱與編號管理局
Linux Assigned Names And Numbers AuthorityLANANA項目的一部分。
現行版本請見:
http://www.lanana.org/docs/unicode/admin-guide/unicode.rst
簡介
-----
Linux內核代碼已被重寫以使用Unicode來將字符映射到字體。下載一個Unicode到字體
Unicode-to-font八位字符集與UTF-8模式都將改用此字體來顯示。
這微妙地改變了八位字符表的語義。現在的四個字符表是:
=============== =============================== ================
映射代號 映射名稱 Escape代碼 (G0)
=============== =============================== ================
LAT1_MAP Latin-1 (ISO 8859-1) ESC ( B
GRAF_MAP DEC VT100 pseudographics ESC ( 0
IBMPC_MAP IBM code page 437 ESC ( U
USER_MAP User defined ESC ( K
=============== =============================== ================
特別是 ESC ( U 不再是「直通字體」因爲字體可能與IBM字符集完全不同。
例如即使加載了一個Latin-1字體也允許使用塊圖形block graphics
請注意儘管這些代碼與ISO 2022類似但這些代碼及其用途都與ISO 2022不匹配
Linux有兩個八位代碼G0和G1而ISO 2022有四個七位代碼G0-G3
根據Unicode標準/ISO 10646U+F000到U+F8FF被保留用於作業系統範圍內的分配
Unicode標準將其稱爲「團體區域Corporate Zone因爲這對於Linux是不準確
所以我們稱之爲「Linux區域」。選擇U+F000作爲起點因爲它允許直接映射
區域以2的大倍數開始以防需要1024或2048個字符的字體。這就留下U+E000到
U+EFFF作爲最終用戶區。
[v1.2]Unicodes範圍從U+F000到U+F7FF已經被硬編碼爲直接映射到加載的字體
繞過了翻譯表。用戶定義的映射現在默認爲U+F000到U+F0FF模擬前述行爲。實際上
此範圍可能較短例如vgacon只能處理256字符U+F000..U+F0FF或512字符
U+F000..U+F1FF字體。
Linux 區域中定義的實際字符
---------------------------
此外還定義了Unicode 1.1.4中不存在的以下字符這些字符由DEC VT圖形映射使用。
[v1.2]此用法已過時,不應再使用;請參見下文。
====== ======================================
U+F800 DEC VT GRAPHICS HORIZONTAL LINE SCAN 1
U+F801 DEC VT GRAPHICS HORIZONTAL LINE SCAN 3
U+F803 DEC VT GRAPHICS HORIZONTAL LINE SCAN 7
U+F804 DEC VT GRAPHICS HORIZONTAL LINE SCAN 9
====== ======================================
DEC VT220使用6x10字符矩陣這些字符在DEC VT圖形字符集中形成一個平滑的過渡。
我省略了掃描5行因爲它也被用作塊圖形字符因此被編碼爲U+2500 FORMS LIGHT
HORIZONTAL。
[v1.3]這些字符已正式添加到Unicode 3.2.0中它們在U+23BA、U+23BB、U+23BC、
U+23BD處添加。Linux現在使用新值。
[v1.2]添加了以下字符來表示常見的鍵盤符號這些符號不太可能被添加到Unicode
中,因爲它們非常討厭地取決於特定供應商。當然,這是糟糕設計的一個好例子。
====== ======================================
U+F810 KEYBOARD SYMBOL FLYING FLAG
U+F811 KEYBOARD SYMBOL PULLDOWN MENU
U+F812 KEYBOARD SYMBOL OPEN APPLE
U+F813 KEYBOARD SYMBOL SOLID APPLE
====== ======================================
克林貢Klingon語支持
------------------------
1996年Linux是世界上第一個添加對人工語言克林貢支持的作業系統克林貢是由
Marc Okrand爲《星際迷航》電視連續劇創造的。這種編碼後來被徵募Unicode註冊表
ConScript Unicode RegistryCSUR採用並建議但最終被拒絕納入Unicode
平面一。不過它仍然是Linux區域中的Linux/CSUR私有分配。
這種編碼已經得到克林貢語言研究所Klingon Language Institute的認可。
有關更多信息,請聯繫他們:
http://www.kli.org/
由於Linux CZ開頭部分的字符大多是dingbats/symbols/forms類型而且這是一種
語言因此根據標準Unicode慣例我將它放置在16單元的邊界上。
.. note::
這個範圍現在由徵募Unicode註冊表正式管理。規範性引用文件爲
https://www.evertype.com/standards/csur/klingon.html
克林貢語有一個26個字符的字母表一個10位數的位置數字書寫系統從左到右
,從上到下書寫。
克林貢字母的幾種字形已經被提出。但是由於這組符號看起來始終是一致的,只有實際
的形狀不同因此按照標準Unicode慣例這些差異被認爲是字體變體。
====== =======================================================
U+F8D0 KLINGON LETTER A
U+F8D1 KLINGON LETTER B
U+F8D2 KLINGON LETTER CH
U+F8D3 KLINGON LETTER D
U+F8D4 KLINGON LETTER E
U+F8D5 KLINGON LETTER GH
U+F8D6 KLINGON LETTER H
U+F8D7 KLINGON LETTER I
U+F8D8 KLINGON LETTER J
U+F8D9 KLINGON LETTER L
U+F8DA KLINGON LETTER M
U+F8DB KLINGON LETTER N
U+F8DC KLINGON LETTER NG
U+F8DD KLINGON LETTER O
U+F8DE KLINGON LETTER P
U+F8DF KLINGON LETTER Q
- Written <q> in standard Okrand Latin transliteration
U+F8E0 KLINGON LETTER QH
- Written <Q> in standard Okrand Latin transliteration
U+F8E1 KLINGON LETTER R
U+F8E2 KLINGON LETTER S
U+F8E3 KLINGON LETTER T
U+F8E4 KLINGON LETTER TLH
U+F8E5 KLINGON LETTER U
U+F8E6 KLINGON LETTER V
U+F8E7 KLINGON LETTER W
U+F8E8 KLINGON LETTER Y
U+F8E9 KLINGON LETTER GLOTTAL STOP
U+F8F0 KLINGON DIGIT ZERO
U+F8F1 KLINGON DIGIT ONE
U+F8F2 KLINGON DIGIT TWO
U+F8F3 KLINGON DIGIT THREE
U+F8F4 KLINGON DIGIT FOUR
U+F8F5 KLINGON DIGIT FIVE
U+F8F6 KLINGON DIGIT SIX
U+F8F7 KLINGON DIGIT SEVEN
U+F8F8 KLINGON DIGIT EIGHT
U+F8F9 KLINGON DIGIT NINE
U+F8FD KLINGON COMMA
U+F8FE KLINGON FULL STOP
U+F8FF KLINGON SYMBOL FOR EMPIRE
====== =======================================================
其他虛構和人工字母
-------------------
自從分配了克林貢Linux Unicode塊之後John Cowan <jcowan@reutershealth.com>
和 Michael Everson <everson@evertype.com> 建立了一個虛構和人工字母的註冊表。
徵募Unicode註冊表請訪問
https://www.evertype.com/standards/csur/
所使用的範圍位於最終用戶區域的低端,因此無法進行規範化分配,但建議希望對虛構
字母進行編碼的人員使用這些代碼以實現互操作性。對於克林貢語CSUR採用了Linux
編碼。CSUR的人正在推動將Tengwar和Cirth添加到Unicode平面一將克林貢添加到
Unicode平面一被拒絕因此上述編碼仍然是官方的。