Chromium Code Reviews
chromiumcodereview-hr@appspot.gserviceaccount.com (chromiumcodereview-hr) | Please choose your nickname with Settings | Help | Chromium Project | Gerrit Changes | Sign out
(9)

Unified Diff: source/data/translit/Hans_Hant.txt

Issue 2440913002: Update ICU to 58.1
Patch Set: Created 4 years, 2 months ago
Use n/p to move between diff chunks; N/P to move between comments. Draft comments are only viewable by you.
Jump to:
View side-by-side diff with in-line comments
Download patch
« no previous file with comments | « source/data/translit/Hani_Latn.txt ('k') | source/data/translit/Hebr_Latn.txt » ('j') | no next file with comments »
Expand Comments ('e') | Collapse Comments ('c') | Show Comments Hide Comments ('s')
Index: source/data/translit/Hans_Hant.txt
diff --git a/source/data/translit/Simplified_Traditional.txt b/source/data/translit/Hans_Hant.txt
similarity index 97%
rename from source/data/translit/Simplified_Traditional.txt
rename to source/data/translit/Hans_Hant.txt
index 88f1039c86564f14482d059a6082f7f662af2959..acb0dbdc598d4338163bc3c92f4e0da5381944c3 100644
--- a/source/data/translit/Simplified_Traditional.txt
+++ b/source/data/translit/Hans_Hant.txt
@@ -1,25 +1,35 @@
-# ***************************************************************************
-# *
-# * Copyright (C) 2004-2015, International Business Machines
-# * Corporation; Unicode, Inc.; and others. All Rights Reserved.
-# *
-# ***************************************************************************
-# File: Simplified_Traditional.txt
-# Generated from CLDR
+# © 2016 and later: Unicode, Inc. and others.
+# License & terms of use: http://www.unicode.org/copyright.html#License
#
+# File: Hans_Hant.txt
+# Generated from CLDR
+#
+
+# Copyright (c) 2005-2007,2010 Apple Inc., Unicode Inc.,
+# and others. All Rights Reserved.
+# For terms of use, see http://unicode.org/copyright.html#Exhibit1
+# Convert between simplified and traditional Chinese
+# UTRANS_FORWARD is from simplified to traditional
$SCDigit = [零一二三四五六七八九十百千万亿两] ;
$TCDigit = [零一二三四五六七八九十百千萬億兩] ;
+#
+# complex mappings for which there is no easy solution
+# so we arbitrarily pick one
+#
+# does not handle the surnames 于 or 於
于飞↔于飛;
于归↔于歸;
于思↔于思;
单于↔單于;
鲜于↔鮮于;
+#
姜片↔薑片;
姜末↔薑末;
生姜↔生薑;
鬼子姜↔鬼子薑;
姜↔姜;
姜←薑;
+#
赤皮仑↔赤皮崙;
金仑溪↔金崙溪;
下仑↔下崙;
@@ -33,6 +43,10 @@ $TCDigit = [零一二三四五六七八九十百千萬億兩] ;
仑↔侖;
曲↔曲;
曲←麯;
+#
+# Multiliple TC to SC
+#
+#
茶余饭后↔茶餘飯後;
余怒未消↔餘怒未消;
余音绕梁↔餘音繞梁;
@@ -69,22 +83,27 @@ $SCDigit { 余 → 餘;
余↔余;
馀→餘;
余←餘;
+#
什么↔甚麼;
么↔麼;
么←麽;
么←么;
+#
复数↔複數;
复分数↔複分數;
复杂↔複雜;
复制↔複製;
复↔復;
复←複;
+#
+#
了然↔瞭然;
了解↔瞭解;
了望↔瞭望;
明了↔明瞭;
了↔了;
了←瞭;
+#
解铃系铃↔解鈴繫鈴;
系词↔繫詞;
系辞↔繫辭;
@@ -97,6 +116,7 @@ $SCDigit { 余 → 餘;
系↔系;
系←係;
系←繫;
+#
糊里糊涂↔糊裡糊塗;
稀里糊涂↔稀裡糊塗;
蒙在鼓里↔蒙在鼓裡;
@@ -193,6 +213,10 @@ $SCDigit { 海里 → 海里;
里外↔裡外;
里←裡;
里←裏;
+#
+# 乾 appears in the most compounds
+# 幹 is next
+# then 干
干什么↔幹甚麼;
干部↔幹部;
干才↔幹才;
@@ -234,6 +258,7 @@ $SCDigit { 海里 → 海里;
干↔乾;
干←幹;
干←干;
+#
划时代↔劃時代;
划分↔劃分;
划分←畫分;
@@ -269,6 +294,7 @@ $SCDigit { 海里 → 海里;
划↔划;
划←劃;
画↔畫;
+#
$SCDigit { 斗 → 斗;
斗量↔斗量;
斗胆↔斗胆;
@@ -289,6 +315,7 @@ $SCDigit { 斗 → 斗;
斗←斗;
斗←闘;
斗←鬭;
+#
周 } $SCDigit → 週;
周末↔週末;
周刊↔週刊;
@@ -300,6 +327,8 @@ $SCDigit { 斗 → 斗;
本周↔本週;
周↔周;
周←週;
+#
+#
松球↔松毬;
球花↔毬花;
球果↔毬果;
@@ -316,11 +345,13 @@ $SCDigit { 斗 → 斗;
肉松↔肉鬆;
松↔松;
松←鬆;
+#
果↔果;
果←菓;
老板↔老闆;
板↔板;
板←闆;
+#
面条↔麵條;
面粉↔麵粉;
面包↔麵包;
@@ -343,14 +374,17 @@ $SCDigit { 斗 → 斗;
白面↔白麵;
面↔面;
面←麵;
+#
防御↔防禦;
御敌↔禦敵;
御寒↔禦寒;
御↔御;
御←禦;
+#
腼腆↔靦腆;
腼←靦;
䩄→靦;
+#
宫商角徵羽↔宮商角徵羽;
征伐↔征伐;
征服↔征服;
@@ -361,18 +395,21 @@ $SCDigit { 斗 → 斗;
亲征↔親征;
征↔徵;
征←征;
+#
台风↔颱風;
写字台↔寫字檯;
台↔台;
台←颱;
台←臺;
台←檯;
+#
胡同↔衚衕;
胡子↔鬍子;
胡须↔鬍鬚;
胡↔胡;
胡←鬍;
胡←衚;
+#
须根↔鬚根;
须鲸↔鬚鯨;
须眉↔鬚眉;
@@ -380,6 +417,7 @@ $SCDigit { 斗 → 斗;
触须↔觸鬚;
须↔須;
须←鬚;
+#
$SCDigit { 只 → 隻;
形单影只↔形單影隻;
只贺新禧←祇賀新禧;
@@ -396,6 +434,7 @@ $SCDigit { 只 → 隻;
祇↔祇;
只↔只;
只←隻;
+#
并发↔併發;
并拢↔併攏;
并入↔併入;
@@ -405,10 +444,13 @@ $SCDigit { 只 → 隻;
吞并↔吞併;
并↔並;
并←併;
+#
当↔當;
当←噹;
+#
药↔藥;
药←葯;
+#
布道↔佈道;
布景↔佈景;
布局↔佈局;
@@ -421,12 +463,14 @@ $SCDigit { 只 → 隻;
宣布↔宣佈;
布↔布;
布←佈;
+#
开天辟地↔開天闢地;
开辟↔開闢;
辟邪↔闢邪;
辟↔辟;
辟←闢;
人言藉藉↔人言藉藉;
+#
借口↔藉口;
借故↔藉故;
借使↔藉使;
@@ -439,20 +483,25 @@ $SCDigit { 只 → 隻;
借↔借;
借←藉;
藉→藉;
+#
尽管↔儘管;
尽↔盡;
尽←儘;
+#
叶韵↔叶韻;
叶↔葉;
叶←叶;
+#
伙计↔夥計;
伙伴↔夥伴;
伙↔伙;
伙←夥;
+#
家具↔傢具;
家伙↔傢伙;
家↔家;
家←傢;
+#
奸夫↔姦夫;
奸妇↔姦婦;
奸情↔姦情;
@@ -465,6 +514,7 @@ $SCDigit { 只 → 隻;
诱奸↔誘姦;
奸↔奸;
奸←姦;
+#
历书↔曆書;
历法↔曆法;
公历↔公曆;
@@ -483,18 +533,22 @@ $SCDigit { 只 → 隻;
万历↔萬曆;
历↔歷;
历←曆;
+#
万俟↔万俟; # surname
+#
气冲冲↔氣沖沖;
气焰↔氣燄;
焰←燄;
气↔氣;
气←气;
+#
细致↔細緻;
精致↔精緻;
标致↔標緻;
别致↔別緻;
致↔致;
致←緻;
+#
制版↔製版;
制成↔製成;
制品↔製品;
@@ -511,6 +565,7 @@ $SCDigit { 只 → 隻;
预制↔預製;
制↔制;
制←製;
+#
谷贱伤农↔穀賤傷農;
谷神星↔穀神星;
鬼谷子↔鬼谷子;
@@ -535,6 +590,7 @@ $SCDigit { 只 → 隻;
谷↔谷;
谷←穀;
谷←榖;
+#
后妃↔后妃;
后稷↔后稷;
后土↔后土;
@@ -545,6 +601,7 @@ $SCDigit { 只 → 隻;
太后↔太后;
后↔後;
后←后;
+#
地方志↔地方誌;
标志↔標誌;
墓志↔墓誌;
@@ -554,19 +611,24 @@ $SCDigit { 只 → 隻;
杂志↔雜誌;
志↔志;
志←誌;
+#
别扭↔彆扭;
别↔別;
别←彆;
+#
汇报↔彙報;
词汇↔詞彙;
字汇↔字彙;
汇↔匯;
汇←彙;
+#
辞↔辭;
辞←辞;
词↔詞;
+#
机↔機;
机←机;
+#
发廊↔髮廊;
发妻↔髮妻;
发型↔髮型;
@@ -631,11 +693,13 @@ $SCDigit { 只 → 隻;
发↔發;
发←髮;
卷←捲;
+#
人云亦云↔人云亦云;
不知所云↔不知所云;
云游↔雲遊;
云↔雲;
云←云;
+#
子丑寅卯↔子丑寅卯;
生旦淨末丑↔生旦净末丑;
丑时↔丑時;
@@ -644,9 +708,11 @@ $SCDigit { 只 → 隻;
小丑↔小丑;
丑↔醜;
丑←丑;
+#
萝卜↔蘿蔔;
卜↔卜;
卜←蔔;
+#
冲茶↔沖茶;
冲淡↔沖淡;
冲服↔沖服;
@@ -660,16 +726,20 @@ $SCDigit { 只 → 隻;
冲↔衝;
冲←沖;
冲←冲;
+#
$SCDigit { 出 } 戏 → 齣;
出游↔出遊;
出↔出;
出←齣;
+#
线↔線;
线←綫;
+#
核实↔覈實;
核算↔覈算;
核↔核;
核←覈;
+#
回路↔迴路;
回廊↔迴廊;
回游↔回遊;
@@ -678,12 +748,15 @@ $SCDigit { 出 } 戏 → 齣;
回↔回;
回←迴;
回←廻;
+#
冬冬↔鼕鼕;
冬↔冬;
冬←鼕;
+#
咸菜↔鹹菜;
咸↔咸;
咸←鹹;
+#
清心寡欲↔清心寡慾;
克欲修行↔克慾修行;
欲不可纵↔慾不可縱;
@@ -705,6 +778,7 @@ $SCDigit { 出 } 戏 → 齣;
嗜欲↔嗜慾;
欲↔欲;
欲←慾;
+#
准绳↔準繩;
准时↔準時;
准头↔準頭;
@@ -719,6 +793,7 @@ $SCDigit { 出 } 戏 → 齣;
准↔准;
准←準;
标↔標;
+#
注册↔註冊;
注销↔註銷;
注解↔註解;
@@ -728,6 +803,9 @@ $SCDigit { 出 } 戏 → 齣;
加注↔加註;
注↔注;
注←註;
+#
+# variants
+#
凶暴↔兇暴;
凶器↔兇器;
凶手↔兇手;
@@ -736,23 +814,32 @@ $SCDigit { 出 } 戏 → 齣;
逞凶↔逞兇;
凶↔凶;
凶←兇;
+#
扬↔揚;
扬←䬗;
飏↔颺;
+#
宴↔宴;
宴←醼;
䜩↔讌;
+#
咬↔咬;
咬←齩;
咬←䶧;
+#
豆↔豆;
豆←荳;
+#
韭↔韭;
韭←韮;
+#
+#
笺↔箋;
笺←牋;
+#
团↔團;
团←糰;
+#
卤鸡↔滷雞;
卤味↔滷味;
卤菜↔滷菜;
@@ -760,36 +847,50 @@ $SCDigit { 出 } 戏 → 齣;
盐卤↔鹽滷;
卤↔鹵;
卤←滷;
+#
呆↔呆;
呆←獃;
+#
泛↔泛;
泛←氾;
泛←汎;
+#
妫↔媯;
妫←嬀;
+#
众↔眾;
众←衆;
+#
钩↔鈎;
钩←鉤;
+#
绱↔緔;
绱←鞝;
+#
锐↔銳;
锐←鋭;
+#
赝↔贋;
赝←贗;
赃↔贓;
赃←贜;
+#
粗↔粗;
粗←麤;
+#
关↔關;
关←関;
+#
饥↔飢;
饥←饑;
+#
款↔款;
款←欵;
胧↔朧;
+#
蒙↔蒙;
蒙←懞;
+#
骂↔罵;
骂←駡;
脏↔臟;
@@ -819,18 +920,24 @@ $SCDigit { 出 } 戏 → 齣;
炮↔炮;
炮←砲;
炮←礮;
+#
启↔啓;
启←啟;
+#
茶几↔茶几;
几↔幾;
几←几;
+#
德↔德;
德←悳;
+#
悫↔愨;
悫←慤;
+#
克↔克;
克←剋;
克←尅;
+#
坛坛罐罐↔罈罈罐罐;
瓶瓶坛坛↔瓶瓶罈罈;
醋坛↔醋罈;
@@ -840,6 +947,7 @@ $SCDigit { 出 } 戏 → 齣;
坛←壜;
坛←罎;
坛←罈;
+#
升华↔昇華;
毕升↔畢昇;
高升↔高昇;
@@ -847,19 +955,26 @@ $SCDigit { 出 } 戏 → 齣;
升↔升;
升←昇;
升←陞;
+#
伪↔偽;
伪←僞;
+#
收获→收穫;
获↔獲;
获←穫;
+#
绦↔縧;
绦←絛;
+#
绣↔繡;
绣←綉;
+#
钵↔鉢;
钵←缽;
+#
蜡↔蠟;
蜡←蜡;
+#
采薪之忧↔采薪之憂;
兴高采烈↔興高采烈;
无精打采↔無精打采;
@@ -875,6 +990,7 @@ $SCDigit { 出 } 戏 → 齣;
䌽→綵;
采↔採;
采←埰;
+#
厕↔廁;
厕←厠;
捣↔搗;
@@ -899,8 +1015,10 @@ $SCDigit { 出 } 戏 → 齣;
凼←氹;
床↔床;
床←牀;
+# first form is more common
墙↔牆;
墙←墻;
+#
奖↔獎;
奖←奬;
眦↔眥;
@@ -927,8 +1045,10 @@ $SCDigit { 出 } 戏 → 齣;
酝←醞;
录↔錄;
录←録;
+# 鏽 is more common
锈↔鏽;
锈←銹;
+#
镢↔鐝;
䦆←钁;
阅↔閱;
@@ -939,6 +1059,7 @@ $SCDigit { 出 } 戏 → 齣;
闲居↔閑居;
闲↔閒;
闲←閑;
+#
游山玩水↔遊山玩水;
游伴↔遊伴;
游程↔遊程;
@@ -998,6 +1119,7 @@ $SCDigit { 出 } 戏 → 齣;
夜游↔夜遊;
游↔游;
游←遊;
+#
表蒙子↔錶蒙子;
表带↔錶帶;
表链↔錶鏈;
@@ -1018,11 +1140,14 @@ $SCDigit { 出 } 戏 → 齣;
停表↔停錶;
表↔表;
表←錶;
+#
症结↔癥結;
症↔症;
症←癥;
+#
痴↔痴;
痴←癡;
+#
白洋淀↔白洋淀;
荷花淀↔荷花淀;
水淀↔水淀;
@@ -1030,22 +1155,26 @@ $SCDigit { 出 } 戏 → 齣;
东淀↔東淀;
淀↔澱;
淀←淀;
+#
向导↔嚮導;
响应←嚮應;
向往↔嚮往;
向↔向;
向←嚮;
向←曏;
+#
扎营↔紮營;
驻扎↔駐紮;
扎↔扎;
扎←紮;
+#
占卜↔占卜;
占卦↔占卦;
占梦↔占夢;
占星↔占星;
占↔佔;
占←占;
+#
托名↔託名;
托收↔託收;
信托↔信託;
@@ -1061,14 +1190,18 @@ $SCDigit { 出 } 戏 → 齣;
托↔托;
托←託;
讬→託;
+#
涌↔湧;
涌←涌;
+#
累↔累;
累←纍;
+#
困惫↔睏憊;
困乏↔睏乏;
困↔困;
困←睏;
+#
左邻右舍↔左鄰右舍;
舍利↔舍利;
舍弟↔舍弟;
@@ -1084,42 +1217,53 @@ $SCDigit { 出 } 戏 → 齣;
猪舍↔豬舍;
舍↔捨;
舍←舍;
+#
杠↔槓;
杠←杠;
+#
雇员↔僱員;
雇↔雇;
雇←僱;
+#
刮倒↔颳倒;
刮↔刮;
刮←颳;
+#
狸↔狸;
狸←貍;
+#
跌交↔跌跤;
交↔交;
交←跤;
+#
侄媳妇↔姪媳婦;
侄女↔姪女;
侄孙↔姪孫;
侄↔侄;
侄←姪;
+#
勋↔勳;
勋←勛;
+#
秋千↔鞦韆;
荡秋千↔盪鞦韆;
荡↔蕩;
荡←盪;
秋↔秋;
+#
不寒而栗↔不寒而慄;
颤栗↔顫慄;
战栗↔戰慄;
栗↔栗;
栗←慄;
+#
细嚼慢咽↔細嚼慢嚥;
狼吞虎咽↔狼吞虎嚥;
咽气↔嚥氣;
下咽↔下嚥;
咽↔咽;
咽←嚥;
+#
吊民伐罪↔弔民伐罪;
形影相吊↔形影相弔;
提心吊胆↔提心弔膽;
@@ -1128,32 +1272,43 @@ $SCDigit { 出 } 戏 → 齣;
吊唁↔弔唁;
吊↔吊;
吊←弔;
+#
英寸↔英吋;
+#
方腊↔方腊;
腊↔臘;
+#
乡愿↔鄉愿;
愿↔願;
愿←愿;
+#
古迹↔古蹟;
史迹↔史蹟;
迹↔跡;
迹←蹟;
+#
净↔淨;
净←凈;
+#
侥幸↔僥倖;
侥↔僥;
幸↔幸;
幸←倖;
+#
蚝↔蠔;
蚝←蚝;
+#
柜柳↔柜柳; # ju3liu3
柜↔櫃; # gui4
+#
拉纤↔拉縴;
纤夫↔縴夫;
纤路↔縴路;
纤绳↔縴繩;
纤↔纖; # reading xian1
纤←縴; # reading qian4
+#
+# separate readings for po1 or po4 from pu2
厚朴↔厚朴;
朴刀↔朴刀; # po1dao1
朴硝↔朴硝; # po4xiao1
@@ -1533,6 +1688,9 @@ $SCDigit { 出 } 戏 → 齣;
镌↔鐫;
镌←鎸;
于↔於;
+#
+# one-to-one mappings
+#
亘↔亙;
铝↔鋁;
极↔極;
@@ -1611,6 +1769,7 @@ $SCDigit { 出 } 戏 → 齣;
㑩↔儸;
傩↔儺;
俨↔儼;
+# Preserve 丰 for traditional in some cases
丰标不凡→丰標不凡;
丰}[度情茸姿神采]→丰;
丰仪→丰儀;
@@ -3985,5 +4144,7 @@ $SCDigit { 出 } 戏 → 齣;
龚↔龔;
龛↔龕;
龟↔龜;
+# map some punctuation too
“↔「;
”↔」;
+
« no previous file with comments | « source/data/translit/Hani_Latn.txt ('k') | source/data/translit/Hebr_Latn.txt » ('j') | no next file with comments »

Powered by Google App Engine
This is Rietveld 408576698