Index: source/data/translit/Hans_Hant.txt |
diff --git a/source/data/translit/Simplified_Traditional.txt b/source/data/translit/Hans_Hant.txt |
similarity index 97% |
rename from source/data/translit/Simplified_Traditional.txt |
rename to source/data/translit/Hans_Hant.txt |
index 88f1039c86564f14482d059a6082f7f662af2959..acb0dbdc598d4338163bc3c92f4e0da5381944c3 100644 |
--- a/source/data/translit/Simplified_Traditional.txt |
+++ b/source/data/translit/Hans_Hant.txt |
@@ -1,25 +1,35 @@ |
-# *************************************************************************** |
-# * |
-# * Copyright (C) 2004-2015, International Business Machines |
-# * Corporation; Unicode, Inc.; and others. All Rights Reserved. |
-# * |
-# *************************************************************************** |
-# File: Simplified_Traditional.txt |
-# Generated from CLDR |
+# © 2016 and later: Unicode, Inc. and others. |
+# License & terms of use: http://www.unicode.org/copyright.html#License |
# |
+# File: Hans_Hant.txt |
+# Generated from CLDR |
+# |
+ |
+# Copyright (c) 2005-2007,2010 Apple Inc., Unicode Inc., |
+# and others. All Rights Reserved. |
+# For terms of use, see http://unicode.org/copyright.html#Exhibit1 |
+# Convert between simplified and traditional Chinese |
+# UTRANS_FORWARD is from simplified to traditional |
$SCDigit = [零一二三四五六七八九十百千万亿两] ; |
$TCDigit = [零一二三四五六七八九十百千萬億兩] ; |
+# |
+# complex mappings for which there is no easy solution |
+# so we arbitrarily pick one |
+# |
+# does not handle the surnames 于 or 於 |
于飞↔于飛; |
于归↔于歸; |
于思↔于思; |
单于↔單于; |
鲜于↔鮮于; |
+# |
姜片↔薑片; |
姜末↔薑末; |
生姜↔生薑; |
鬼子姜↔鬼子薑; |
姜↔姜; |
姜←薑; |
+# |
赤皮仑↔赤皮崙; |
金仑溪↔金崙溪; |
下仑↔下崙; |
@@ -33,6 +43,10 @@ $TCDigit = [零一二三四五六七八九十百千萬億兩] ; |
仑↔侖; |
曲↔曲; |
曲←麯; |
+# |
+# Multiliple TC to SC |
+# |
+# |
茶余饭后↔茶餘飯後; |
余怒未消↔餘怒未消; |
余音绕梁↔餘音繞梁; |
@@ -69,22 +83,27 @@ $SCDigit { 余 → 餘; |
余↔余; |
馀→餘; |
余←餘; |
+# |
什么↔甚麼; |
么↔麼; |
么←麽; |
么←么; |
+# |
复数↔複數; |
复分数↔複分數; |
复杂↔複雜; |
复制↔複製; |
复↔復; |
复←複; |
+# |
+# |
了然↔瞭然; |
了解↔瞭解; |
了望↔瞭望; |
明了↔明瞭; |
了↔了; |
了←瞭; |
+# |
解铃系铃↔解鈴繫鈴; |
系词↔繫詞; |
系辞↔繫辭; |
@@ -97,6 +116,7 @@ $SCDigit { 余 → 餘; |
系↔系; |
系←係; |
系←繫; |
+# |
糊里糊涂↔糊裡糊塗; |
稀里糊涂↔稀裡糊塗; |
蒙在鼓里↔蒙在鼓裡; |
@@ -193,6 +213,10 @@ $SCDigit { 海里 → 海里; |
里外↔裡外; |
里←裡; |
里←裏; |
+# |
+# 乾 appears in the most compounds |
+# 幹 is next |
+# then 干 |
干什么↔幹甚麼; |
干部↔幹部; |
干才↔幹才; |
@@ -234,6 +258,7 @@ $SCDigit { 海里 → 海里; |
干↔乾; |
干←幹; |
干←干; |
+# |
划时代↔劃時代; |
划分↔劃分; |
划分←畫分; |
@@ -269,6 +294,7 @@ $SCDigit { 海里 → 海里; |
划↔划; |
划←劃; |
画↔畫; |
+# |
$SCDigit { 斗 → 斗; |
斗量↔斗量; |
斗胆↔斗胆; |
@@ -289,6 +315,7 @@ $SCDigit { 斗 → 斗; |
斗←斗; |
斗←闘; |
斗←鬭; |
+# |
周 } $SCDigit → 週; |
周末↔週末; |
周刊↔週刊; |
@@ -300,6 +327,8 @@ $SCDigit { 斗 → 斗; |
本周↔本週; |
周↔周; |
周←週; |
+# |
+# |
松球↔松毬; |
球花↔毬花; |
球果↔毬果; |
@@ -316,11 +345,13 @@ $SCDigit { 斗 → 斗; |
肉松↔肉鬆; |
松↔松; |
松←鬆; |
+# |
果↔果; |
果←菓; |
老板↔老闆; |
板↔板; |
板←闆; |
+# |
面条↔麵條; |
面粉↔麵粉; |
面包↔麵包; |
@@ -343,14 +374,17 @@ $SCDigit { 斗 → 斗; |
白面↔白麵; |
面↔面; |
面←麵; |
+# |
防御↔防禦; |
御敌↔禦敵; |
御寒↔禦寒; |
御↔御; |
御←禦; |
+# |
腼腆↔靦腆; |
腼←靦; |
䩄→靦; |
+# |
宫商角徵羽↔宮商角徵羽; |
征伐↔征伐; |
征服↔征服; |
@@ -361,18 +395,21 @@ $SCDigit { 斗 → 斗; |
亲征↔親征; |
征↔徵; |
征←征; |
+# |
台风↔颱風; |
写字台↔寫字檯; |
台↔台; |
台←颱; |
台←臺; |
台←檯; |
+# |
胡同↔衚衕; |
胡子↔鬍子; |
胡须↔鬍鬚; |
胡↔胡; |
胡←鬍; |
胡←衚; |
+# |
须根↔鬚根; |
须鲸↔鬚鯨; |
须眉↔鬚眉; |
@@ -380,6 +417,7 @@ $SCDigit { 斗 → 斗; |
触须↔觸鬚; |
须↔須; |
须←鬚; |
+# |
$SCDigit { 只 → 隻; |
形单影只↔形單影隻; |
只贺新禧←祇賀新禧; |
@@ -396,6 +434,7 @@ $SCDigit { 只 → 隻; |
祇↔祇; |
只↔只; |
只←隻; |
+# |
并发↔併發; |
并拢↔併攏; |
并入↔併入; |
@@ -405,10 +444,13 @@ $SCDigit { 只 → 隻; |
吞并↔吞併; |
并↔並; |
并←併; |
+# |
当↔當; |
当←噹; |
+# |
药↔藥; |
药←葯; |
+# |
布道↔佈道; |
布景↔佈景; |
布局↔佈局; |
@@ -421,12 +463,14 @@ $SCDigit { 只 → 隻; |
宣布↔宣佈; |
布↔布; |
布←佈; |
+# |
开天辟地↔開天闢地; |
开辟↔開闢; |
辟邪↔闢邪; |
辟↔辟; |
辟←闢; |
人言藉藉↔人言藉藉; |
+# |
借口↔藉口; |
借故↔藉故; |
借使↔藉使; |
@@ -439,20 +483,25 @@ $SCDigit { 只 → 隻; |
借↔借; |
借←藉; |
藉→藉; |
+# |
尽管↔儘管; |
尽↔盡; |
尽←儘; |
+# |
叶韵↔叶韻; |
叶↔葉; |
叶←叶; |
+# |
伙计↔夥計; |
伙伴↔夥伴; |
伙↔伙; |
伙←夥; |
+# |
家具↔傢具; |
家伙↔傢伙; |
家↔家; |
家←傢; |
+# |
奸夫↔姦夫; |
奸妇↔姦婦; |
奸情↔姦情; |
@@ -465,6 +514,7 @@ $SCDigit { 只 → 隻; |
诱奸↔誘姦; |
奸↔奸; |
奸←姦; |
+# |
历书↔曆書; |
历法↔曆法; |
公历↔公曆; |
@@ -483,18 +533,22 @@ $SCDigit { 只 → 隻; |
万历↔萬曆; |
历↔歷; |
历←曆; |
+# |
万俟↔万俟; # surname |
+# |
气冲冲↔氣沖沖; |
气焰↔氣燄; |
焰←燄; |
气↔氣; |
气←气; |
+# |
细致↔細緻; |
精致↔精緻; |
标致↔標緻; |
别致↔別緻; |
致↔致; |
致←緻; |
+# |
制版↔製版; |
制成↔製成; |
制品↔製品; |
@@ -511,6 +565,7 @@ $SCDigit { 只 → 隻; |
预制↔預製; |
制↔制; |
制←製; |
+# |
谷贱伤农↔穀賤傷農; |
谷神星↔穀神星; |
鬼谷子↔鬼谷子; |
@@ -535,6 +590,7 @@ $SCDigit { 只 → 隻; |
谷↔谷; |
谷←穀; |
谷←榖; |
+# |
后妃↔后妃; |
后稷↔后稷; |
后土↔后土; |
@@ -545,6 +601,7 @@ $SCDigit { 只 → 隻; |
太后↔太后; |
后↔後; |
后←后; |
+# |
地方志↔地方誌; |
标志↔標誌; |
墓志↔墓誌; |
@@ -554,19 +611,24 @@ $SCDigit { 只 → 隻; |
杂志↔雜誌; |
志↔志; |
志←誌; |
+# |
别扭↔彆扭; |
别↔別; |
别←彆; |
+# |
汇报↔彙報; |
词汇↔詞彙; |
字汇↔字彙; |
汇↔匯; |
汇←彙; |
+# |
辞↔辭; |
辞←辞; |
词↔詞; |
+# |
机↔機; |
机←机; |
+# |
发廊↔髮廊; |
发妻↔髮妻; |
发型↔髮型; |
@@ -631,11 +693,13 @@ $SCDigit { 只 → 隻; |
发↔發; |
发←髮; |
卷←捲; |
+# |
人云亦云↔人云亦云; |
不知所云↔不知所云; |
云游↔雲遊; |
云↔雲; |
云←云; |
+# |
子丑寅卯↔子丑寅卯; |
生旦淨末丑↔生旦净末丑; |
丑时↔丑時; |
@@ -644,9 +708,11 @@ $SCDigit { 只 → 隻; |
小丑↔小丑; |
丑↔醜; |
丑←丑; |
+# |
萝卜↔蘿蔔; |
卜↔卜; |
卜←蔔; |
+# |
冲茶↔沖茶; |
冲淡↔沖淡; |
冲服↔沖服; |
@@ -660,16 +726,20 @@ $SCDigit { 只 → 隻; |
冲↔衝; |
冲←沖; |
冲←冲; |
+# |
$SCDigit { 出 } 戏 → 齣; |
出游↔出遊; |
出↔出; |
出←齣; |
+# |
线↔線; |
线←綫; |
+# |
核实↔覈實; |
核算↔覈算; |
核↔核; |
核←覈; |
+# |
回路↔迴路; |
回廊↔迴廊; |
回游↔回遊; |
@@ -678,12 +748,15 @@ $SCDigit { 出 } 戏 → 齣; |
回↔回; |
回←迴; |
回←廻; |
+# |
冬冬↔鼕鼕; |
冬↔冬; |
冬←鼕; |
+# |
咸菜↔鹹菜; |
咸↔咸; |
咸←鹹; |
+# |
清心寡欲↔清心寡慾; |
克欲修行↔克慾修行; |
欲不可纵↔慾不可縱; |
@@ -705,6 +778,7 @@ $SCDigit { 出 } 戏 → 齣; |
嗜欲↔嗜慾; |
欲↔欲; |
欲←慾; |
+# |
准绳↔準繩; |
准时↔準時; |
准头↔準頭; |
@@ -719,6 +793,7 @@ $SCDigit { 出 } 戏 → 齣; |
准↔准; |
准←準; |
标↔標; |
+# |
注册↔註冊; |
注销↔註銷; |
注解↔註解; |
@@ -728,6 +803,9 @@ $SCDigit { 出 } 戏 → 齣; |
加注↔加註; |
注↔注; |
注←註; |
+# |
+# variants |
+# |
凶暴↔兇暴; |
凶器↔兇器; |
凶手↔兇手; |
@@ -736,23 +814,32 @@ $SCDigit { 出 } 戏 → 齣; |
逞凶↔逞兇; |
凶↔凶; |
凶←兇; |
+# |
扬↔揚; |
扬←䬗; |
飏↔颺; |
+# |
宴↔宴; |
宴←醼; |
䜩↔讌; |
+# |
咬↔咬; |
咬←齩; |
咬←䶧; |
+# |
豆↔豆; |
豆←荳; |
+# |
韭↔韭; |
韭←韮; |
+# |
+# |
笺↔箋; |
笺←牋; |
+# |
团↔團; |
团←糰; |
+# |
卤鸡↔滷雞; |
卤味↔滷味; |
卤菜↔滷菜; |
@@ -760,36 +847,50 @@ $SCDigit { 出 } 戏 → 齣; |
盐卤↔鹽滷; |
卤↔鹵; |
卤←滷; |
+# |
呆↔呆; |
呆←獃; |
+# |
泛↔泛; |
泛←氾; |
泛←汎; |
+# |
妫↔媯; |
妫←嬀; |
+# |
众↔眾; |
众←衆; |
+# |
钩↔鈎; |
钩←鉤; |
+# |
绱↔緔; |
绱←鞝; |
+# |
锐↔銳; |
锐←鋭; |
+# |
赝↔贋; |
赝←贗; |
赃↔贓; |
赃←贜; |
+# |
粗↔粗; |
粗←麤; |
+# |
关↔關; |
关←関; |
+# |
饥↔飢; |
饥←饑; |
+# |
款↔款; |
款←欵; |
胧↔朧; |
+# |
蒙↔蒙; |
蒙←懞; |
+# |
骂↔罵; |
骂←駡; |
脏↔臟; |
@@ -819,18 +920,24 @@ $SCDigit { 出 } 戏 → 齣; |
炮↔炮; |
炮←砲; |
炮←礮; |
+# |
启↔啓; |
启←啟; |
+# |
茶几↔茶几; |
几↔幾; |
几←几; |
+# |
德↔德; |
德←悳; |
+# |
悫↔愨; |
悫←慤; |
+# |
克↔克; |
克←剋; |
克←尅; |
+# |
坛坛罐罐↔罈罈罐罐; |
瓶瓶坛坛↔瓶瓶罈罈; |
醋坛↔醋罈; |
@@ -840,6 +947,7 @@ $SCDigit { 出 } 戏 → 齣; |
坛←壜; |
坛←罎; |
坛←罈; |
+# |
升华↔昇華; |
毕升↔畢昇; |
高升↔高昇; |
@@ -847,19 +955,26 @@ $SCDigit { 出 } 戏 → 齣; |
升↔升; |
升←昇; |
升←陞; |
+# |
伪↔偽; |
伪←僞; |
+# |
收获→收穫; |
获↔獲; |
获←穫; |
+# |
绦↔縧; |
绦←絛; |
+# |
绣↔繡; |
绣←綉; |
+# |
钵↔鉢; |
钵←缽; |
+# |
蜡↔蠟; |
蜡←蜡; |
+# |
采薪之忧↔采薪之憂; |
兴高采烈↔興高采烈; |
无精打采↔無精打采; |
@@ -875,6 +990,7 @@ $SCDigit { 出 } 戏 → 齣; |
䌽→綵; |
采↔採; |
采←埰; |
+# |
厕↔廁; |
厕←厠; |
捣↔搗; |
@@ -899,8 +1015,10 @@ $SCDigit { 出 } 戏 → 齣; |
凼←氹; |
床↔床; |
床←牀; |
+# first form is more common |
墙↔牆; |
墙←墻; |
+# |
奖↔獎; |
奖←奬; |
眦↔眥; |
@@ -927,8 +1045,10 @@ $SCDigit { 出 } 戏 → 齣; |
酝←醞; |
录↔錄; |
录←録; |
+# 鏽 is more common |
锈↔鏽; |
锈←銹; |
+# |
镢↔鐝; |
䦆←钁; |
阅↔閱; |
@@ -939,6 +1059,7 @@ $SCDigit { 出 } 戏 → 齣; |
闲居↔閑居; |
闲↔閒; |
闲←閑; |
+# |
游山玩水↔遊山玩水; |
游伴↔遊伴; |
游程↔遊程; |
@@ -998,6 +1119,7 @@ $SCDigit { 出 } 戏 → 齣; |
夜游↔夜遊; |
游↔游; |
游←遊; |
+# |
表蒙子↔錶蒙子; |
表带↔錶帶; |
表链↔錶鏈; |
@@ -1018,11 +1140,14 @@ $SCDigit { 出 } 戏 → 齣; |
停表↔停錶; |
表↔表; |
表←錶; |
+# |
症结↔癥結; |
症↔症; |
症←癥; |
+# |
痴↔痴; |
痴←癡; |
+# |
白洋淀↔白洋淀; |
荷花淀↔荷花淀; |
水淀↔水淀; |
@@ -1030,22 +1155,26 @@ $SCDigit { 出 } 戏 → 齣; |
东淀↔東淀; |
淀↔澱; |
淀←淀; |
+# |
向导↔嚮導; |
响应←嚮應; |
向往↔嚮往; |
向↔向; |
向←嚮; |
向←曏; |
+# |
扎营↔紮營; |
驻扎↔駐紮; |
扎↔扎; |
扎←紮; |
+# |
占卜↔占卜; |
占卦↔占卦; |
占梦↔占夢; |
占星↔占星; |
占↔佔; |
占←占; |
+# |
托名↔託名; |
托收↔託收; |
信托↔信託; |
@@ -1061,14 +1190,18 @@ $SCDigit { 出 } 戏 → 齣; |
托↔托; |
托←託; |
讬→託; |
+# |
涌↔湧; |
涌←涌; |
+# |
累↔累; |
累←纍; |
+# |
困惫↔睏憊; |
困乏↔睏乏; |
困↔困; |
困←睏; |
+# |
左邻右舍↔左鄰右舍; |
舍利↔舍利; |
舍弟↔舍弟; |
@@ -1084,42 +1217,53 @@ $SCDigit { 出 } 戏 → 齣; |
猪舍↔豬舍; |
舍↔捨; |
舍←舍; |
+# |
杠↔槓; |
杠←杠; |
+# |
雇员↔僱員; |
雇↔雇; |
雇←僱; |
+# |
刮倒↔颳倒; |
刮↔刮; |
刮←颳; |
+# |
狸↔狸; |
狸←貍; |
+# |
跌交↔跌跤; |
交↔交; |
交←跤; |
+# |
侄媳妇↔姪媳婦; |
侄女↔姪女; |
侄孙↔姪孫; |
侄↔侄; |
侄←姪; |
+# |
勋↔勳; |
勋←勛; |
+# |
秋千↔鞦韆; |
荡秋千↔盪鞦韆; |
荡↔蕩; |
荡←盪; |
秋↔秋; |
+# |
不寒而栗↔不寒而慄; |
颤栗↔顫慄; |
战栗↔戰慄; |
栗↔栗; |
栗←慄; |
+# |
细嚼慢咽↔細嚼慢嚥; |
狼吞虎咽↔狼吞虎嚥; |
咽气↔嚥氣; |
下咽↔下嚥; |
咽↔咽; |
咽←嚥; |
+# |
吊民伐罪↔弔民伐罪; |
形影相吊↔形影相弔; |
提心吊胆↔提心弔膽; |
@@ -1128,32 +1272,43 @@ $SCDigit { 出 } 戏 → 齣; |
吊唁↔弔唁; |
吊↔吊; |
吊←弔; |
+# |
英寸↔英吋; |
+# |
方腊↔方腊; |
腊↔臘; |
+# |
乡愿↔鄉愿; |
愿↔願; |
愿←愿; |
+# |
古迹↔古蹟; |
史迹↔史蹟; |
迹↔跡; |
迹←蹟; |
+# |
净↔淨; |
净←凈; |
+# |
侥幸↔僥倖; |
侥↔僥; |
幸↔幸; |
幸←倖; |
+# |
蚝↔蠔; |
蚝←蚝; |
+# |
柜柳↔柜柳; # ju3liu3 |
柜↔櫃; # gui4 |
+# |
拉纤↔拉縴; |
纤夫↔縴夫; |
纤路↔縴路; |
纤绳↔縴繩; |
纤↔纖; # reading xian1 |
纤←縴; # reading qian4 |
+# |
+# separate readings for po1 or po4 from pu2 |
厚朴↔厚朴; |
朴刀↔朴刀; # po1dao1 |
朴硝↔朴硝; # po4xiao1 |
@@ -1533,6 +1688,9 @@ $SCDigit { 出 } 戏 → 齣; |
镌↔鐫; |
镌←鎸; |
于↔於; |
+# |
+# one-to-one mappings |
+# |
亘↔亙; |
铝↔鋁; |
极↔極; |
@@ -1611,6 +1769,7 @@ $SCDigit { 出 } 戏 → 齣; |
㑩↔儸; |
傩↔儺; |
俨↔儼; |
+# Preserve 丰 for traditional in some cases |
丰标不凡→丰標不凡; |
丰}[度情茸姿神采]→丰; |
丰仪→丰儀; |
@@ -3985,5 +4144,7 @@ $SCDigit { 出 } 戏 → 齣; |
龚↔龔; |
龛↔龕; |
龟↔龜; |
+# map some punctuation too |
“↔「; |
”↔」; |
+ |