正規表現実用講座11

例12.当庵では多言語全体のデータベースの分類化が進み、全分野に及んでいます。またデータの精度も飛躍的に高まっています。
その中からサンプルとして13万件以上の英語ー中国語の金属関係専門用語を加工してみましょう。
今回はそのなかから約5千件を使ってXMLファイルを作成します。
データは3区分されています。
<英語> /// <中国語> : <中国語発音>
今回は親が英語ー中国語字典→ECs
子が英語ー中国語/専門用語→ECsPro
孫が英語ー中国語/専門用語/金属→ECSProMet
孫の中に英語データ→EMet
中国語データ→CsMet
中国語ピンイン発音データ→CsMetPy
を入れ子にしましょう。



[データベース]英語ー中国語ー中国語発音記号付データ(抜粋)

1 mass% solution standard  /// 质量1%溶液标准  : zhi4 liang4 1 % rong2 ye4 biao1 zhun3 

2-hydroxy 4-sec·octyl benzophenone oxime  /// 2-羟基4-仲辛基-二苯甲酮肟  : 2 - qiang3 ji1 4 - zhong4 xin1 ji1 - er4 ben3 jia3 tong2 wo4 

2-hydroxy 5-nonyl acetophenone oxime  /// 2-羟基5-壬基-苯乙酮肟  : 2 - qiang3 ji1 5 - ren2 ji1 - ben3 yi3 tong2 wo4 

2-hydroxy 5-sec·octyl benzophenone oxime  /// 2-羟基5-仲辛基-二苯甲酮肟  : 2 - qiang3 ji1 5 - zhong4 xin1 ji1 - er4 ben3 jia3 tong2 wo4 

5-nonyl salicyl aldooxime  /// 5-壬基水杨醛肟  : 5 - ren2 ji1 shui3 yang2 quan2 wo4 

abandoned deposit mining  /// 报废矿床开采  : bao4 fei4 kuang4 chuang2 kai1 cai3 

abnormal structure  /// 反常组织  : fan3 chang2 zu3 zhi1 

abrasion resistance  /// 耐磨损性  : nai4 mo2 sun3 xing4 

abrasion-resistant steel  /// 耐磨钢  : nai4 mo2 gang1 

abrasive corrosion  /// 磨耗腐蚀  : mo2 hao4 fu3 shi2 

absolute entropy  /// 绝对熵  : jue2 dui4 shang1 

absolute error  /// 绝对误差  : jue2 dui4 wu4 cha4 

absolute rate theory  /// 绝对反应速率理论  : jue2 dui4 fan3 ying1 su4 lü4 li3 lun4 

absorption  /// 吸收  : xi1 shou1 

abutment stress  /// 支承应力  : zhi1 cheng2 ying1 li4 

accelerated melting by coal-oxygen burner  /// 氧煤助熔  : yang3 mei2 zhu4 rong2 

accelerating creep  /// 加速蠕变  : jia1 su4 ru2 bian4 

acceptor charge  /// 被爆药  : bei4 bao4 yao4 

accident of cage crashing  /// 坠罐事故  : zhui4 guan4 shi4 gu4 

accidental error  /// 偶然误差  : ou3 ran2 wu4 cha4 

accretion  /// 炉结  : lu2 jie2 

accuracy  /// 准确度  : zhun3 que4 du4 

acicular structure  /// 针状组织  : zhen1 zhuang4 zu3 zhi1 

acid leaching  /// 酸浸  : suan1 jin4 

acid open-hearth furnace  /// 酸性平炉  : suan1 xing4 ping2 lu2 

acid oxide  /// 酸性氧化物  : suan1 xing4 yang3 hua4 wu4 

acid refractory [material]  /// 酸性耐火材料  : suan1 xing4 nai4 huo3 cai2 liao4 

acid slag  /// 酸性渣  : suan1 xing4 zha1 

acoustic emission monitoring  /// 声发射监测  : sheng1 fa1 she4 jian1 ce4 

activated sintering  /// 活化烧结  : huo2 hua4 shao1 jie2 

activation  /// 活化  : huo2 hua4 

activation energy  /// 活化能  : huo2 hua4 neng2 

activator  /// 活化剂  : huo2 hua4 ji4 

active silica  /// 活性氧化硅  : huo2 xing4 yang3 hua4 gui1 

active-passive cell  /// 活态-钝态电池  : huo2 tai4 - dun4 tai4 dian4 chi2 

activity  /// 活度  : huo2 du4 

activity coefficient  /// 活度系数  : huo2 du4 xi4 shu4 

adaptive control  /// 自适应控制  : zi4 shi4 ying1 kong4 zhi4 

addition reagent  /// 添加剂  : tian1 jia1 ji4 

additional stress, secondary stress  /// 附加应力  : fu4 jia1 ying1 li4 

additive  /// 添加物  : tian1 jia1 wu4 

adiabatic process  /// 绝热过程  : jue2 re4 guo4 cheng2 

adit  /// 平窿  : ping2 long2 

adit development system  /// 平硐开拓  : ping2 dong4 kai1 tuo4 

adjustable mold  /// 调宽结晶器  : tiao2 kuan1 jie2 jing1 qi4 

adobe blasting  /// 裸露爆破  : luo3 lu4 bao4 po4 

adsorbed substance  /// 吸附质  : xi1 fu4 zhi4 

adsorbent  /// 吸附剂  : xi1 fu4 ji4 

adsorption  /// 吸附  : xi1 fu4 

adsorption isotherm  /// 吸附等温式  : xi1 fu4 deng3 wen1 shi4 

advance mining  /// 前进式开采  : qian2 jin4 shi4 kai1 cai3 

aeration  /// 充气  : chong1 qi4 

aerator  /// 充气器  : chong1 qi4 qi4 

aerial tramway  /// 架空索道  : jia4 kong1 suo3 dao4 

aerofall mill  /// 气落式自磨机  : qi4 luo4 shi4 zi4 mo2 ji1 

aerosol flotation  /// 气溶胶浮选  : qi4 rong2 jiao1 fu2 xuan3 

after blow  /// 后吹  : hou4 chui1 

agglomeration  /// 团聚  : tuan2 ju4 

aging  /// 时效  : shi2 xiao4 

aim carbon  /// 目标碳  : mu4 biao1 tan4 

air agitated precipitator  /// 空气搅拌分解槽  : kong1 qi4 jiao3 ban4 fen1 jie3 cao2 

air bottom-blown acid converter  /// 酸性空气底吹转炉 : suan1 xing4 kong1 qi4 di3 chui1 zhuan3 lu2 

air bottom-blown basic converter  /// 碱性空气底吹转炉 : jian3 xing4 kong1 qi4 di3 chui1 zhuan3 lu2 

air brattice  /// 风障  : feng1 zhang4 

air bridge  /// 风桥  : feng1 qiao2 

air classifier  /// 风力分级机  : feng1 li4 fen1 ji2 ji1 

air compressor  /// 空气压缩机  : kong1 qi4 ya1 suo1 ji1 

air deflector  /// 导风板  : dao3 feng1 ban3 

air distribution  /// 风量分配  : feng1 liang4 fen1 pei4 

air door  /// 风门  : feng1 men2 

air duct  /// 风筒  : feng1 tong3 

air gap  /// 空气隙  : kong1 qi4 xi4 

air jig, pneumatic jig  /// 风动跳汰机  : feng1 dong4 tiao4 tai4 ji1 

air knife  /// 气刀  : qi4 dao1 

air leakage coefficient  /// 漏风系数  : lou4 feng1 xi4 shu4 

air leg  /// 气腿  : qi4 tui3 

air lift mining-vessel  /// 气升式采矿船  : qi4 sheng1 shi4 cai3 kuang4 chuan2 

air mist spray cooling  /// 气水喷雾冷却  : qi4 shui3 pen1 wu4 leng3 que4 

air pick  /// 风镐  : feng1 gao3 

air quantity  /// 风量  : feng1 liang4 

air seal  /// 气封  : qi4 feng1 

air stopping  /// 风墙  : feng1 qiang2 

air table, pneumatic table  /// 风力摇床  : feng1 li4 yao2 chuang2 

air velocity measuring station  /// 测风站  : ce4 feng1 zhan4 

air window  /// 风窗  : feng1 chuang1 

air-leg drill  /// 气腿凿岩机  : qi4 tui3 zao2 yan2 ji1 

air-lift pump  /// 气升泵  : qi4 sheng1 beng4 

air-sucking mechanical pump  /// 机械抽气泵  : ji1 xie4 chou1 qi4 beng4 

air-sucking water ejector  /// 抽气水喷射器  : chou1 qi4 shui3 pen1 she4 qi4 

airflow  /// 风流  : feng1 liu2 

airflow frictional resistance  /// 风流摩擦阻力  : feng1 liu2 mo2 ca1 zu3 li4 

airflow pressure  /// 通风压力  : tong1 feng1 ya1 li4 

airflow regulating  /// 风量调节  : feng1 liang4 tiao2 jie2 

airflow velocity for eliminating dust  /// 排尘风速  : pai2 chen2 feng1 su4 

akermanite  /// 镁黄长石  : mei3 huang2 chang2 shi2 

Al2O3-SiC-C brick  /// 氧化铝-碳化硅-炭砖  : yang3 hua4 lü3 - tan4 hua4 gui1 - tan4 zhuan1 

alkaline leaching  /// 碱浸  : jian3 jin4 

allanite  /// 褐帘石  : he4 lian2 shi2 

alloy steel plate  /// 合金钢板  : he2 jin1 gang1 ban3 

alloys for thermocouple  /// 热电偶合金  : re4 dian4 ou3 he2 jin1 

<以下略>




プログラム

s/^\(.*\) /// \(.*\) : \(.*\)/<ECsPro>\n<ECsProMet>\n<EMet>\1</EMet>\n<CsMet>\2</CsMet><CsMetPy>\3</CsMetPy>\n</ECsProMet>\n</ECsPro>/

s/^/<?xml version="1.0" encoding="utf-8" ?>\n\n<ECs/ 

s/$/</ECs>/



[結果]英語ー中国語ー中国語発音のXMLファイル
XMLファイルはわずか5千件のデータでも画面表示に
かなりの時間を費やしますので根気強く待ちましょう。