正規表現実用講座

   コンピューターのプログラミングは日々の繰り返される定型業務のために大きな費用
  と試行錯誤を経て時間をかけてつくられるものです。 その一方、世の中には大量の
  データを処理するのにたった一度または数度の処理で完了する状況も存在します。
  この場合は簡易な一括処理がふさわしく、費用と時間をかけてコンピューターを使う
  意味がありません。 後者の処理のためにわざわざプログラミング言語を使い大きな
  コーディングを経て、処理が済んだらあとは、ほこりをかぶってしまうのではお金と
  時間の無駄使いになるでしょう。 特に研究、開発の分野では結果を出そうとして
  ソフトウェア会社に発注してプログラム依存というのでは、厳しい競争社会の中で
  競合する分野では後れを取ってしまうことになりかねませんね。
   ソフトウェアを車に例えると車体とエンジンに分けられるでしょう。車体の部分は
  C言語、JAVAといったプログラミング言語になり、エンジンの核の部分は正規表現
  と言えるでしょう。 正規表現のアルゴリズムの出来次第で処理能力が決まると思われ
  ます。 ところで、このエンジンの核の部分は数学的センスがあればプログラミング
  の知識がなくても運用することができます。研究開発者が自らの手で正規表現を活用し
  簡単なデータ処理を施すことでコストと労力を倹約して大きな成果を上げることが期待
  できます。 おまじないのような文字と記号の数文字を組み合わせたプログラムをsedと
  いうツールを使って実行させると、メモリーの許す範囲内で、巨大なデータベースを
  自由自在に加工できるのです。私はこの方法でGigaDictという巨大な国際的辞書群を
  開発しました。これからは余生を利用して研究者、開発者、教授、学生、一般社会人を
  問わず、どなたにでも使い方の手助けをしたいと考えています。下記の辞書づくりの
  数例を見て役に立つと考えられたら、正規表現を自分の分野で活用してみませんか。
  可能性は無限ですよ。
Michio Takahama e-mail:takahama@gigadict.net

 実用講座1 メニュー抽出

 実用講座2 単語インデックス作成

 実用講座3 四字熟語抽出

 実用講座4 和英字書から四字熟語抽出

 実用講座5 葡和字書からポルトガル語動詞抽出

 実用講座6 英和葡字書から英語動詞抽出

 実用講座7 和伊字書からカタカナ語抽出

 実用講座8 和西医学字書から病名語抽出

 実用講座9 ラテン語聖書から人名、地名を抽出

 実用講座10 和仏字書から四字熟語抽出

 実用講座11 英中金属専門字書のXMLファイルを作成する




Copyright ©2006-2016 M.Takahama. All Rights Reserved.