マイクロソフト用語集から英和辞書データを作成する

スポンサーリンク

マイクロソフトでは日英対訳の用語集を公開しています。
登録語数は17000語ほどで、balance sheet account(貸借対照表勘定)やlocation services(位置情報サービス)といった用語が登録されています。
但し、この用語集は Term Base eXchange (TBX) 形式という、XMLベースの記述になっています。

この TBX形式のファイルをタブ区切りのテキストファイルに変換するperlスクリプトを作成しました。

下記ページから、日本語を選択してマイクロソフト用語集をダウンロードして下さい。
ダウンロードされるファイル名は MicrosoftTermCollection です。
用語集をダウンロード - マイクロソフト | ランゲージ ポータル

下記から convertMTC.pl をダウンロードして下さい。
https://skydrive.live.com/redir?resid=D54242E7C106EE41!109&authkey=!ADAU2LZfl2LIiWw

MicrosoftTermCollectionファイルと convertMTC.pl を同じ場所に置き、convertMTC.pl を実行してください。

perl convertMTC.pl

MicrosoftTermCollection.tsv が作成されます。
英語名と日本語名をタブで区切った UTF-8 のテキストファイルです。

このファイルはFirefox用英和辞書アドオン lookupper を登録しました で紹介している拙作のアドオンでの辞書ファイルとしての利用も可能です。

なお、Windowsで Perlスクリプトを動作させる場合は、ActivePerl を下記から取得して下さい。
ActivePerl は Windows上で動作するPerlです。
ActivePerl – 窓の杜ライブラリ

コメント

  1. やす より:

    はじめまして。
    convertMTC.pl は公開終了してしまいましたか?
    上記URL(現OneDrive)では「アイテムが存在しない」となるようです。
    できれば使わせて頂けるとありがたいです。
    よろしくお願い致します。

  2. パソコン鳥 パソコン鳥 より:

    いえ、今も公開中ですよ。
    確認しましたがダウンロード出来ます。
    もう一度やってみてください。

  3. やす より:

    ご確認ありがとうございます。
    結果的にダウンロードできました。
    Googleでヒットしたのがモバイル向けページ
    http://m.webry.info/at/vogel/201307/article_15.htm
    だったのですが、
    上記ページからPC(Win8.1,IE11)で convertMTC.pl へのリンクを辿ると、
    表示される「以下のページにアクセスしようとしています」のページで、
    convertMTC.pl のURLに含まれる「&」が「&」に置き換わってしまい、
    本来のURLにアクセスできていませんでした。
    モバイル向けでないページからは convertMTC.pl に直接アクセスできました。
    お騒がせしてすみませんでした。
    ありがたく使わせて頂きます。

タイトルとURLをコピーしました