フォト

My other photos


最近のトラックバック

ソフトの使いこなし

Glossary ConverterでTBXをUTX(Excel)に変換する

image

ISO標準の用語集形式であるTBXは広く使われています。今回は、Glossary Converterを使用してTBXをUTXに変換する手順をご紹介します。(Glossary Converterをインストールするには、SDL Trados Studioも必要です。)

  1. Glossary ConverterのsettingsでUTXを出力に設定する。
    image
  2. [Use the selected output format for any input format]のチェックをオンにする。
  3. TBXファイルをGlossary Converterにドロップする。
  4. (変換の初回時のみ)各項目にどのフィールド種別(Language、Index、Entry、Term)を割り当てるか訊かれる。各項目を右クリックして、すべての項目をTermに設定する。
  5. もう一度、訳語側のフィールド種別の割り当てでもすべての項目をTermに設定する。
  6. UTXファイルが作成される。

エラーが出た場合

  1. 上記設定画面で、[Use the selected output format for any input format]のチェックを外す。
  2. 手順を繰り返す。
  3. この場合、まずは用語ベース形式の*.sdltbファイルが作成される
  4. 作成された*.sdltbファイルをもう一度Glossary Converterにドロップする
  5. UTXファイルが作成される

手順3でフィールド種別の設定を間違えた場合、以下のファイルを編集して修正できます。
C:\Users\<user>\AppData\Local\SDL OpenExchange\GlossaryConverter\settings.xml

Glossary Converterでは、TBXをExcelに変換することもできますが、UTXに変換してからExcelにするほうが活用の幅が広がるのでお勧めです。

(2016/3/8追記) [Use the selected output format for any input format]の説明を変更しました。

UTX 1.20のベータ版仕様書が公開

utx1.20beta

用語集形式UTXの4年ぶりの新バージョン、UTX 1.20のベータ版仕様書が日本語と英語で公開されました。無料で使える用語集形式の標準規格UTXに沿って用語集を作ると、さまざまな翻訳ツールで活用できます。新しいUTX 1.20は、よりシンプルに作成でき、多言語多方向の用語集に対応しています。ベータ版仕様は2016/2/29まで公開され、その間、利用者の方の意見を募集します。多数のご意見をお待ちしております。

Glossary ConverterからUTX変換ツールにデータを渡す

Glossary Converterはすばらしいツールなのですが、変換結果のUTXファイルを公式UTX変換ツールで使うには、以下の2点を修正する必要があります。
■UTXのバージョン
×#UTX-S 0.91;
→○#UTX 1.11;

■作成日付の形式
×2015/10/23
→○2015-10-23T00:00:00+09:00

この他に、元データの項目などの問題点があるかは、公式UTX変換ツールのUTXファイル検証機能を使ってチェックできます。検証を実行すると、出力されるerrors.logに問題のある行が示されています。エラーがなければ、翻訳ソフト辞書などその他のファイル形式に変換できます。方法はUTX変換ツールのマニュアルにも詳しく書かれています。

http://utxconv.sourceforge.net/ja/#basic_usage

UTX-converter-verification

用語集形式UTXとはなにか

_DSC9147-2k

(用語集形式UTXとはなにか、UTXの基本的な利点を分かりやすくご説明します。)

用語集形式UTXとは、用語集(用語データ)を作るための一定の形式です。

ご存じのように、通訳・翻訳では多数の専門用語や固有名詞が出てきて、正しく訳す妨げとなります。用語のデータとしての形式を統一することにより、多人数の通訳者・翻訳者で共有・再利用がしやすくなります。特定分野でこのような用語集が日々、少しずつでも蓄積されると、用語調べの時間を節約でき、正確な用語で翻訳できるため、通訳・翻訳品質の向上に大きく役立ちます。

逆に言えば、用語集がいくつもあり、それぞれの形式がバラバラだと活用しにくくなり、せっかく作った用語集が埋もれてしまいます。

UTX用語集を使うと、たとえば、企業や自治体が、通訳者・翻訳者に「このような用語で訳してほしい」という要望を伝えることができます。また、逆に、通訳者・翻訳者が「このような用語で訳しました」という情報を集めて、用語集にすることもできます。さらに、「このようには訳さないでほしい」という情報も決まった形で管理することができます。このように、「一定の形で用語集を作る」ことを徹底することで、「何をどのように訳すか」を確実にやり取りできます。

「用語集は作るのが面倒」と敬遠されがちですが、UTXでは、作りやすい・管理しやすいシンプルさを徹底しているため、Excelで管理できる形式としています。

Tradosと統合された新しいMT、SDL Language Cloud

Tradosと統合された新しいMT、SDL Language Cloudではユーザー辞書が使えるようです。
https://languagecloud.sdl.com/translation-toolkit/subscription
上記画面右下の"Take our Machine Translation engines for a spin"で試すことができます。
Studio 2014の最新の自動更新をするとLanguage Cloudのウィザードとログイン画面が表示されます。

sdl-lang-cloud

ここではそのまま続行できず、先にSDLのサイトで既存のSDLアカウントをSDL Language Cloudにも登録する必要があります。SDL Language Cloudには、無料版と有料版があります。試してみて訳質の他、いろいろと気になる点はありますが、タグが保持されるのは評価できます。クラウド形式には、明らかに利点もありますが、機密性の点からは課題もあります。

ユーザー辞書は、用語ベースからTBXをエクスポートして、SDL Language Cloudにインポートするようになっています。ただ、実際には、人間用に作られた用語ベースは、MTにとって不要な項目や、活用変化など不適切な情報が含まれています。そのため、MT用の辞書として、エクスポートしてすぐにそのまま使えるとは限りません。むしろ、Excel形式でUTXを保存した「UTX on Excel形式」で管理・調整しておき、それを用語ベースやSDL Language Cloudにインポートするほうが使いやすいことがあります。

UTX Converter 0.1(UTX用語集形式の変換・検証ツール)を公開

アジア太平洋機械翻訳協会(AAMT)UTXチームが、UTX Converter 0.1(UTX変換・検証ツール)を公開しました。

utx-converter-validation-dialog

初期のバージョンなので基本的な機能のみですが、以下のことを行えます。

  • 用語集がUTX 1.11形式(タブ区切り)になっているかの検証
  • MultiTerm用語ベースにインポートするためのテキスト形式への変換
  • 禁止語リストの抽出

なお以前に紹介したGlossary Converterでは、UTXと用語ベースの相互変換が直接できます。そのため、この種の変換は、現時点では、Glossary Converterを使うほうが便利です。

UTX Converterは、MITライセンスに基づいてご利用いただけます。

シンプルな用語集形式UTXについての詳細は公式サイトをご覧ください。

Glossary Converter 3.0でUTX用語集とMultiTerm用語ベースを相互変換

Glossary Converter 3.0が公開されています。ExcelなどとMultiTerm用語ベースを数秒間で相互変換するツールです。

Glossary Converter 3.0では、用語集形式UTX 1.11がサポートされました。   
 

glossary-converter3.0-1

 

glossary-converter3.0-2   

 

オプションでは、UTXはUniversal Terminology eXchangeと表記されています。   

 

無料でどなたでもダウンロードできます。

 

簡単にテストしただけですが、確かにUTXが直接MultiTerm用語ベースにできました。またMultiTerm用語ベースからUTXへの変換もできました。   
UTXで独自のフィールドを定義している場合は、変換時に割り当てが必要になります。

 

UTXヘッダー コメントも用語ベースの「詳細情報」に保持されています。著作権情報もばっちりです。すばらしい!

 

ぜひ各自でお試しいただき、既存の用語ベースがUTXになることを確認してみてください。

【翻訳と日本語】アルク『翻訳事典2014年度版』に執筆

honyakujiten2014

アルク『翻訳事典2014年度版』に、以下の2本の記事を執筆させていただきました。

  • 「翻訳開業して最初の2カ月に身につけたい翻訳ツールの基本」(61-63ページ)
  • 「翻訳の基本! 保存版・『分かりやすい!』と言ってもらえる訳文作成のツボ」(67-69ページ)

「翻訳ツールの基本」では、翻訳メモリー ツール、Wordの置換と検索、用語ツールについて紹介しています。

「訳文作成のツボ」では、悪文の3要素を、良文の3要素に変えるために、訳文をどう作成すべきかの基本を紹介しています。たとえば、拙著『IT時代の実務日本語スタイルブック――書きやすく、読みやすい電子文書の作文技法』をベースにした、文をシンプルにする百半ルールを解説しています。他人の訳の問題にはすぐ気づいても、自分の訳の問題にはなかなか気づきにくいものです(私自身そうですが)。参考になる点が少しでもあれば幸いです。

ご意見・ご感想は、実務日本語ページにお寄せください。

この他にも、多くの翻訳者のみなさんによる、参考になる記事が数多く載っています。

【翻訳】インタースク​ール講習「2時間で分​かる翻訳支援ツール」

_DSC0023-2k7/26にインタースクールで翻訳支援ツール入門講習を行います。
お申し込みと詳細はこちらをご覧ください(PDF)
18:30開始です。

「さまざまな翻訳支援ツールについて知りたい」という翻訳初心者の方向けに、Tradosをはじめ、Wordや用語集などの基本的ツールをなぜ使ったほうがいいのか、どのように役立つのかを分かりやすくご紹介します。

ツールの予備知識は不要です。
多数のご参加をお待ちしております!

Sony Readerで青空文庫を読む

Sony Readerは2012/3/30に行われたアップデートでEPUB 3.0に対応したようです(参考ブログ)。アップデートの説明では「コミックなどの表示に対応」と書いていますが、書籍でも大丈夫のようです。

calibreで青空文庫のxhtmlをEPUBに変換してみました。
(面白いことにファイル名に漢字があると、中国語読みのローマ字に自動置換されます。変換時の問題を回避するのが目的と思われます。)

結果のEPUBは、Adobe Digital Editionsではカッコ入りのふりがなとして表示されます(つまりAdobe Digital EditionsはEPUB 3.0非対応です)。

結果のEPUBをSony Reader(PRS-650)に転送すると、ルビ付き表示ができました。

SONY DSC

縦書きにするには、EPUBをちょっといじれば簡単にできそうです。以下を追加すればよいようですが、まだ手が回りません。

-epub-writing-mode : vertical-rl

また拙著ではなぜかゴシックが表示できなかったのですが、全文ゴシックで表示されました。これも明朝で表示したいところです。

結論としては、今後、ルビ付き縦書き青空文庫をEPUBとして読めるようになりそうです(これまでは、Sony Readerで青空文庫をルビ付き縦書きで読むには、PDFに変換する必要がありました)。

より以前の記事一覧