本文へ

ここから本文です

グローバル規模のコンテンツマネジメント

2006年3月31日 掲載

ボブ・ドイル(CM Professionals 創設者、CMS Review 編集長)

グローバルリゼーション、国際化、ローカライゼーション、翻訳。これらはすべて、世界市場においてコンテンツを読み易いものにすることを表現する言葉だ。我ら CM Professionals(コンテンツマネジメントに関わる専門家コミュニティ)は世界各国に支部を置いており、さらに新しい国に活動範囲を広げるために、ウェブサイトのナビゲーション機能とコンテンツをいくつかの言語に翻訳したいと考えている。しかし、この作業は非常に手強いものだ。では、コンテンツのグローバリゼーション事業を運営するのに最良の方法は何だろうか。

まず一番重要なのは、翻訳に適した文章を書けるようになることだ。それは、簡潔明瞭に、とりわけ、再利用することを目的として書くことを意味する。そのためには使用する語彙を厳しく管理することが必要である。単に単語レベルの話ではなく、記事の意図を伝えるのに欠かせない表現、文章全体、あるいはパラグラフまで含めて、である。 Simplified Technical English(STE)は、翻訳に適した明瞭な文章を書くための一連のガイドラインを提供している。

忘れてならないのは、コンテンツのローカライズ(現地語への対応)は費用のかさむ事業であり、対応する言語の数に正比例する。もしも、重要な用語や言い回しを以前翻訳されたものから再利用することができれば、新たな翻訳に費やすコストを削減できる。 TRADOS や SDLX のような翻訳メモリ(TM)ツールには、「同じ文章は二度翻訳しない」ことを可能にする見込みがある。これらのツールでは、用語やテキストの一部分(たいてい、いくつかの文章)が翻訳表現と一緒にデータベースに保存されている。翻訳者が新しいテキストを入力すると、TMツールは データベースの検索を行い、完全一致、異なる言葉が少し含まれるファジー一致、そして、前後の文章も含めて認識する文脈内・完全(in- context exact or ICE)一致といったさまざまな意味での一致表現を検出する。

人間 vs. 機械

翻訳作業を助ける方法のもう一つの選択肢として、一見大変魅力的なものに、機械翻訳(Machine Translation; 略してMT)がある。第二次世界大戦中にコンピュターが発明され、暗号解読が行われて以来、プログラマー達は、翻訳作業も今すぐにでも解決される同様の問題だと考えてきた。しかし、(悪名高い英語に限らず)人間すべての言語が持つ複雑さや微妙なニュアンスの違い、根本的な表現のあいまいさ等のため、コンピューター利用翻訳(CAT)の専門家達は頭を悩ませている。今日では、機械が人間の翻訳家を援助することや、あるいは機械が翻訳をする際に、あいまいな意味を明確にする補助を人間がリアルタイムで行うことについて、専門家たちはもっと控えめに語るようになっている。

宣伝用の無料サービスとして、機械翻訳は多くのウェブサイト上で提供されている。最も有名なものとしては、AltaVista の(SYSTRAN を利用した)Babel fish、SDL を利用した FreeTranslation.com、そしてツールバー上に翻訳機能を搭載した Google 等のサイトが挙げられるだろう。 Language Engineering Company(LED)はウェブ上のサービスを有料会員制で提供している。

機械翻訳には弱点があり、最も予備的な作業にすら露呈される。機械翻訳がどのような滑稽な間違いを起こしうるかを見る方法のひとつは、翻訳を「往復」してみることだ。機械翻訳でまず文章を翻訳し、翻訳されたその文章をもう一度、機械翻訳を使って元の言語に直してみよう。もし、翻訳し直された文章が原文と同様なものに翻訳されたとしたら、それはかなりの幸運で、訳文が使い物になる可能性すらある。しかし、たとえこの往復翻訳が成功したとしても、意図した意味を正確に翻訳先の言語で伝えられているかどうかは保証できない。それを確かめるためには、ネイティブスピーカーの助けが必要となる。自分の業界の専門知識を持った翻訳家を捜す最善の方法は、プロの翻訳者協会を利用することだ。これらの団体の中で最大の団体は ProZ である(私も会員である)。ここでは、翻訳したい文章のサンプルを提出し、複数の翻訳家に訳してもらう。次に、熟練したレビュアー(校閲者)に、KudoZ という独自の評価システムを用いて翻訳の質を批評してもらう。こうして、翻訳家の候補者の質を判断することができる。このように、翻訳家と、独自のレビュアーの両方がほぼ常に必要とされる。

XML 多言語に対応

翻訳作業が終了したら、次はこのデータの再利用を容易にする集中型ツールに保存することが必要となる。 The Localization Industry Standards Association(LISA)は翻訳メモリ標準フォーマット(Translation Memory eXchange standard; TMX)を、構造化情報標準促進協会(Organization for the Advancement of Structured Information Standards; OASIS)は XML Localization Interchange File Format(XLIFF)という類似した規格を開発してきた。

この二つのどちらの形式を選ぶにしても(XML 形式であれば、XSLT を使うことよってどちらの形式にも変換可能である)、これらのファイルの読み書きを行うものが必要となる。 Heartsome 社は両方のファイル形式をサポートした複数のプラットフォーム対応の Java ベースの編集プログラムを開発し、標準の翻訳メモリ(TM)ツール(ウィンドウズのみ対応)と比べ破格の値段で提供している。TMファイルを XML 形式にしておけば、ツールの供給元に依存せずに利用できる。TM産業のリーダーである TRADOS は、XML をオープンにしようとする動きに対抗した。巨大な SDL インターナショナルは、TMX と XLIFF 形式を強力に後押しし、昨年、自社のシェア20%に対しTMマーケットのシェア70%を誇った TRADOS を買収した。

「ヘルプ求む」

SDL 社が開発した新作の AuthorAssistant は、ライターが一貫性のある文章を書き、企業が持つ既存のテキスト資産の再利用を援助するための興味深いツールだ。このツールの目標は、翻訳メモリ照合テクノロジー(TM matching technology)をオリジナルの言語による作業にも活用することだ。想像してみよう。ライターが文章を入力すると同時に、過去に書かれた内容が保存された莫大なデータベースの中から一致するものが検索・表示される。新たな言い回しを考案する代わりに、同じ書き方をするように促していくのである。小企業の PreciseTerm 社からもインターネットを使った同類のツールが提供されている。

SDL 社の Translation Management System と Idiom Technologies 社の WorldServer はグローバリゼーション業務を最適化するための企業向けのツールで、翻訳家や翻訳サービスのプロバイダついての情報の把握、ある事業のローカライズにかかる費用の表計算分析の提供、翻訳家に電子メールによる通知の送信等を行う。しかし、これらのシステムの利用には数千万円規模の費用がかかるため、我々のように小規模な CMPros のウェブサイトには手の届かないものとなっている。

最高のツールや翻訳家を持ってしても、ネイティブスピーカーでさえ最新の専門用語を知らないということも起こりうる。 GlossPost はさまざまなテーマに関して、二ヶ国語あるいは多国語での専門用語辞典を何千と集めて提供している。私は現在、ウェブサイトやインターネット上で使われる一般的な用語を収めた多国語用語辞典を収集しようとしている。フランス語でやスペイン語で「click here」は何と言うだろうか。「Cliquez ici」とか「Haga clic aqui」と言えばどうにか通じるだろう。私たち CMPros はもっと多くの言語での表現・言い回しを募集している。ローカライズを目指す人たちの情報サイト(www.openinternetlexicon.com)にその成果を掲載していこうと思う。例えば、これはいい例だ。「ヘルプ求む(Help us)」を十カ国語でなんと訳すのか? これからの課題である。

この記事の原文「Global Content Management」は、2006年2月7日、「EContent」に掲載された。

本記事は、著作者の許可を得て、翻訳・転載しているものです。


トラックバック

このページのトラックバックURL
http://www.designit.jp/mt/mt-tb.cgi/374