翻訳

エンジョイSwiftUIプログラミングその11(多言語化その2:WordPressブログ記事とニューラル機械翻訳(NMT))

「ヘルパーK」アプリでは、Wordpressブログ記事をコンテンツとして採用してSwiftUIと一体化しました。ではこのコンテンツの多言語化について説明します。結論から言うとほぼマニュアル翻訳(よくて半自動化翻訳)です(爆)!

WordPressの準備(日本語)

もちろんまずWordpressのサイトを立ち上げブログ記事を日本語で作成しなければなりません。Wordpressの設定や操作については私は通常の運用程度の知識しかありません。PHPでのウエブプログラミングはできるようにトレーニングすると良いかもしれませんが、PHPでカスタマイズしなくとも、有料または無料のWordpressテンプレートが利用でき(後述)、また、各種プラグインが利用できます。

まず、ブログを展開する際には、これまた大瀧さんに教えてもらいました。大瀧さんは自身が人気ブログの著者で、長年ウエブサイトとブログを運用(自身でカスタマイズしてサイトをプログラミング的に構築)しているので、大瀧さんのお勧めをまるパクリしました。

サーバーとドメイン名

WordPressテンプレート

ブログ記事コンテンツ

WordPressのテンプレートやウエブ設定がいくら良くてもコンテンツ記事の内容が一番重要だと思います。ですので、ヘルパーKには頭が上がりません!いつもレシピに一工夫を入れて全国のヘルパーさんと利用者さん、そして、読者の皆さんに役に立つかまたは楽しんでもらえる記事と写真を提供するよう努力しています。特にコンテンツで重視したのは、ビデオや動画では無く写真を採用したことです。これはヘルパーMにも指摘されたのですが、ヘルパーさんは時間がないので動画ではなく写真の方が使いやすいとのアドバイスからです。そして、文章ではなく写真を流し見するだけで理解ができるように構成するようにしています。最近の記事(ヘルパーKの早業3分クッキングその71(しいたけの肉詰め))を見てみてください。この写真を見てわかる構成は多言語化する際の文章の翻訳量を減らすという有利な効果があります。

イラスト

そして、もう一つの特徴はイラストです。ヘルパーKのイラストをはじめとするイラストは塩川紗季さんにお願いして描いてもらいました。写真や漫画ではなく実際の色鉛筆画がなんとも言えない「柔らか」で「親しみの湧く」絵となっています。もちろんアプリでもアイコンを含めてイラストが大活躍しています。

Google翻訳を活用したWordpressブログ記事翻訳

本業の特許翻訳でも、昨年夏にある翻訳会社の特許担当の方と会議する機会があり、今後の特許翻訳の方向性についても意見を交わしました。その中で、ニューラル機械翻訳(NMT)を如何に特許翻訳に活用するかと言う点もトピックに登りました。現状、特許翻訳でNMT(Google翻訳を含む)を直接的に使用するレベルにまでは翻訳水準が到達していないが、仮訳レベルを NMTにさせて実際の翻訳者が原文から修正しながら翻訳することは導入の可能性と価値があるのではないかというので意見が一致しました。

「ヘルパーK」アプリで採用したのは、このNMT+ヒトマニュアル翻訳によるWordpressブログ記事の多言語化(英語とドイツ語)でした。

ニューラル機械翻訳(NMT)

では、実際にどうやるかを解説します。大瀧さんのブログ記事「私は「兼築家」をめざしています!」をNMTを使って翻訳してみます。

まず記事「https://ootaki.info/123/」に行ってみてください。

次にGoogle翻訳に行って、左欄(原文)を「日本語」、右欄(目的言語)を「英語」にして、原文にウエブサイト「https://ootaki.info/123/」を入力すると、右欄(目的語)にサイト名が表示されます。

そして、右側(目的言語)のリンクをクリックしてみてください。そうすると、英語でブログ記事が表示されます。

これを原文と比べてみてください。ちょっと「アブナイ」翻訳になっていますね(わかりますか?)。上側はそのままではダメですが、下側部分はまあまあな翻訳になっています。

ちなみに、目的言語をドイツ語にして同様にしてブログを表示するとドイツ語のブログが表示されます。

英語よりもドイツ語の方がちょっといい感じかもしれませんね。

ですが、このままを使用するのは少し問題があります。ですので、このNMT翻訳をヒトを使ってマニュアル修正するのが次の段階です。

この英語NMT翻訳ページをWordpressブログ記事画面に貼り、後はヒトがマニュアル修正すれば簡単にできるはずでした。

ところがしばらくはうまくいっていたのですが、突然、GoogleのWebページ翻訳が表示されなくなるようになりました。おそらく、Google翻訳をコピペしてNativeなページに貼るような事態を検知するようになっていたのでしょうね(推測にすぎませんが)。

そこで方針を変えました。

  1. 日本語のサイトからテキストをtxtファイルで抽出し(私はWindows10をMac上でParallelsで走らせているので「メモ帳」を使用しています)、Wordで整形し原文日本語データを作成。
  2. Google翻訳で日本語から英語にNMT翻訳。
  3. NMT英語の修正が必要な部分をヒトがマニュアル翻訳。
  4. 出来た英語修正文からドイツ語へNMT翻訳(Google翻訳には言語により得意な方向性があり、英語からドイツ語への翻訳は、日本語からドイツ語への翻訳より精度がはるかに高い)
  5. NMTドイツ語をヒトがマニュアル翻訳。
  6. 修正英語文と修正ドイツ語文テキストを、 WordPressへ貼り付けて(写真は日本語のオリジナルなWebページのものをコピペ)多言語化する。

NMT翻訳+ヒトマニュアル翻訳を最後にネーティブチェック

出来た英語とドイツ語のページをさらにネーティブチェックに掛けるといいですね。いくつかの英語のページはAkikoさんに見てもらい、ドイツ語のページはGunnarにチェックしてもらっています。

大体、コンテンツの多言語化はこんな感じですね。暇人ならではの技ですね!!!

関連記事一覧

コメント

この記事へのコメントはありません。