“ほんやくコンニャク”の実現はいつ? 音声認識・翻訳技術は「言語」の壁を取り払うか特集・音声言語インタフェース最前線(3/4 ページ)

» 2018年04月20日 12時30分 公開

進化するニューラルネットワーク

 ここでもう少し、ニューラルネットワーク型翻訳について見ていく。Googleはこの仕組みに「Neural Machine Translation」(NMT)と名付け、同社の名称を付けて「GNMT」(Google's Neural Machine Translation)などとも呼んでいる。

 Googleが公開した解説記事のサンプルでは中国語から英語への変換が紹介されているが、入力した漢字をそれぞれエンコーダーで分解し、デコーダーで英語への変換を行っている。

 ここで「LSTM」(Long Short Term Memory)という仕組みが用いられているが、これは「深層学習」(Deep Learning)の世界において、特に自然言語処理や今回のテーマである翻訳など、“互いの依存関係”の把握と解決が必要なケースで重要な役割を果たしている。

GNMTのリリースで触れられた2016年当時の辞書ベース(PBMT)翻訳とGNMT、人手を介した翻訳の品質の違い

 ここまでの解説にあるように、“自然な翻訳”を実現するうえでは文書全体の個々の単語のつながりの把握が必要となる。「Aという問いに対してBという答」というシンプルな計算の場合は問題ないが、翻訳ようなケースでは入力された文章全体を把握、つまり前後の依存関係が重要になるというわけだ。

 そこで登場するのが「RNN」(Recurrent Neural Network)という再帰処理型のDNN(Deep Neural Network)モデルで、内部にループ構造を持たせることで前後の入力データを維持し、互いの依存関係を意識した処理を可能としている。

 ただ、RNNそのものは短期(Short Term)の依存関係の把握には問題ないものの、長文翻訳のように数百や数千単位の長期(Long Term)の依存関係の把握は難しく、それを解決すべく考案されたのがLSTMということになる。

 LSTMはMicrosoftのニューラルネットワーク型翻訳にも採用されており、ここ数年の翻訳エンジンのトレンドとなっている。大量の辞書(コーパス)にGPUを組み合わせてDNNを構成しており、Googleの場合はTPU(TensorFlowによる機械学習用のプロセッサ)とTensorFlow(Googleが開発してオープンソースで公開している、機械学習に使うソフトウェアライブラリ)を組み合わせた大規模処理を用い、Microsoftでは「BrainWave」の仕組みを組み合わせ、恐らくはGPUとFPGAを組み合わせたハイブリッドな仕組みでの運用が行われているのではないかと予想している。

 いずれにせよ、機械翻訳の世界は大量のコーパスと統計処理のみを用いた力業に近い手法から、DNNを用いたより効率的で自然な方向性を目指しているというのが、ここ2、3年ほどのトレンドだ。

LSTMを使ったニューラルネットワーク型翻訳の概念図(Microsoft公式Blogより引用)

 Microsoftは今年2018年3月に「Microsoft reaches a historic milestone, using AI to match human performance in translating news from Chinese to English」というブログ記事を公開したが、その内容は「newstest2017」というテストで中国語から英語への翻訳が「人間と同等の水準になった」というものだ。

 いくらニューラルネットワーク型翻訳が進化したとして、「“最後のわずか数%の部分”の調整でやはり人手を介した“自然翻訳”にはかなわない」というのがGoogleとMicrosoftの両サービス共通の認識だったが、この壁をクリアできたというのがその趣旨となる。実際、中国語と英語の翻訳に関する研究は非常に盛んであり、恐らく全ての言語の組み合わせでも世界トップクラスだろう。

 ゆえに、ほぼ納得の行く翻訳クオリティを実現する“万能翻訳機”が登場するのであれば、まずは中国語を含めた欧州言語が最初にカバーされることになると筆者は予想している。実際、これら言語は英語さえ理解できていれば遜色ないレベルで内容が把握可能だと認識しており、筆者も日々翻訳サービスのお世話になっている。日本語についてもそう遠くない将来、“遜色ない”レベルの相互翻訳が可能になると信じている。

中国語から英語への機械翻訳が人間と同レベルに到達したと説明する、Microsoftで同分野の責任者でテクニカルフェローのゼドン・ファン氏

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2024年03月29日 更新
  1. ミリ波レーダーで高度な検知を実現する「スマート人感センサーFP2」を試す 室内の転倒検出や睡眠モニターも実現 (2024年03月28日)
  2. Synology「BeeStation」は、“NASに興味があるけど未導入”な人に勧めたい 買い切り型で自分だけの4TBクラウドストレージを簡単に構築できる (2024年03月27日)
  3. ダイソーで330円の「手になじむワイヤレスマウス」を試す 名前通りの持ちやすさは“お値段以上”だが難点も (2024年03月27日)
  4. 「ThinkPad」2024年モデルは何が変わった? 見どころをチェック! (2024年03月26日)
  5. ダイソーで550円で売っている「充電式ワイヤレスマウス」が意外と優秀 平たいボディーは携帯性抜群! (2024年03月25日)
  6. 日本HP、個人/法人向けノート「Envy」「HP EliteBook」「HP ZBook」にCore Ultra搭載の新モデルを一挙投入 (2024年03月28日)
  7. 次期永続ライセンス版の「Microsoft Office 2024」が2024年後半提供開始/macOS Sonoma 14.4のアップグレードでJavaがクラッシュ (2024年03月24日)
  8. サンワ、Windows Helloに対応したUSB Type-C指紋認証センサー (2024年03月27日)
  9. 日本HP、“量子コンピューティングによる攻撃”も見据えたセキュリティ強化の法人向けPCをアピール (2024年03月28日)
  10. そのあふれる自信はどこから? Intelが半導体「受託生産」の成功を確信する理由【中編】 (2024年03月29日)
最新トピックスPR

過去記事カレンダー