ニューラル機械翻訳の登場で大きな進化を遂げている自動翻訳ですが、隅田氏は「解決すべき課題はまだまだある」といいます。
例えば、文脈の理解。先述したように、日本語と英語は文法が大きく異なるため、日英・英日翻訳は特に難しいそうです。主語がなかったり省略されたりする日本語の文章はうまく英訳できず、「いまの技術で対応するには『あなたは』『私は』など主語を補う必要があります」と隅田氏は話します。
「人間の翻訳者ならうまく補完できますが、いまの自動翻訳は一文単位で見るので文脈をうまく理解できないんです」(隅田氏)
日常会話の翻訳はまだ難しい部分もありますが、空港やホテルなどシチュエーションが限られている場面では、省略された主語を統計的に類推するといったことができるようになっています。
しかし、自動翻訳が普及した未来では、私たち人間は機械に翻訳されやすい言葉をしゃべったり、文章を書いたりする必要が出てきそうです。隅田氏も「そうなるかもしれませんね」と同意します。
いま、既に多くの自動翻訳ツールが登場しています。2020年には東京オリンピック・パラリンピック、2025年には大阪万博が開催されるので、多くの外国人観光客が日本に訪れるでしょう。今後ますます自動翻訳のニーズが広がる中で、「あっ、私いま機械が理解しやすいような話し方をしたな」と意識する場面は案外すぐやってくるかもしれません。
そして、いま隅田氏は「同時通訳」の基礎研究をしています。隅田氏によると、いまの自動翻訳は話者と通訳が交互に話す逐次通訳で、話者が話す言葉を同時に訳していく同時通訳とは形式が異なるそうです。
「現時点で、同時通訳はテレビ会議などの用途を想定しています」と隅田氏。取材中に、テレビ会議で外国人が話した内容の和訳を字幕で表示するデモを見せてくれました。話者が話した言葉をマイクで拾って、ある程度まとまった文章になると訳してくれるというものでした。
隅田氏は「日本語は文末に動詞が来るので、『〜します』『〜しません』のように最後で意味が真逆になることがあり、同時通訳が大変です。この研究はとても奥が深いのです」とやりがいを語りました。
堺筋線の誤訳のような問題は世界各地で起きていて、各国の現地企業が自国のニーズに合った翻訳エンジンの開発に取り組んでいるそうです。Google翻訳のように大きくなり過ぎたサービスは、網羅性を重視するあまり地域ごとの強いニーズに応えられず、やがて小さなほころびが大きくなっていく――グローバル社会において、こうした課題は無視できるものではありません。
NICTや各国の現地企業は、自動翻訳を用いて言葉の壁をどう乗り越えていくのでしょうか。ますます進化していく自動翻訳の世界から目が離せません。
株式会社デコム R&D部門マネージャー。 セイバーメトリクスなどのスポーツ分析は評判が高く、NHKに出演した経験もある。他にも政治、経済、文化などさまざまなデータをデジタル化し、分析・予測することを得意とする。 本業はインサイトを発見するためのデータアナリティクス手法を開発すること。
著者連絡先はこちら→kentaro.matsumoto@decom.org
今最も注目を集めるデータサイエンティストの1人が、データの読み方に注目して「うそを見抜く技術」を解説します。世論調査の結果はなぜ各社異なるのか? アベノミクスによって景気は良くなったのか? 人手不足なのにどうして給料は増えないのか? 「最近の若者は……」論の誤り、本当に地球は温暖化しているのか? などなど。
新時代の教養「データサイエンス」の入門書として、数学が苦手な人、統計学に挫折した人にも分かりやすい一冊に仕上がりました。詳細はこちらから。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR