ディープラーニングでIMEはさらに進化する!――続々「Simeji」の日本語入力システム入門(2/4 ページ)

» 2015年09月11日 10時00分 公開
[PR/ITmedia]
PR

小町氏 自然言語処理の研究の分野でも、Twitterのデータはよく使われています。日本人はTwitterを使う人が世界的にみても多くて、つぶやきも長く、日常に溶け込んだ使い方をしています。特異なメディアになっているんですね。

 僕は確かに数千人とつながっているんですが、僕が見ているTwitterは本当に一部で、ランダムサンプリングでTwitterの投稿を見ていると、これは本当に日本語なんだろうかという大学生、高校生のツイートがあって、すごく多様だなと感じます。彼らがどうやって入力しているのか僕も想像がつかないんですが、そういう人が入力するシーンも大切だと思っています。

 そういう世界では開発者は全知全能じゃありませんし、多様な使い方がデータ分析から生まれるのは非常に大事で、そうすることによって万人に開かれたIMEになっていくのかなと思っています。

高部氏 まさにおっしゃる通りだと思います。処理としては単なるインプットとアウトプットですが、それを統計的な形、もっと会話的な形、より自然な形になっていくのかなというイメージは持っています。

小町氏 LINEなんかではスタンプだけで会話している人がいますね。情報の入力か出力か分かりませんが、こんなスタンプを使っているときにはこんな感情だと推定して、支援したりできそうです。

高部氏 まさに今、そういうものを各社開発しようとしているようです。文脈から感情を読み取って、絵文字などを提案するような技術です。小町先生も詳しいと思いますが、米国の若い子はエモティコン(英語版の顔文字)だけで会話をしているとか。僕らには何を言っているか通じないけれど、そういう新しい使い方で、より面白い。

小町氏 そうですね。顔文字、絵文字も日本だけじゃなくなっています。僕自身、スタンプみたいなものはそんなに使っていないんですが、最近妻とメッセンジャーでやり取りするときは娘の写真を使っています。ちょっと嫌なことがあったら泣き顔の写真を送ったりする。感情を伝えるものとして、必ずしもテキストが最適だとは限らないのかなと最近思っています。

――(聞き手、ITmedia) 翻訳サービスがあったり翻訳ソフトがあったりしますが、どこまでインプットと同時にできるものでしょうか。また、違う言葉に変えるというのは、IMEを通じて、表示されているものをもう一度、分かりやすくするところまで踏み込んでいくことを目指しているのでしょうか。

小町氏 リアルタイムで書いているものと、書いたものを変換するのと、結構違うんです。日本語入力でも、書いたものを変換する場合、予測入力はないわけですね。かなが入力されて、それをいかに変換するのかというだけで、文の単位で入力されることも多い。文節ごとに切って入力するとか、いろんな入力スタイルがあると思いますが、実際のユースケースに近いのは、インタラクティブに変換して、もしくは翻訳してみて、間違ったら修正するという使い方だと思います。

 例えばGoogleの翻訳エンジンは、翻訳結果が出た後に一部の単語を置き換えて改善する機能があったり、マウスを単語に持っていくと、この単語をこう翻訳しましたよ、という風に対応を出してくれたりします。また、翻訳が間違っていたら、別なものを出せるようにする機能もあったりします。どちらも利点、欠点があって、全部のテキストがちゃんと書いてある方が情報は多いので、変換や翻訳がしやすいんですが、リアルタイムにできないのが問題です。

 今は東京オリンピックに向けて、音声で日本語から、もしくは日本語に翻訳するシステムに、国をあげて取り組んでいるところです。そういうことをしようとすると、リアルタイムでやりたいという要求があります。リアルタイムでやろうとすると、英語と日本語で語順が違うのが問題になります。日本語だと動詞が後ろの方、英語だと主語の後ろに来るので、実は英語は動詞を聞かないと翻訳ができません。それをがんばって予測して翻訳したり、切れるところまで切ってそこまで翻訳したりするような研究も進んでいます。どこまで切ったらいいのかということが、すごく大事なところになっています。

 例えば通訳するにしても、話を聞いた後にいったん止めて通訳して、という非同期の通訳は、専門の訓練を受けていなくてもできるんですけど、同時通訳はバイリンガルでもできない特殊技能が必要です。この表現だったら、ここで切って先に翻訳できるけど、この表現だったらできない、というのがあるんです。例えば理由を説明するとき、「なぜなら」という表現を使って説明すると、スムースに前から訳していけるんですが、「○○なので××」とか、「○○だから私はここに行く」というような語順だと、全部聞かないと翻訳できない。語順をできるだけ入力の言語に近いように翻訳する表現を、ちゃんと身に付けておかないとできないですし、ものすごく脳に負荷をかける作業で、プロでも数十分くらいしか続かないらしいんですね。これが機械でできるようになったら、機械は疲れないので、やり続けても問題ない。同時通訳がいらなくなるほどではないと思いますが、数年訓練を受けないとできない同時通訳が、そこにスマホを置いておけば同時に翻訳してくれるようになる。これはすごく需要がある話じゃないかと思っています。

―― 英語を今から学ぶのと、技術が進化するのを待つのと、どちらが速いでしょうね。待った方がいいかもしれませんが(笑)。

photo

小町氏 それは一面の真実があります。世代によってどれくらい言語ができるか違っていて、最近の学生と話をすると、やはり英語はできるようになっていますね。昔の教育では受験英語ばかり、読みばかりで、役に立たないという人も多いと思うんですが、今の大学生、20代前半や10代の人を見ていると、相当できる印象があります。文法がダメかもしれないくらいで、読み書きに関してはできるようになっていると思います。今の大学院生にTOEICの点数を聞くと、僕が当時、留学するための最低ラインといわれた点数はみんな持っている。語学能力に関しては飛躍的に上がっていると思いますね。

photo

高部氏 多言語対応は難しいと理解しています。特にリアルタイムの対応が難しいんですが、Simejiでも和文から英文にリアルタイムで変換するサービスが、実はすでに開始しています。プレミアサービスにその機能がありまして、簡単なフレーズであれば、英語の変換候補が出てきて、ちょっと驚きのあるサービスとなっています。ユーザーさんの反響も大きいんですが、先生がおっしゃるリアルタイム翻訳のカテゴリに対してはまだまだこれからだと思っていて、Simejiとしては、通常の日本語変換、漢字の変換以外の部分に注力していこうと思っています。

―― 日本語を学んでいる人が世界に約400万人いらっしゃるということですが、そういった方は日本語をスマホやPCでどうやって入力しているのでしょうか。

小町氏 基本的にローマ字を使って入力します。日本人が使うのと一緒ですが、どの言語が母語かによって、若干違います。例えば中国人は漢字の読み書きができますから、文章を書かせると、習熟度が低い人でも漢字を使ってきます。ヨーロッパ圏の人は、アルファベット系の言語を使いますから、漢字がまったく分からない。日本語の作文もローマ字で書いたりします。漢字文化圏の人は、読み書きは得意なんですが、ヨーロッパ系の言語を母語とする人はしゃべるのが得意という違いもあります。

 入力するときも、その違いが如実に反映されていて、しゃべったら全然違和感を覚えないような人でも、メールを書いてもらうと表現が変なことは結構あります。逆に、メールではしっかりしていても、しゃべってみるとこれはおかしい、と思うこともあります。それは、しゃべったり聞いたりすることを中心に学んできたか、読み書きを中心に学んできたか、もしくは自分の言語が読んで分かるかどうかというのと、かなり関連するのではないかと思っています。

 我々が英語やドイツ語を入力するときは、キーをそのまま打つので、間違った単語を入力することがあります。日本語を学習している非ネイティブの場合、日本語を間違って入力すると変換キーを押したときに変換候補がぐちゃぐちゃになって、何かが間違っているのでは? と気が付く。そういう意味で、コンピューターを使って入力することで誤りがそんなに目立たなくなると思います。

 逆に、原稿用紙に作文させると、全然書けない人がいます。我々も英語を書くときに、PCやスマホで書いたときと手で書いたときとで、だいぶ違うのと、同じだと思います。非ネイティブが日本語を書くときは、辞書を持っているかどうかが重要です。変換エンジンがあることによって、変換キーを押したときに、辞書にないような単語やつづりを間違えていることが結果で分かるので、それが誤り訂正にも効果があるのかなと思っています。

―― 英語、韓国語、中国語のIMEの機能は、Simejiと同じような予測変換や顔文字にしてくれるような機能があるのでしょうか。

小町氏 IME自身の複雑さに関しては、たぶん日本語と中国語が一番難しい言語です。ローマ字で読みを入れた後、ひらがなにして、最終的に入れたい漢字に変換するという複雑さを持っているのは日本語と中国語だけで、他の言語はキーを押せばその単語や文字が入力できます。中国語に関しては日本語と同じで、予測入力がベースになっているような変換エンジンが主流です。最近の中国の人たちはだいたい、ローマ字を入れて漢字を選択していくというやり方で入力しています。

 あと日本語IMEはPCの場合、変換候補を縦長に順に出すと重いますが、中国語のIMEは横に長く表示するんです。スマホやタブレットでも、変換候補が横長に出るようになりました。多くの言語をサポートしようとすると、インタフェースも多言語対応して、すべての言語で共通にしたいと考えるでしょう。タブレットやスマホのインタフェースで変換候補を横長に出すと、日本語も中国語も同様に扱えるようになるので、中国語に合わせたのではないでしょうか。

Copyright © ITmedia, Inc. All Rights Reserved.


提供:バイドゥ株式会社
アイティメディア営業企画/制作:ITmedia Mobile 編集部/掲載内容有効期限:2015年9月30日