インタビュー
» 2007年12月04日 02時16分 UPDATE

「D905i」開発陣インタビュー:「ハイライト再生」と「翻訳リーダー」で“使えるハイエンド”を目指す――開発陣に聞く「D905i」(後編) (1/2)

ドコモの905iシリーズはワンセグや3G/GSMローミングなど、ハイエンド機能を標準搭載するのが大きな特徴。こうした機能を“真に使える”ものにするために、D905iに搭載されたのが「ハイライト再生」と「翻訳リーダー」だ。開発陣は、“ユーザーの利用シーンを考えつくして機能をブラッシュアップした”と胸を張る。

[房野麻子(聞き手:後藤祥子),ITmedia]

 ワンセグ、FOMAハイスピード(HSDPA)、3G/GSMローミングに対応し、スライドボディに3.1インチフルワイドVGA液晶を搭載した「D905i」親しみやすさを感じさせるボディに先進機能をさりげなく搭載したこの端末には、機能面で2つの大きなポイントがある。

 1つは、常に表に出ているメインディスプレイで映像を見やすいという、スライドボディの特徴を最大限に生かしたビジュアル系の機能の充実。もう1つが、3G/GSMローミングへの対応を意識した便利機能で、「翻訳リーダー」と「しゃべって翻訳 for D」の2つのアプリと日韓、日中の辞典が新たに搭載された。

 D905i開発者インタビューの後編は、ビジュアル系機能の進化と翻訳リーダーの開発秘話を中心にお届けする。

Photo FOMAハイスピード(HSDPA)、3G/GSMの国際ローミング、ワンセグ、GPSに対応した「D905i」。メインディスプレイには3.1インチフルワイドVGA(480×864ピクセル)液晶を採用している
sa_di01.jpgPhoto 三菱電機 商品開発第一部 機種企画グループの井上将志氏(左)と同NTT事業部 NTT第三部第二課の荻田良平氏(右)

中国語に悩まされた翻訳リーダーの開発

Photo 韓国語と中国語(簡体字)はレストランのメニューなど、グルメ系の単語の翻訳に対応する

 翻訳リーダーは、英語や簡体字の中国語、韓国語で書かれた文字をカメラで読み取り、日本語に自動翻訳する機能。文字認識エンジンはオムロンの「MobileOmCR」を採用している。

 この翻訳リーダーを“きちんと使える機能にする”のに苦労したと三菱電機 商品開発第一部 機種企画グループの井上将志氏は振り返る。「開発当初は幅広いジャンルの言葉を扱って、旅行者がいろいろな場所で使える機能にしたいという話もありましたが、難しかった。中国語を甘く見ていました(苦笑)」

 中国語は英語のように単語と単語の区切りが分かるスペースがなく、文字が一定の間隔で並んでいる。そのためカメラが読み取ろうとしても、どこまでが1つの単語なのかを認識できず、どう翻訳するか判別できなかったのだ。最初に現地に行って試したときには、半分も翻訳できなかったという。

 「翻訳リーダーのベースはあくまで単語を翻訳する機能で、文章を訳すものではないことから分からないのです。また語彙が膨大すぎて、辞書側の問題で訳せないケースもありました」(井上氏)

 そこで開発陣はジャンルを限定し、グルメ系に特化したものとして開発することに決めた。実際に現地で利用シーンを想定して調べてみると、空港や駅などの公共施設や宿泊施設は英語が併記されていたり日本語が使えたりと意外に困らないことが多く、本当に困ったのは食事の時だったからだ。旅行者の利用シーンに幅広く対応しようとすると、“広く浅く”になって、使い勝手が損なわれる。ならばジャンルを限定して、ストレスなく使ってもらえる方がいいと考えたわけだ。

 「空港や駅などでは補助情報が何かしらあって、それほど困らないんですね。でも、食事のときにはメニューが読めなくて本当に困ったんです。日本語や英語のメニューがあるようなお店だったらいいですが、ないお店もけっこうあるんです。北京でも観光客向けのメニューを用意しているお店は少なかったですね」(井上氏)

 しかし、ジャンルを限定しても中国語の翻訳は難しかったと井上氏。開発を始めてから「中国語の料理の名称は無限にある」ことが分かったのだ。中華料理はその多くが素材、調理法、味付けの組み合わせが料理名になっている。「最初の文字認識エンジンは“完全一致”しないと訳が出ない作りになっており、そのままでは中国語の料理名に対応できなかったのです」(井上氏)

 そこで中国語の料理名に対応できるようにエンジンを改良。麻婆豆腐や北京ダックなど、料理名が登録されているものはそのまま翻訳結果を出し、それ以外は前方から“何の肉を、どういう風に焼いて、何で味付けしたもの”というように、各部分に説明が出るようにした。さらに中国語、韓国語ともに、翻訳リーダー用の辞書には料理のメニューを中心に約3000語を収録し、翻訳結果の精度を高めた。

sa_di04.jpgsa_di05.jpgPhoto 例えばこのメニューの場合、最初に冒頭の2文字の「冷たい和え物料理」が翻訳され、右下ソフトキーを押すと次の2文字の翻訳結果「昆布」が表示される。もう一度右下ソフトキーを押すと最後の1文字の翻訳結果となる「千切り。細切り。」が表示され、料理の概要が分かる

 翻訳結果についても分かりやすくするための工夫を凝らした。例えば、料理名の翻訳として「サムゲタン」とだけ表記されるのでは、それがどんな料理か分からない人には意味がない。そこで、日本人になじみがない料理には、“鶏の中に詰め物をして長時間煮込んだスープ”というように料理内容の説明を表示するようにした。

 飾り字体や手書き文字では認識率が落ちるというが、スタンダードなフォントなら認識率は高く、薄暗い場所でもライトを使えば対応できるなど、使える機能に仕上がったと井上氏は胸を張る。

 「現地のさまざまなレストランで最終的な翻訳精度の調査をしたのですが、店に入ると何か頼むことになります。チェックを担当したエンジニアが食べ過ぎて具合が悪くなるくらいチェックを重ねています」(井上氏)

sa_di07.jpgsa_di08.jpgPhoto 翻訳結果にはメニューの概要と読みも表示される

ビジュアル系機能の進化――ワンセグ、VGA動画への対応

 D905iでは“パーフェクトビジュアルスライド”というコンセプトのもと、いつもメインディスプレイが表に出ているスライドスタイルを生かして「見ることを充実させた」と荻田氏。D905iは、「D903iTV」「D704i」に続く三菱電機製の3モデル目のワンセグ対応機となり、外部メモリへの録画に対応したのはD905iが初となる。また、動画はVGA解像度での撮影が可能になり、視聴も撮影もVGAに対応した。

 ワンセグ対応端末の多くが、さまざまな高画質化技術を搭載して映像の美しさをアピールする中、D905iも「Natural Color Matrix」や「明るさWコントロール」などの技術を採用して、美しく見やすい絵づくりに取り組んでいる。

 Natural Color Matrixは、色調補正をするハードウェアエンジンで、補正はワンセグ映像だけではなくカメラの静止画や動画など、ワンセグ以外の機能を使うときにも働く。色をより鮮やかに補正し、赤は赤らしく、青は青らしく見えるように補正する。

 「必ずしも自然な色にするわけではなくて、人の目でより鮮やかに見えるよう補正します。極端にいえば、元の映像がくすんでいるものであっても、鮮やかに補正できます」(井上氏)

 明るさWコントロールは周囲の明るさに加え、映像コンテンツ自体の明るさを判別して、画面の明るさをリアルタイムでコントロールする技術だ。明るさ補正は一般的に周囲の明るさを判断基準とするが、D905iでは映像そのものが明るいか暗いかも判別して調整する。

 「例えば、夜のシーンをワンセグで見ると、(家庭用テレビと比べて)映像が小さいため、黒くてよく分からないことがあります。周りが明るいからといって、暗い映像でバックライトを暗いままにしておくと見づらくなります。周囲の明るさだけでなく、“暗い映像か明るい映像か”も判断し、両方のバランスをみてバックライトを調整しています」(井上氏)

sa_di09.jpgsa_di10.jpgPhoto 「明るさWコントロール」はエコノミー、ノーマル、ブライト、オフから選べる。番組の内容に合わせた設定は「ノーマル」「美肌」「シネマ」「くっきり」の4つのモードを用意。新たにワンセグ録画にも対応した

       1|2 次のページへ

Copyright© 2016 ITmedia, Inc. All Rights Reserved.