実によくなじむッ! 1日10円で“至高の”日本語入力環境を――まだまだ進化する「ATOK 2010」“最高にハイな気分”で文字を打つ(1/4 ページ)

» 2010年03月10日 12時00分 公開
[瓜生聖,ITmedia]
※本記事はアフィリエイトプログラムによる収益を得ています

孤高の有料IME vs. 無料の検索サイト群

 筆者は以前、常用する日本語入力システムとして、MS-IMEから「ATOK 2008」へ乗り換えた理由を書いた(参考記事:最近の「MS-IME」は目に余る――よろしい、ならば「ATOK」だ)。それから2年。今回は最新版のATOK 2010を取り上げ、ATOK 2008からバージョンアップをするべきなのか、OS標準のMS-IMEや無料のGoogle日本語入力ではなく、有料のATOKを使うべきかどうかについて考えていく。

 前述の記事を書いた時点では、日本語入力システムは「無料(OS標準付属)のMS-IME」 vs. 「有料のATOK」という図式がしばらく続くものだと思われていた。ところが、ここにきてGoogleからGoogle日本語入力、百度からBaidu Typeと、検索サイトが立て続けに無料の日本語入力システムを公開した。その結果、これまでの無料 vs.有料だけでなく、検索サイト vs. 研究所(ATOK Lab.)という見方もでき、ATOKはますます異色の存在となりつつある。

 その違いが如実に表れているのは、誤変換軽減のためのアプローチだ。膨大なサンプリングを元に統計的手法で頻出単語を網羅していく“検索サイト連合”に対し、ATOKは特に文節認識に注力しているという印象が強い。ATOKの変換エンジン「ATOKハイブリッドコア」はATOK 2007で初めて搭載されて以来、ATOK Lab.の日本語処理技術の研究成果を反映して進化を続けているが、その成果として、文節を正しく認識するための手法が占めるウエイトは大きい。

 続くATOK 2008は、統計的手法による文節区切りの評価が採用された。ATOK 2009では精度が向上し、文節区切りをより正確に特定できるようになったというやや漠然とした内容だったが、ATOK 2010では従来の出現単語の分野に応じた文脈処理のブラッシュアップに加え、同音異義語ごとの出現確率や前方単語との距離を考慮した組み合わせの確率を総合的に計算することで、同音語に対して適切に変換する新たな文脈処理を導入している。

ATOK2007/2008/2009/2010における文節認識精度の変遷

 ATOKの変換方法には、通常利用される連文節変換のほか、自動的に変換を行う自動変換もある。その性質上、長文を一気に入力してから変換するという使い方になるが、便利な半面、誤変換時のペナルティが大きい。視線の動きが大きく、かつ、再変換の手間が発生するからだ。だが、ATOK 2010ではいよいよ自動変換が常用できる変換精度に達したという印象がある。つまり、たとえ視線の動きが大きくても「外れなければどうということはない」というわけだ。もちろん、「変換の結果を見る必要がない」というレベルに達していない以上は確認が必要だが、それでも予想外の誤変換がほとんどないため、ストレスはかなり少ない。

英語の変換に対応

 このように「変換させっぱなし」を究極の状態とするのであれば、避けて通れないのが英語の入力サポートだろう。英語は本来、IMEの入力では対応外となっていたが、“国際化”の進む現在では、英語由来のカタカナ語や英単語そのものを文章中に使うことは一般的になっている。そのため、効率化を考えるのであれば、IMEを有効にしたまま英語を使うこと、さらに言えば英語処理にも日本語処理のようなインテリジェンスが求められることになる。

 ATOK 2009から搭載された英語入力支援機能「ATOK 4E」は、従来の「英字入力モード」を「英語入力モード」に進化させたもので、英数キーを押す、あるいはShiftキー+英字で半角アルファベット入力の推測候補モードに切り替わるというものだった。これを使えば「thank you」だけで「Thank you for your quick response.」を候補に出すなど、省入力が可能だ。特に、英語が不得手な場合は「あるべき文」が分からないこともある。そういったときに推測候補が例文集として役立つことも多いだろう。

 また、ATOK 2010から搭載された「英単語つづりからのカタカナ語変換」も重宝する機能だ。特にIT業界ではスクリプトやプログラムを書くときには英語、ドキュメントを書くときにはカタカナで書く単語もたくさんある。例えば、internet(インターネット)やnetwork(ネットワーク)、mail(メール)、server(サーバ)、process(プロセス)などなど、単語が簡単であるだけについつい英単語で書いてしまうことも多いのではないだろうか。

英単語つづりで入力した文書の例。IT業界的にはそれほど珍しくない英単語含有率だ(画面=左)。ルー大柴氏の公式ブログ「TOGETHER」の記事から引用。同氏の英語率は(意外にも?)IT業界レベルなのだ(画面=中央/右)

 一方、ATOK 2009からの機能だが、逆にローマ字単語を英単語に変換することもできる。これはまさしくかな漢字変換の英語版とも言える機能で、英語入力の際に分からない単語はローマ字でそのまま入力し、かなを漢字に変換するようにF4キーで英単語に変換すればいい。例えば、「I'll go to the konbini」と入力すれば「I'll go to the convenience store」と変換してくれる。

途中までの入力でよく使う言い回しなどが候補表示される(画面=左/中央)。ローマ字入力による英語変換は人名などもサポートする。「jakuri-n(ジャクリーン)」が「Jacqueline」に変換できる(画面=右)

 さらに「ATOK 2010 for Windows [プレミアム]」には「8カ国語Web翻訳変換 for ATOK」機能が提供されている。英語だけでなく、中国語、韓国語、フランス語、ドイツ語、イタリア語、スペイン語、ポルトガル語の全8カ国語への変換をWebサービスを利用して行う。インターネット接続環境が必要になるものの、入力していくそばから翻訳文が表示されるのはかなり快適だ。

 このように見ていくと、ATOKの英語対応機能は大きく2つあることが分かる。1つは英語として入力された単語を日本語(カタカナ語)に変換するもの、そしてもう1つは日本語として入力された単語を英語に変換するものだ。つまり、日本語の中の英語、英語の中の日本語の両方をサポートしている。今後もシームレスな多言語入力環境としての発展が期待できそうだ。

8カ国語Web翻訳変換はインターネット接続環境が必須(画面=左)。Web翻訳変換機能を提供しているクロスランゲージは、「Inforseekマルチ翻訳」「Yahoo!翻訳」にも技術提供している(画面=右)

       1|2|3|4 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

最新トピックスPR

過去記事カレンダー