“かゆいところに手が届く”日本発のオフィススイート――ジャストシステム「JUST Suite 2008」続報今度のATOKはどうだ!?(1/3 ページ)

» 2008年02月15日 17時17分 公開
[松井幹彦,ITmedia]

変換エンジンを強化して体感精度の向上を果たした「ATOK 2008」

 前回のレビューでは「JUST Suite 2008」に含まれる「SuiteNavi」と「一太郎2008」を取り上げたが、今回はATOK 2008、花子2008、三四郎2008、Agree 2008、Shuriken 2008といったソフトウェアの進化点を見ていく。まずは一太郎と並ぶ同社の看板である、日本語入力システム「ATOK」の最新版を取り上げる。

変換エンジン「ATOKハイブリッドコア」が強化された

 このATOK 2008は、なかなか表面上に現れにくい“縁の下の力持ち”的なアプリケーションであるが、JUST Suite 2008の中で最も変化したものと言っていいかもしれない。というのも、長年ATOKが使用してきた「n文節最長一致法」という、かな漢字変換の基本アルゴリズムを見直し、統計的言語処理手法を中心としたものに強化されたからだ。

 「n文節最長一致法」というのは、変換対象の文字列を分解したときに、最も長くとれるn文節(通常は2文節程度)を優先するというアルゴリズムだ。多くの場合は、この方法で正しい変換結果を得ることができる。しかし、当然ながら例外も発生する。これまでATOKは、そういった例外をいろいろな方法で処理することによって、高い変換精度を得てきた。

 同社の資料によれば、主に「単語や品詞の出現頻度」を数値化して組み合わせてきたということだ。ATOK 2008では、これをさらに推し進めて、「出現頻度のほかにも多くの言語的性質」を数値化して、それらを「1つの評価軸の上に積算する」ことによって、高い変換精度を得ることができたという。

 この数値化の積算による手法には、特別な名称はつけられていないようだ。同社資料では、単に「統計的言語処理手法」として説明されている。とはいえ、基本アルゴリズムが変更されたことによって、変換精度が明確に向上したというのが、筆者の印象だ。

 同社の発表資料に次のような具体例が挙げられている。

 ATOK 2007 知覚し/冗長さを/行う

 ATOK 2008 近く/市場/調査を/行う

 

 ATOK 2007 自治/大別

 ATOK 2008 自治体/別


 なるほど、確かに「n文節最長一致法」を超えて、ATOK 2008の変換の方が優れていることが分かる。さらに、次のような例でも、変換精度のアップが確認できた。

 ATOK 2007 多くのと/子細/製磁業/

 ATOK 2008 多くの/都市/再生/事業/

 

 ATOK 2007 がら空き/万丈に/

 ATOK 2008 ガラス/基板/上に/


 基本アルゴリズムの見直し以外にも、変換精度を高めるためのいろいろな処置が行われた。最新用語を追加して辞書を拡充したのはもちろんだが、「共起用例による同音語の訳し分け」の強化や、「話し言葉の変換」を一般モードに取り込むといった処置もなされている。

 特に、よく使われる話し言葉を一般モードに取り込むことによって、自然な軟らかい表現が(「話し言葉」モードに切り替えることなく)、そのまま変換できるようになったのは意義深いと感じる。具体例を挙げておこう。

 ATOK 2007 帰りに/雨に/降られ/地/末端だ

 ATOK 2008 帰りに/雨に/降られちまったんだ

 

 ATOK 2007 真/姉、/ちょっと/み/すっただけ/差

 ATOK 2008 まあね、/ちょっと/ミスっただけさ


ユーザビリティの向上とATOKダイレクトの実装

文節をさかのぼって確定アンドゥが可能になった。画面の一番上は変換して確定した直後の状態で、Ctrl+Backspaceキーを押すと最後の句読点だけが未確定状態に戻り、Ctrl+Backspaceキーを押すたびに前の部分が未確定状態になるのが分かる

 変換精度についての話が長くなってしまったが、使い勝手の面での改善点を2つほど挙げたい。まず、確定アンドゥの繰り返しが可能になっている。

 「確定アンドゥ」というのは、変換キーを押し、その結果をよく確認しないで確定してしまったというときに利用する機能だ。確定直後に「Ctrl」+「Backspace」キーを押すことによって、未確定状態に戻して変換をやり直すことができる。この機能は、これまで、直前の1文節についてのみ可能だったが、ATOK 2008では繰り返してCtrl+Backspaceキーを押すことによって、文節をさかのぼって未確定部分を追加していくことができるようになった(未確定文字が100文字まで)。

 実は、筆者は、この機能をとても気に入っている。というのも、変換後に句読点を入力するクセがあるので、従来は、確定アンドゥが末尾の句読点にしか働かないということが多かったのだ。これで、心おきなく、自分のスタイルで入力と変換ができるようになった。実際に、この原稿の入力でも、新機能のありがたみを実感することができた。

 もう1つ、新しい機能を紹介しよう。「ATOKダイレクト」と呼ばれる機能だ。

 これまで「ATOKバリューアップサービス[ベータ]」として提供されてきた、ATOKの機能を拡張する仕組みで、ATOKの中からWebをはじめとして、ほかのアプリケーションのデータや、HDD内のデータベースなどを検索できるようにするためのフレームワークだ。単独で働く機能ではなく、いろいろなプラグインを受け入れるための仕組みである。

 現在、ATOKのWebサイトから以下のプラグインがダウンロード可能だが、いずれもβ版としての提供であり、ATOK 2008 for Windows向けサービスは2009年3月31日で終了となるのは覚えておこう。

 なお、このプラグインは今後も追加される予定で、プラグイン作成ツールも公開されることになっているが、現時点で提供時期は未定とのことだ。

新たに実装された「ATOKダイレクト」の構造図(写真=左)。「ATOKダイレクト for goo」の使用例(画面=中央)。ATOKから、インターネットとローカル情報の双方を気軽に参照できるのがポイントだ。昨年の発表会では4つのパートナーが紹介されたが、現時点でYahoo!JAPANのプラグインは公開されていない(写真=右)

 ところで、ATOKは連携電子辞典機能を持っており、別売の電子辞典を利用できる。この操作性が向上し、候補ウィンドウの上部に表示されるタブで、対応する辞典をワンタッチで切り替えられるようになり利便性が向上した。また、候補ウィンドウのデザインも3種類から選べる。

 専門用語変換辞書や電子辞典のラインアップは豊富で、「明鏡国語辞典・ジーニアス英和/和英辞典 /R.3 for ATOK」と「会社四季報 企業名変換辞書 for ATOK」などがセットになった[プレミアム] や、10年ぶりに新版が発売された「広辞苑 第六版 セット」などのパッケージも用意されている。

電子辞典などとの連携が強化され、候補ウィンドウでEndキーを押すと辞書が切り替えられるようになった(画面=左)。候補ウィンドウのデザインが3種類用意され、好みのタイプが選べる(画面=右)。左から標準、クラシック、ミニマルだ

 続いては、表計算ソフトウェア「三四郎2008」をチェックする。

       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2024年03月29日 更新
  1. ミリ波レーダーで高度な検知を実現する「スマート人感センサーFP2」を試す 室内の転倒検出や睡眠モニターも実現 (2024年03月28日)
  2. ダイソーで330円の「手になじむワイヤレスマウス」を試す 名前通りの持ちやすさは“お値段以上”だが難点も (2024年03月27日)
  3. Synology「BeeStation」は、“NASに興味があるけど未導入”な人に勧めたい 買い切り型で自分だけの4TBクラウドストレージを簡単に構築できる (2024年03月27日)
  4. 「ThinkPad」2024年モデルは何が変わった? 見どころをチェック! (2024年03月26日)
  5. ダイソーで550円で売っている「充電式ワイヤレスマウス」が意外と優秀 平たいボディーは携帯性抜群! (2024年03月25日)
  6. 次期永続ライセンス版の「Microsoft Office 2024」が2024年後半提供開始/macOS Sonoma 14.4のアップグレードでJavaがクラッシュ (2024年03月24日)
  7. 日本HP、個人/法人向けノート「Envy」「HP EliteBook」「HP ZBook」にCore Ultra搭載の新モデルを一挙投入 (2024年03月28日)
  8. サンワ、Windows Helloに対応したUSB Type-C指紋認証センサー (2024年03月27日)
  9. あなたのPCのWindows 10/11の「ライセンス」はどうなっている? 調べる方法をチェック! (2023年10月20日)
  10. レノボ、Ryzen Threadripper PRO 7000 WXシリーズを搭載したタワー型ワークステーション (2024年03月27日)
最新トピックスPR

過去記事カレンダー