コラム
» 2019年03月06日 07時00分 公開

「気持ちが乗らず書けない」とはもうオサラバ?:iPhoneを使った音声入力、試して分かったメリット (1/3)

スマートスピーカー連載でおなじみの山口真弘さんに、近年試されているという音声入力について、そのトライ&エラーを含めて語ってもらった。

[山口真弘,ITmedia]

 ここ数年、劇的に精度が向上したのが音声入力だ。筆者自身、かつてはキーボードひとつあれば音声入力など不要という考えだったが、ある日たまたま音声入力を使ってみてその精度に驚き、今やほぼ全ての原稿で、何らかの形で音声入力を使っているほどだ。

 音声入力はそのツールを含めてやり方も千差万別ゆえ、実際に音声入力を使いこなしている人にそれらのノウハウを尋ね、必要に応じて自分のやり方に取り入れていく行為が、なかなか刺激的でもある。今回はまず筆者自身について、現時点での音声入力の活用方法や、筆者が考える音声入力のメリットについて紹介したい。

音声入力で下書き、PCで整形

 筆者の音声入力の使い方は、主に2種類に分けられる。1つは普段執筆している、IT関連の製品やサービス、アプリケーションといったレビューの下書きだ。

 以前はこういった原稿の下書きはPCで行っていたが、現在はレビュー用の製品やサービスを実際に使いながら、気付いたことや感じたことを、iPhoneの音声入力でどんどん書きためていく。それらが一区切りついたところでPCを使って整形し、1本の原稿にまとめるフローだ。

 両手を使って製品やサービスを試しながら、キーボードで書き続けるのは大変なので、それが音声でできるのは非常にありがたい。個々のケースごとの挙動を逐一記録していく用途ではなおさらだ。

音声入力 音声入力にはiPhoneを使用している。筆者が軽量なiPhone SEを愛用しているのは、音声入力で長時間持ったままでも負担にならないという理由が大きい

 とはいえiPhoneを使う以上、どうしても片手はふさがってしまうので、どちらかというと一定期間試用して頭の中である程度の評価がまとまってから、一気に書き出すことのほうが多い。分量的には1000〜3000字、多ければ5000字程度にも達することがあり、結構な量だ。こちらは継ぎはぎするというより、削りながらまとめていくというフローになる。

 これらの作業は就寝時にベッドに入ったあと眠くなるまでの時間や、駅から目的地に徒歩でたどり着くまでの数分〜十数分という移動時間を活用して行うことが多い。後者の場合、あまりにも人が多いとちゅうちょするが、そうでなければ電話で話しながら歩いているのと変わらないし、環境音の影響も(皆無ではないが)それほど受けることもない。

辞書を用いて音声入力での誤入力を一気に置換

 音声入力に使うiPhoneには、マイクなど特別なツールは使っていない。iPhoneを口のそばに近づけ、しゃべり続けるだけだ。iPhoneの音声入力は一定時間が経過するとマイクがオフになるので、たまに画面を見てきちんと入力されているかを確認し、止まっていたらマイクボタンを押す、という操作を繰り返す。

音声入力 iPhoneでの音声入力。アプリはメモでも構わないが、筆者はDropboxと同期する関係上、Dropboxと連携できるテキストアプリ「Textforce」を使用している
音声入力 Androidを使った音声入力画面。iOSでなくAndroidでも構わないのだが、iPhoneの音声入力に慣れてしまっていると、句読点の入力や改行できないのがやや苦痛だ

 音声で入力した原稿はDropbox経由でアップロードされ、PCで推敲(すいこう)を行う。iPhoneで完結させるのではなくPCにバトンタッチする理由は、キーボードを使っての作業効率が高いことに加えて、「語句の置換」が容易に行えるのが大きい。

 音声入力は、同じ単語を繰り返し間違える。例えば筆者の原稿で頻出する「NAS」という単語は、きちんとアルファベットに変換された例はほぼ皆無だ。必ず「ナス」「茄子」のどちらかになる。これは学習機能が弱いこともあるが、用語の専門性の高さを考えると、ある程度はやむを得ない場合も多い。

 もっとも筆者のように特定ジャンル(ここではIT系)の原稿を繰り返し書いていると、そこで使われる単語も同じものを繰り返し使うため、結果的に「毎回同じ単語を入力し、毎回それを間違う」形になる。これを手動で修正していくのは明らかに効率が悪い。

       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

この記事が気に入ったら
ITmedia Mobile に「いいね!」しよう