「たなかたろう」を「田中太郎」とすぐ判断 選挙の開票作業を救う「分類機」の仕組みとは業界シェア率8割(1/3 ページ)

» 2022年07月10日 08時45分 公開
[樋口隆充ITmedia]

 安倍晋三元首相が応援演説中に元自衛官の男に暗殺されるという衝撃的な事件に日本中の注目が集まる中、7月10日に参議院選挙の投開票が行われる。参院選の開票作業において、活躍が期待されるのが、ムサシ(東京都中央区)が手掛ける選挙機器だ。中でも、有権者が記入した投票用紙の文字を識別し、候補者ごとに自動で分類する「投票用紙読取分類機」(以下分類機)は、開票作業の効率化に大きく貢献している。分類機の仕組みなどを同社に取材した。

photo 投票のイメージ(提供:ゲッティイメージズ)

OCRで手書き文字を自動識別

 現行の選挙制度では、投票用紙に候補者や支持政党名を手書きで記入する仕組みを採用している。大規模自治体の首長選挙や国政選挙ともなると、開票数はかなりの数となる。地味ながら、スピードと正確さの両立が求められる開票作業で、作業を“半自動化”する分類機が果たす役割は大きい。

 投票用紙の記載内容では、筆圧の強弱、文字の大小、記入位置などでさまざまなケースが想定される。ひらがなの場合、「続け字」などの癖も生じる。その記載内容を正確に識別し、自動分類する仕組みの要となっているのが、独自に開発したOCR(光学文字認識)の技術だ。

 OCRは手書き文字をスキャナーなどで読み込み、デジタル情報に変換する技術を指す。同社の選挙事業を担当する、藤井俊輔選挙営業本部長によると、識別には大きく2つの段階があるという。

photo 分類機(ムサシ提供)

 1つ目が候補者氏名のパターンチェックだ。まず、各候補者名を名字と名前に分割し、漢字・ひらがなで想定される書き方を20パターンほど生成。OCRで投票用紙に記載された文字との一致率を計測する。

 1段階目で識別した記載内容を膨大なデータを蓄積したデータベース(DB)と照合し、最終的に分類機側で投票用紙の内容を識別。候補者ごとに分類するという仕組みだ。同社の公式Webサイトによると、毎分660枚の投票用紙を自動で分類するという。

       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.