毎分250ページ、東大とDNPが共同開発した非破壊型高速ブックスキャナーとは?

2010年に始まった、東京大学 石川渡辺研究室と大日本印刷による高速ブックスキャナーの共同開発。電子書籍の未来を担うかもしれないこの高速ブックスキャナーについて、DNPの開発担当者と渡辺義浩講師に話を伺った。

» 2015年04月09日 06時00分 公開
[宮澤諒eBook USER]

 2月16日、東京大学の石川渡辺研究室と大日本印刷(DNP)が共同開発した高速ブックスキャナーの試験運用がスタートした。

 DNPは2010年、国会国立図書館のデジタルアーカイブ事業に参画しており、戦前から1968年までに発行された書籍や雑誌の電子化を担当。約48万冊もの膨大な資料を数社で分担して電子化したが、スキャンは手めくりで行われたこともあり、作業スピードやスキャンの正確性(誤ってページを2枚めくってしまうなど)に課題が残った。

 そういった課題を抱える中で、石川渡辺研究室が開発を進めていたスキャナーの動画がDNP担当者の目にとまった。それこそが現在開発を進めている非破壊型高速ブックスキャナーだ。

 高速度カメラで対象物を1秒間に約500回撮影して紙の形状を認識し、独自のアルゴリズムに基づき計算されたタイミングで、別の高解像度カメラでページ画像を撮影。これらの画像にリアルタイムで3次元補正を施すことにより、1分間に約250ページという高速スキャンを実現した。DNPの開発担当者と渡辺義浩講師に話を伺うことができたので、スキャナー本体の写真や稼働している様子と併せて紹介しよう(写真は、石川渡辺研究室の開発機)。

共同開発に生かされた両社の強みとは

非破壊型高速ブックスキャナー 非破壊型高速ブックスキャナー

―― 共同開発のこれまでの経緯を教えてください。

DNP開発担当者(以下、DNP) 共同開発は2010年の秋ごろからスタートしました。改良を重ね、2012年11月に基本的な知見を得られたということで試作機を作り、図書館総合展で発表しました。

 その後、読み取りの精度を上げるなど機能改善を図っていたのですが、この度、東京大学附属図書館のスキャン業務を受託することになり試験運用をスタートしました。

―― 試験運用ではどういった本をスキャンする予定ですか?

DNP 図書館内のすべての蔵書となると膨大な数になりますし、著作権の問題も絡んできますので、今回は東京大学に過去所属した教員の著作物を中心に100冊ほどをスキャンすることになっています。

―― 開発を進める中で、DNP側ではどういった強みを生かしたのでしょうか。

DNP わたしどもは画像処理や照明、紙をめくる技術などを持っていますので、そういったものと石川渡辺研究室が持つ高速画像処理技術が上手く融合できた感じです。スキャナーは、プロトタイプから既にかなりできのよいものでした。

―― 2012年の段階では、2013年から実用化していくと発表されていましたが、遅れてしまっている原因はどこにあるのでしょうか。

DNP 画像のゆがみを改善することと、保存に適した形状に加工する技術開発に時間が掛りました。また、弊社としても試験的にいろいろな書籍をスキャンしていきたいと考えていますが、そこにはどうしても著作権の壁があります。今回はパブリックドメインの書籍をスキャンさせてもらっていますが、試験運用をする中で、また新たな問題が生まれているのが現状です。まだまだ、いろいろなものを試すことができていないですね。

―― そうなると、本格導入はいつごろになりますか?

DNP 今年の夏から秋ごろに掛けて試験運用の内容をフィードバックしていく予定でいます。

―― スキャナーの活用法としてはどういったものを想定しているのでしょうか。図書館流通センター(TRC)での利用も考えられていますか?

DNP TRC以外にも企業情報のアーカイブなどさまざまな案件がありますので、そういった中でこちらのスキャナーが適している案件があれば受託しようと思っています。

 このスキャナーを使うことが目的なのではなく、弊社にはさまざまなスキャナーがありますから、お客さまのニーズに合わせて適切なものを使用し、要望に合わせた最適なコンテンツを提供していきます。選択肢が広がるという意味で捉えていただければと思います。

ブックスキャナーが稼働する様子を見せてもらった

非破壊型高速ブックスキャナー
1秒間に500回の速さで紙の形状を撮影
5本の赤外線レーザーにより紙の形状を認識する
スキャンの様子はPC上にリアルタイムで表示される
ハードカバーを撮影する場合には表紙をカバーの下に収納する必要がある。手めくりでの撮影にも対応しており、ページをめくると自動でシャッターが切られるようになっている

 A4サイズまでの本を撮影可能。本の背を挟むような構造になっており、最大5センチまで対応している。解像度は400dpi。

 撮影したページは画像形式で保存され、必要に応じてOCR(光学文字認識)をかけることもできる。画像は現在のところモノクロのみ。カラーだとどうしても影が発生してしまい、色味が変わってしまうのだという。将来的にはカラーにも対応したいとしている。

 また撮影の精度は、本の状態で異なるが、新刊や状態がよい本であれば100%に近い精度でスキャンでき、人がページをめくってスキャンするよりも高い精度を期待できるという。

高速スキャンという新たなニーズ、渡辺講師に聞く

―― どういった経緯でスキャナーを開発することになったのでしょうか。

渡辺義浩講師(以下、渡辺) こちらの研究室では、3次元の形状を1秒間に1000回(通常のビデオカメラでは秒間30回程度)というスピードで画像処理をする技術を持っておりまして、ロボットや検査などに応用しています。

 これまではこの技術を、静止した物体の形状を詳細に撮影するといった目的で利用していましたが、非剛体(編注:大きさを持ち、形状が変化するもの)を撮ることで、例えば本をめくっている様子が見ることができるのではないかと考えたのがスキャナー開発に至ったきっかけです。

―― 開発を続ける中で新たに気付いたことはありましたか?

渡辺 もともとそういった経緯で始めたので、本のスキャンに関しては素人だったんですけど、実は大変ニーズがある分野だということが開発を進めるにつれて分かってきました。

 これまでに開発されたページめくりの技術というと、楽器奏者のために楽譜をめくったりだとか、寝たきりの人のために本をめくったりといったことが中心で、人間の目に見えない速度でめくるというのはそもそもニーズがなかった。新しいフィールドなのだと思います。

―― これからスキャン開発で得られた技術を活用してどのようなことをやっていきたいですか?

渡辺 高速の画像処理というものが、書籍の電子化だけでなく産業界に非常に大きな影響を与える可能性があるということが分かってきましたので、そういった分野での応用をこれからも続けていく予定でいます。



Copyright © ITmedia, Inc. All Rights Reserved.