Google、New York Timesの数百万枚の報道写真をデジタルライブラリ化

GoogleとNew York Timesは、同メディアが1896年からキャビネットに保管している500万〜700万点の写真やニュースクリップをデジタル化し、検索可能なライブラリにするプロジェクトを立ち上げた。印画紙裏の手描きメモもCloud Vision APIで読み取り、情報化する。

» 2018年11月12日 11時39分 公開
[佐藤由紀子ITmedia]

 米Googleと米The New York Timesは11月9日(現地時間)、New York Timesが保有する500万〜700万枚もの写真やニュースクリップをデジタル化し、検索可能なライブラリにするプロジェクトの立ち上げを発表した。

 最も古いものは19世紀(1896年)にさかのぼるという同メディアの写真資料は、本社近くのビルの地下3フロアにある「死体安置所」と呼ばれる倉庫に保管されている。これらをスキャンしてGoogle Cloudにアップロードし、Cloud Pub/Sub、Google Kubernetes Engine(GKE)、PostgreSQL、Cloud SQLなどを使ってデータベース化する。

 nyt 1 New York Timesの写真保管庫、通称「Morgue」

 印画紙として残っている写真の裏には日付やどの記事で使われたかなどの情報が手書きや記事の切り抜きで記されている。これらもスキャンし、Cloud Vision APIでテキストを読み取り、写真の情報として保存する。

 nyt 2 写真の裏の手描き文字をCloud Vision APIでテキスト化

 New York Timesは、「Google Cloudの技術は、われわれの貴重な歴史を保存し、ジャーナリストに数百万の歴史的写真を検索、アクセス、分析してそれらに新た命を与える方法を提供するのに役立つ」と語った。


Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ