ITmedia NEWS > 科学・テクノロジー >
ニュース
» 2018年06月20日 17時38分 公開

企業・大学の研究連携には限界も? 「オープンサイエンス」の利点と課題

国立情報学研究所(NII)などが6月18日〜19日に開催した「JAPAN OPEN SCIENCE SUMMIT 2018」で、LIFULL、リクルートテクノロジーズ、クックパッド、京都大学、筑波大学が、オープンサイエンスの一環で企業データを公開することの意義や、大学がそれを用いて研究することの利点や課題について議論を交わした。

[井上輝一,ITmedia]

 「オープンサイエンス」という取り組みがある。研究素材となるデータや研究結果を誰でも閲覧可能にし、プロセスの透明化や、企業と大学の共同研究などを推進する活動のことだ。

 国立情報学研究所(NII)などが6月18日〜19日に開催した「JAPAN OPEN SCIENCE SUMMIT 2018」で、LIFULL、リクルートテクノロジーズ、クックパッド、京都大学、筑波大学が、オープンサイエンスの一環で企業データを公開することの意義や、大学がそれを用いて研究することの利点や課題について議論を交わした。

リクルートテクノロジーズの「データを公開する意義」

企業側は「新たな知見」 一方で「高いコスト」「競合リスク」も

 企業側から挙がったオープンサイエンスの利点は、(1)企業にはない視点で自社データを研究してくれる、(2)短期的には実用的ではないが、長期的には新たな事業の可能性となる、(3)企業の人材採用や広報活動として効果がある、など。

LIFULLの清田陽司主席研究員

 不動産情報サービス事業を担うLIFULL(東京都千代田区)の清田陽司主席研究員(研究開発部門・LIFULL Lab所属)は、オープンサイエンス実践の課題について「データを提供する際は、ステークホルダーやエンドユーザーからの理解を得なければならない。提供データをそろえるコスト、競合企業を利するリスクなど課題はある」と分析した上で、「それでも、実践する意義はある」と続ける。

「それでも民間企業がオープンサイエンスを実践する意義」

 「大学としては『企業からの個別相談への対応はもう限界』という現状もある。同じ課題を共有するコミュニティーを形成することで、大学がその課題を研究する動機付けにもなる。また、競合同士でも協力することで研究開発費の有効活用にもつながる」(清田主席研究員)と説明する。

 同社は、不動産・住宅情報サイト「LIFULL HOME'S」で収集した約530万件の賃貸不動産物件データを15年11月から提供しており、国内外の50を超える研究組織に利用されたという。

 その結果、「キッチン」に間違えて屋外の画像が登録されてしまうのをディープラーニングを用いて検出する研究や、間取り図から3Dモデルを生成するといった研究が生まれた。

ディープラーニングを用いた画像誤登録の検知や、間取り図から3Dモデルを生成する研究など
リクルートテクノロジーズ広報の櫻井一貴さん

 リクルートテクノロジーズ広報の櫻井一貴さんは、「大学にデータを提供することで、ビジネスに最先端の研究結果を接続できる。また、学生向けのハッカソンを行うことで人材の獲得にもつながる」と利点を述べる。

 一方で、「データの公開にはリソースが必要で、それが不足している。大学に『面白いデータ』を提供できれば、研究成果の質が向上し、データ提供の賛同者が増える。賛同者が増えればリソースが増え、より面白いデータが提供できるようになるのだが」(櫻井さん)と、社内のリソース不足に課題があると明かす。

公開に関して感じている課題

データ提供のメリット、なくなりつつある?

クックパッドの原島純マネジャー

 「データを提供するメリットが、企業側になくなりつつある」と問題提起するのは、クックパッドの原島純マネジャー。

 クックパッドはレシピデータや献立データをオープンデータとしており、86の大学で利用される実績の他、料理画像や食材画像を機械学習で認識するコンペティションなども行っている。

料理画像での画像認識コンテストを開催

 そうした成果はありつつも、外部に提供する研究テーマの設定が難しいことや、コンペの準備に割くリソースがないといったコスト問題、さらには人材が大学から企業へ徐々に移動していることを指摘する。

「民間企業データによるオープンサイエンスは必要?」

 「機械学習ライブラリなど種々のツールも充実してきた。人も大学から企業に移ってきている。と来れば、外部にデータを提供しなくても大体のことは自社で研究開発できるのでは」(原島マネジャー)

 また、「今のオープンサイエンスで心配しているのは、誰が困っているのか分からないということ。実は誰もあまり困っていないのではないか」とも。大学と企業が互いに人材を派遣し、継続的に意見交換をすることで、見えていなかったお互いの課題が分かるのではないか――と提言した。

大学には「貴重なデータ」だが使いにくさも 引き抜きリスクも深刻

 大学側は、「企業の現実的なタスクや貴重なデータを得られること」を主な利点として挙げる。

筑波大学の佐藤哲司教授

 筑波大学の佐藤哲司教授は、これまでYahoo!知恵袋のデータや、クックパッドのデータセット、楽天の「楽天市場」や「楽天トラベル」のレビュー記事のデータセットを用いて研究してきた。

 例えばYahoo!知恵袋の回答者に注目し、第一回答者とベスト回答者をカテゴリーごとに比較したり、クックパッドのレシピデータから多くの料理に使える調理法や食材を見つけ、調理スキルを学ぶゲームのようなエンターテインメントを提案したりするなど成果を上げてきた。

料理レシピを用いた研究事例

 企業からのデータ提供には感謝している一方で、提供されたデータで遂行できる研究課題の選別や、そうして設定した課題が真に有用なのかということに不安があるとも佐藤教授は語る。

京都大学の加藤誠特定助教

 京都大学の加藤誠特定助教は、自身がプログラム委員長を務める、情報基盤の提供や共有、研究、検証、評価し合うNIIのフォーラム型プロジェクト「NTCIR」(エンティサイル)を例に挙げる。

 「アカデミック版Kaggleのようなもの」(加藤特定助教)というNTCIRでは、企業が求める研究をタスクとして公開し、大学など研究機関がそのタスクに参加することで互いに知見を得て論文を書けるというもの。

 データや研究課題を企業が提供するコストや効果について、加藤特定助教は「NTCIR、Kaggle、データのみ公開、の3つの方法でそれぞれ異なる」としている(※Kaggle:データ分析や機械学習に関するさまざまなコンペに参加できるプラットフォーム)。

企業がデータを公開する方法とその効果

 NTCIRは社会へのプレゼンスには欠ける一方で長期的な問題解決に向き、KaggleはNTCIRほど長期の問題解決には向かないが社会的プレゼンスの向上が見込めるという。大学と企業が課題とデータを共有するという意味では近しい2つのプラットフォームだが、得られる効用が異なるという分析だ。

 一方で、どちらの場合もデータの他に課題の共有コストまで掛かるため、リソースを抑えたいのであればデータのみの公開という方法になるという。ただし、データのみの公開ではNTCIRやKaggleほど研究促進や課題解決、プレゼンス向上は見込めず、リスクだけが顕在化することも加藤特定助教は指摘している。

大学からの人材流出と研究の短期化

 セッションの座長であるNIIデータセット共同利用研究開発センターの大山敬三センター長は、クックパッド原島マネジャーが指摘した大学からの人材流出について「大学から企業に人が移っているのは深刻な話」と現状を認識。

 「今の大学が置かれている状況ではどんどん短期的な成果を求められるようになってきて、企業とやっていることが変わらなくなってきている。すると企業はわざわざ大学に頼む理由がなくなる。大学はもっと長期的に見て役に立つかもしれないということを研究しないといけないのではないか」と今の大学研究の問題点を明かした。

 また、LIFULL Lab清田主席研究員は「人を育てるのは大学。企業としても中長期的に見れば、大学で人を育てないと結局企業が損をする」と大学での人材育成の重要性を強調した。

Copyright © ITmedia, Inc. All Rights Reserved.