ZOZOテクノロジーズは9月2日、服のコーディネート約255万件とアイテム約200万件などを含むデータセット「Shift15M」をオープンソースとしてGitHubで公開したと発表した。服の流行が変化してもAIの認識精度を高く保つための研究への活用を見込む。
公開したデータは、服のコーディネートを試せるアプリ「IQON」で2010〜2020年に投稿されたコーディネート情報や、投稿日時、「いいね」の数、ジャンルやカテゴリー情報、機械学習用に付与したラベルなど。
同社によると、ファッション関連のデータは流行の変化や新製品の登場によってデータの分布が変わる「分布シフト」という現象が起き、AIによる認識精度が低下する。分布シフトはファッション以外の分野でも起きるが、これまでデータセットの不足で研究が進まなかったという。
Shift15Mと合わせて、10年間のコーディネートの傾向を基に分布シフトの再現実験などができるソースコードのセットも公開した。分布シフトが発生する条件下で「いいね」数や価格などの推移を分析でき、分布シフトの解決策を探るのに役立つという。
ZOZOTOWNのファッション推薦データ、オープンソースで公開 アルゴリズム開発基盤も
「マスクを着けた日本人」の画像1000枚セット、機械学習用にピクスタが発売
rinna、日本語に特化した「GPT-2」の言語モデルをオープンソース化 学習済みモデルも公開
AIチャットbotを200件のデータで構築 従来の60分の1に 「りんな」開発元が新技術
「どんな文章も3行に要約するAI」デモサイト、東大松尾研発ベンチャーが公開 「正確性は人間に匹敵」Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR