「Yahoo!知恵袋」の不快な投稿、見えないところへ わずか1日で6億件を処理 ヤフー社内で何が起きたのか(2/2 ページ)
Q&Aサービス「Yahoo!知恵袋」は長い間、不快な内容だが規約違反ではなく削除できない「グレーな投稿」に悩まされてきた。解決するための処理には約9カ月かかると思われていたが、わずか1日強で完了したという。何が起きたのか。
9カ月かかる演算、kukaiを使ったらどうなった?
kukaiは、2017年6月に発表されたヤフー初のスーパーコンピュータ。電気を通さない特殊な液体に直接ハードウェアを漬け込む「液浸」という効率的な冷却方法を採用しており、スパコンの省エネランキング「GREEN500」では世界2位を獲得した(2017年6月時点)。演算処理能力は、GPUサーバを使った同社のディープラーニング環境と比べて理論上約255倍という。
清水さんたちはkukaiのリソースの半分(40nodes/80GPU)を使用し、投稿判定システムを起動。すると、完了までにかかった時間は1日強。もともと約9カ月かかると想定していた処理時間を、約200分の1に短縮できた。
検出したグレーな投稿は、トップページなど人目につくところでは非表示にした。その効果はヤフー社内でも実感しているという。「ユーザーのアンケートでも『知恵袋の内容が良くなっている』という反応があった」と丹羽さんは言う。
「今回は、アダルトカテゴリー以外に掲載されているアダルトな内容などをグレーな投稿としたが、低品質な投稿は他にもある。信頼してサービスを使ってもらうためにも、常にサービス側が努力し続ける必要がある」と丹羽さん。判定の精度をさらに高めるなど、今後もYahoo!知恵袋の改善を続ける考えだ。
「これまでなら数カ月かかっていた機械学習にkukaiを使い、1〜2日で終わらせるような試みも進めている。より大規模で高性能なモデルを短期間で学習させて、本番環境に投入していきたい」(清水さん)
関連記事
- スパコン初心者のヤフーが省エネ性能世界2位の「kukai」を作るまで
2017年6月に発表されたヤフーのスーパーコンピュータ「kukai」。省エネ性能世界2位を誇り、より大規模なディープラーニング処理を従来より低コストで行える。しかしヤフーは、もともとスパコンを作るつもりではなかったという。 - ヤフーがスパコン「kukai」開発 ディープラーニングに特化 世界2位の省エネ性能
ヤフーが、スーパーコンピュータ「kukai」(クウカイ)の開発を発表。短時間・低コストで、大規模なディープラーニング処理が可能だという。 - スパコン「京」後継機、100倍の性能に CPUの仕様、富士通が発表
スーパーコンピュータ「京」の後継機(ポスト京)に搭載するCPU「A64FX」は、倍精度(64ビット)浮動小数点演算のピーク性能は2.7TFLOPS以上。ポスト京は、従来の京と比べて最大100倍の実行性能を目指す。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.