ニュース
» 2018年02月22日 08時00分 公開

約3億人のデータを保持する「Twitter」は、人工知能をどう活用しているのか (3/3)

[池田憲弘,ITmedia]
前のページへ 1|2|3       

リアルタイム性を担保する「知識の蒸留」

 このようにTwitterでは、人工知能の活用が進んでいるものの、深層学習を始めとして膨大なマシンパワーが必要な処理が多い。処理の負荷が高まれば、それだけ処理が遅くなり、待機時間が長くなってしまう。

 先ほど挙げた、画像の自動トリミング処理では、処理速度を上げるために「知識の蒸留(knowledge distillation)」と呼ばれる方法で、処理数を減らしている。これは、大きくて複雑なニューラルネットの学んだ知識や推論結果を、小さくて軽量なモデルの学習に利用する(継承する)というもので、精度は下がるものの、実用には耐えられるレベルになるという。

 トリミングの範囲を決めるだけならば、数ピクセル単位の細かいチューニングは必要ない。さらに演算能力を無駄に浪費する処理を除去する「剪定(せんてい)」という処理も加え、トリミングのスピードが従来比で10倍になったそうだ。「こうしたディープラーニングにおける最新技術で、Twitterのリアルタイム性を担保している」と森田氏は話す。

photo 「知識の蒸留(knowledge distillation)」と「剪定(せんてい)」のイメージ。いずれもディープラーニングにおける処理を大きく減らす手法だ(出典:Twitter)

ユーザーの属性情報も深層学習で推察

 森田氏が最後に紹介したのは、Twitter広告におけるAI活用だ。膨大なユーザーがいるTwitterでは、いかにして広告を表示するユーザーを決めていくのかが問題となる。当然、広告主側もおおまかなターゲットの要望は出すものの、ターゲットに合致するユーザー全てに広告を出そうとすれば、予算が間に合わなくなるケースがほとんどだ。

 そのため、Twitterではあらかじめユーザーの年齢層や性別、興味関心といった情報をデータベースに保存しているという。とはいえ、Twitterアカウントを作成する際に、年齢や性別といった情報を登録することはない。こうした情報もまた、ツイートの内容や利用動向、フォロー関係などをもとに深層学習で推定し、一定の間隔で更新し続けているのだという。

photo 広告を表示する際には、ユーザーと広告、2つのデータベースを使うという

 これを広告の内容を登録したデータベースと突き合わせつつ、最後に広告にクリックした人に似た属性の人を探し、広告に反応する精度を高めていく。各アカウントにこれらの要素を反映したスコアを付け、順位が高いアカウントから広告を表示するわけだ。

 森田氏によれば「米国では、AIと言えばほぼディープラーニングを指す」とのことだが、Twitterでもディープラーニングの活用はこれからといった状況だという。むやみに最新技術を使うのではなく、ユーザーのニーズと合致させながら一歩ずつ進めていく――老舗SNSサービスのAI活用からは、そんな姿勢が伺える。

前のページへ 1|2|3       

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ