メディア

約3億人のデータを保持する「Twitter」は、人工知能をどう活用しているのか（3/3 ページ）

» 2018年02月22日 08時00分公開

リアルタイム性を担保する「知識の蒸留」

　このようにTwitterでは、人工知能の活用が進んでいるものの、深層学習を始めとして膨大なマシンパワーが必要な処理が多い。処理の負荷が高まれば、それだけ処理が遅くなり、待機時間が長くなってしまう。

　先ほど挙げた、画像の自動トリミング処理では、処理速度を上げるために「知識の蒸留（knowledge distillation）」と呼ばれる方法で、処理数を減らしている。これは、大きくて複雑なニューラルネットの学んだ知識や推論結果を、小さくて軽量なモデルの学習に利用する（継承する）というもので、精度は下がるものの、実用には耐えられるレベルになるという。

　トリミングの範囲を決めるだけならば、数ピクセル単位の細かいチューニングは必要ない。さらに演算能力を無駄に浪費する処理を除去する「剪定（せんてい）」という処理も加え、トリミングのスピードが従来比で10倍になったそうだ。「こうしたディープラーニングにおける最新技術で、Twitterのリアルタイム性を担保している」と森田氏は話す。

「知識の蒸留（knowledge distillation）」と「剪定（せんてい）」のイメージ。いずれもディープラーニングにおける処理を大きく減らす手法だ（出典：Twitter）

ユーザーの属性情報も深層学習で推察

　森田氏が最後に紹介したのは、Twitter広告におけるAI活用だ。膨大なユーザーがいるTwitterでは、いかにして広告を表示するユーザーを決めていくのかが問題となる。当然、広告主側もおおまかなターゲットの要望は出すものの、ターゲットに合致するユーザー全てに広告を出そうとすれば、予算が間に合わなくなるケースがほとんどだ。

　そのため、Twitterではあらかじめユーザーの年齢層や性別、興味関心といった情報をデータベースに保存しているという。とはいえ、Twitterアカウントを作成する際に、年齢や性別といった情報を登録することはない。こうした情報もまた、ツイートの内容や利用動向、フォロー関係などをもとに深層学習で推定し、一定の間隔で更新し続けているのだという。

広告を表示する際には、ユーザーと広告、2つのデータベースを使うという

　これを広告の内容を登録したデータベースと突き合わせつつ、最後に広告にクリックした人に似た属性の人を探し、広告に反応する精度を高めていく。各アカウントにこれらの要素を反映したスコアを付け、順位が高いアカウントから広告を表示するわけだ。

　森田氏によれば「米国では、AIと言えばほぼディープラーニングを指す」とのことだが、Twitterでもディープラーニングの活用はこれからといった状況だという。むやみに最新技術を使うのではなく、ユーザーのニーズと合致させながら一歩ずつ進めていく――老舗SNSサービスのAI活用からは、そんな姿勢が伺える。

約3億人のデータを保持する「Twitter」は、人工知能をどう活用しているのか（3/3 ページ）

リアルタイム性を担保する「知識の蒸留」

ユーザーの属性情報も深層学習で推察

関連キーワード

Twitter | ディープラーニング | 人工知能 | 機械学習

関連記事

関連リンク

事例記事ランキング

注目のテーマ

人気記事ランキング