ITmedia NEWS > STUDIO >

Twitter、「おすすめ」アルゴリズムを含むソースコードをGitHubで公開

» 2023年04月01日 07時16分 公開
[ITmedia]

 米Twitterは3月31日(現地時間)、予告通りプラットフォームを構成するソースコードの一部をGitHubで公開した。「おすすめ」に表示するツイートを選ぶアルゴリズムも含まれる。

 github

 Twitterは公式ブログで、コードの公開は「より透明性を高めるための第一歩」であり、今後も「Twitter自身とユーザーに大きなリスクをもたらさない」コードを共有していく予定という。

 安全とプライバシー保護のために、児童の性的搾取と闘うためのコード、アルゴリズムに関連するトレーニングデータやモデルの重みは公開していない。また、広告レコメンデーションを強化するコードも含まれていない。

 モデルの重みをめぐっては2月に一時期、「おすすめ」タブがイーロン・マスクCEOのツイートだらけになった(その後調整された)のは、マスク氏の要請でエンジニアチームがコードを修正したためと報じられた

 未発表新機能ハンターとして知られるジェーン・マンチュン・ウォン氏はさっそくコードをチェックし、「Twitterのアルゴリズムは、ツイートの作成者がイーロン・マスクであるかどうかを明確にラベル付けしている」とツイートした。

 また、「Twitterのアルゴリズムは、ジャック・ドーシー、ケイティ・ペリー、ステフィン・カリー、バラク・オバマをテスト用ツイートを取得するためのテストアカウントとして具体的に指定している」と指摘した。

 Twitterは公開したコードについて、公式ブログで解説している。

 「私たちは、アルゴリズムで数億件のツイートから最高のツイートを1500件抽出しようとしている」。「おすすめには、フォローしていない人のツイートとフォローしている人のツイートが半々の割合で表示される。ただし、これはユーザーによって異なる可能性がある」。「おすすめ内でのツイートのランキングは、いいねやRT数などの肯定的なエンゲージメントを最適化するために継続的にトレーニングしている最大4800万のパラメータを持つニューラルネットワークで生成している」。

 github 2 タイムラインの主なコンポーネント概念図

 コード公開後に開催したスペースでマスク氏は「公開したアルゴリズムはかなり恥ずかしいもので、多数の間違いが見つかるだろう。われわれは迅速に修正するつもりだ」と語った。

 また、「ユーザーの提案に基づいて24〜48時間ごとにおすすめのアルゴリズムを更新していく」ともツイートした。


Copyright © ITmedia, Inc. All Rights Reserved.