2015年7月27日以前の記事
検索
インタビュー

Kaggleトップ1%のAI人材、なぜNTT東日本に? 若手データサイエンティストの活躍(3/5 ページ)

世界中のAI人材が競う技術コンペ「Kaggle」で上位1%に入る「Kaggle Master」の若手3人は、なぜNTT東日本を選んだのか。Kaggleでの学びをどう実務に生かしているのか。

Share
Tweet
LINE
Hatena
-

チームでのこれまでの「Kaggleメダル」獲得数は0枚

 3人が所属するAIの内製化を目的とした「データビジネス共創担当チーム」では、日々の業務に取り組むだけでなく、AI技術者やデータサイエンティストとしての技術の研さんも促していた。データサイエンティストの実力を測る指標の一つとされる、技術コンペ「Kaggle」への挑戦もその一環だ。


世界190以上の国・地域から20万人以上のAI開発者やデータサイエンティストなどが集うコミュニティ「Kaggle」(画像:Kaggle 公式Webサイトより)

 しかし、これまで同チームの多くのデータサイエンティストがKaggleに挑戦したものの、残念ながらメダル獲得には至っていなかった。

 もともとKaggleコンペへの参加に興味があった青柳氏と小林氏は「内定者の中に経験者がいるらしい」と聞きつけ、修士1年の時点で「Kaggle Expert」(銅メダル2枚以上)を獲得していた森田氏とチームを組んで、2022年の内定者時代にコンペに参加した。

 Kaggleのコンペでは、企業や研究機関からデータと課題が提供される。参加者は機械学習や統計学などを用いてそのデータを分析し、課題の解決方法の精度を競い合う。コンペの開催期間は2〜3カ月程度だ。

 彼らが当時参加したのは「BirdCLEF 2022」というコンペで、さまざまな鳥の生息区域で収録された音声データから、特定の鳥の鳴き声を検出するモデルを開発し、その精度を競う。3人はこのコンペで銅メダルを獲得した。


Kaggle「BirdCLEF 2022」の概略(画像:Kaggle 公式Webサイトより)

 データビジネス共創担当チームのKaggleコンペにおける目標は、それまで「メダル取得」にとどまっていたが、3人のメダル保有者の入社を機に「金や銀メダルなどの上位成績の獲得」へと水準が引き上げられた。

 入社後も3人は継続的にKaggleに取り組んでいる。技術力向上はもちろん、チーム全体の研さん意欲の増加や社内外でのプレゼンスの向上など、さまざまな効果が期待できる。活動は終業後が中心で、3人や社外の参加者とチームを組むこともあれば、単独で参加することもあるという。

 2024年には、ほくろなどの皮膚病変の画像から、それが皮膚がんの疑いがある悪性腫瘍か、問題のない良性腫瘍かを見分けるモデルを開発するコンペ「ISIC 2024 - Skin Cancer Detection with 3D-TBP」に3人で参加した。


Kaggle「ISIC 2024 - Skin Cancer Detection with 3D-TBP」の概略(画像:Kaggle 公式Webサイトより)

 このコンペで彼らが特に苦労したのは、学習用データと評価用データを適切に分離することだった。1人の患者につき複数枚の皮膚画像が用意されているが、同じ患者の画像が学習データとテストデータの両方に含まれてしまうと、AIがすでに見た特徴を手がかりに判定できてしまい、実力以上に高い精度が出てしまう。

 実際の医療現場での運用では、AIは初めて見る患者の診断を行わないといけない。そのため、現実に近い評価をするには「患者単位でデータを厳密に分ける必要があった」と3人は説明する。

 具体的には、ある患者の皮膚画像を全て学習データに含むか、あるいは全て評価用データに含むかのいずれかに統一し、同一患者の画像が両方にまたがらないようにする必要がある。こうした分け方を徹底することで、AIが未知の患者に対してどこまで正確に判定できるかを、より実態に近い形で評価できるようになる。

 結果、2737チーム中14位で金メダルを獲得した。この成果によって、青柳氏と小林氏は「Kaggle Master」(金メダル1枚以上、銀メダル2枚以上)の称号を獲得。すでに同称号を取得していた森田氏に加え、3人のKaggle MasterがNTT東日本に誕生した。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る