かつて「21世紀で最もセクシーな職業」と呼ばれたデータサイエンティスト。生成AIブームの中、その役割はどう変わったのか。ガートナージャパンのアナリストである一志達也氏に、データサイエンティストの現在地と日本企業が抱えるAI人材の課題を聞いた。
この記事は会員限定です。会員登録すると全てご覧いただけます。
「データサイエンティストは21世紀で最もセクシーな職業だ」――トーマス・H・ダベンポート氏が米『Harvard Business Review』でそう評したのは2012年のことだった。
あれから10年以上がたち、生成AIが急速に普及する今、「AIエンジニア」や「データエンジニア」などの職業が従来よりも注目を浴びているようにも見える。そんな中、データサイエンティストという職種を取り巻く状況はどのように変化したのか。「『データサイエンティスト』はどこへ」と題した本特集では、前後編に分けてその実態を探る。
前編の本稿では、アナリストとして業界を俯瞰(ふかん)するガートナージャパンの一志達也氏に、データサイエンティストという職業の現在地と、日本企業が抱えるAI人材獲得・育成に関する課題を聞いた。
――まず、ガートナーとしてデータサイエンティストをどのように定義しているのかを教えてください。
一志氏: ガートナーでは、データサイエンティストを「各種のデータセットからインサイトを導出し、高度な分析手法、機械学習(ML)、統計モデリングなどを駆使して、ビジネス上の問題解決を支援する」人材と位置付けています。データエンジニアやデータアナリストとは明確に区別しています。
――それぞれの違いを簡単に教えていただけますか。
一志氏: データエンジニアは、データ分析に必要なデータを準備する役割です。SQL文などを書いてデータパイプラインを構築、管理、運用します。データアナリストはデータの可視化やそこからの洞察を得ることが仕事で、BIツールなどを使います。必要なスキルセットが全然違いますが、これらを明確に区別している企業もあれば、区別せず1つの職種にさまざまなスキルを求める企業もあります。
――データエンジニアが必要なデータを用意し、それをデータアナリストが分析したり、データサイエンティストが予測モデル構築に使ったりする、という役割分担なのですね。
――2012年にデータサイエンティストが「最もセクシーな職業」と呼ばれて以降、その位置付けはどう変わったのでしょうか。
一志氏: 海外の転職市場を見ると、データエンジニアの方がサラリーレンジが高くなっています。(それに比べると)データサイエンティストはそれほどサラリーレンジが高くない職業になったのです。これは昨日今日の話ではなく、結構前からそうなっています。
ただ、だからといってデータサイエンティストがいらなくなったわけではありません。2026年の今もガートナーはデータサイエンティストという役割を定義し続けています。MLモデルに代表される予測モデルを構築するという仕事は、引き続き必要なのです。そのようなAIを、私たちは生成AIと区別するために「旧来のAI」と呼び始めています。
データサイエンティストの仕事のやり方も変化しました。数年前に「DataRobot」などのAutoML(自動機械学習)ツールが登場したことで、非常にインスタントにモデルを作れるようになりました。こうした道具の進化は生成AI以前から起きていたことです。
――生成AIの登場がきっかけというよりも、それ以前から変化は始まっていたのですね。
一志氏: その通りです。生成AIが登場したからデータサイエンティストの仕事が変わったというよりは、それ以前からの技術や道具の進展によって変化してきたと考えるのが正確でしょう。ただ、その変化の中で、データサイエンティストにはより一層ビジネス理解が求められるようになったり、予測モデルの説明力が重要視されるようになったり、あるいはMLOps(機械学習モデルの運用管理)により力を発揮することが期待されるようになったり、組織の状況に応じてさまざまな役割が重視されるようになっています。
筆者注: ガートナーが「旧来のAI」と呼ぶのは、MLや統計モデルに代表される、分類や検出、予測などを可能にする技術だ。生成AIと区別して「認識AI」(識別AI)とも呼ばれる。2017年に発表された深層学習モデル「Transformer」と、それを利用した「GPT-3」「ChatGPT」の発表によって、現在は「AIといえば生成AI」と考える人もいる。しかし、もともとAIとは「データからパターンを学習し、未知の入力に対して予測・生成する仕組みの総称」であり、生成AIはその一類型に過ぎない。
――日本企業におけるデータサイエンティストの活用状況はいかがでしょうか。
一志氏: 日本においてはまた少し事情が違います。もともとデータサイエンティストという役割への理解が乏しい中、「データドリブン」「データ活用」「データの民主化」など、何でもかんでもデータサイエンティストの仕事にまとめてしまう側面がありました。
さらに、多くの日本企業はトレンドに流されてきました。機械学習が流行ったから飛びつき、人材にデータサイエンティストという肩書きだけ付け、AutoMLツールも契約した。しかし結局、ビジネスにおいて花開かず、予測モデルが事業収益に大きく貢献するには至らなかった。そこに新しいトレンドとして生成AIが来てしまったので、一気にそちらに流れているという状況です。
――データサイエンティストが生成AIエンジニアに転換しているのでしょうか。
一志氏: それはミスリードになると思います。データサイエンスと生成AI活用では必要なスキルが異なります。ただ、日本企業のほとんどは外注依存なのです。機械学習の時も外注、生成AIでもまた外注。PoC(概念実証)止まりで本番運用に至らないケースが非常に多い。結局、多くの企業はデータサイエンスやAIの分野で自立できていないというのが実情です。
――データエンジニアの給与が上がっているとのことでしたが、日本でも同様の傾向でしょうか。
一志氏: 日本の場合、海外とは事情が異なります。「データエンジニア」という言葉さえ理解されていない企業の方が多いのです。AIは活用したいが、自社のデータを与えたAIを作りたいという展望で止まり、それをまた外注に投げるという構造になっています。
一方で、LINEヤフーやメルカリ、楽天のようなインターネットビジネスを手掛ける企業、あるいはメガバンクや自動車メーカーのようにデジタル対応に積極的な企業は、データエンジニアやデータサイエンティストの役割をきちんと区別し、組織的に取り組んでいます。しかし、それが日本のマジョリティかというと、全くそうではありません。
――人材を確保できない企業は、どうすればよいのでしょうか。
一志氏: 私がよく言っているのは、「選ばれない企業」の問題です。希少価値のある人材の奪い合いが発生している中で、多くの日本企業はブランド力がないのです。恋人探しと同じで、魅力的な自分にならなければ振り向いてもらえません。
単に募集要項を魅力的にすればいいという話ではなく、経営としてのコミットメントが必要です。小売企業が大手IT企業の出身者を経営層に迎え入れるなどの成功事例もあります。会社として危機意識を持ち、「あなたにうちの会社を託すからやってほしい」という本気のオファーが出せるかどうかが分かれ目です。
筆者注: 一志氏は、日本企業のIT人材不足の背景に「ITの立ち位置の低さ」があると指摘する。大手企業がIT部門を子会社化して本体と分けてきた歴史があり、今になってIT子会社の再編や統合が進んでいるが、経営層がITやAIのポテンシャルを十分に理解していないケースもまだ多いという。
――生成AI、特にRAG(検索拡張生成)の実装などのためのデータ整備において、非構造化データの取り扱いは誰が担っているのでしょうか。
一志氏: まず言えることは、非構造化データを本格的に取り扱う業務が確立されている企業自体が少ないということです。多くの企業はまだ「生成AIを活用したい。自社データを取り入れたい」と漠然と言っているだけの段階です。
また、「RAGを構築したい」という需要が、ファイルをアップロードするだけで“RAGっぽい”ことができるサービスに吸収されているという面もあるかもしれません。それでは済まない需要が、現在は「AIエージェント」という言葉に丸められて、その開発を進めている企業もあります。
そのための非構造化データの加工や整理に、データエンジニアが従事しているとも限りません。そのような業務を含め、データ活用やAI活用、データサイエンスなどの業務は、一部の限られた優秀な集団に委ねられていると思います。
「最もセクシーな職業」の看板は色あせたかもしれないが、データサイエンティストという職種そのものが不要になったわけではない。しかし、データサイエンティストが社会に求められている一方で、一志氏の話から浮かび上がったのは「日本企業がデータサイエンスを使いこなせなかった」という構造的な課題だ。
印象的だったのは、生成AIの登場がデータサイエンティストの役割を変えた主因ではないという指摘だった。AutoMLツールの普及など、変化はもっと前から始まっていた。多くの日本企業はそれらのブームに追随しつつも、真の意味で「自立」しないまま次の波である生成AIに流されている。外注依存から抜け出せず、PoC止まりを繰り返すこの構造は、技術が変わっても根本的には同じだ。
一志氏が繰り返し強調した「経営としてのコミットメント」の重要性は、データサイエンティストに限らず、IT人材全般の獲得に当てはまる。データサイエンティストを含むIT人材に選ばれる企業になれるかどうか。そこに日本企業のデジタル化やAI活用の成否がかかっている。
後編では、データサイエンティストを多数抱え、さまざまな産業におけるデータ活用を支援する日立製作所に、データサイエンティストが担う業務の変化や、彼らが活躍した好例について聞く。
結局、M365 Copilotって元取れるの? グループ9000人に導入した住友商事に聞いた
「2026年に取りたいIT資格」1位は“あのベンダー資格” 読者調査で読み解くトレンド
「コーディングはAI任せ」でエンジニアは何をする? AWSが示す、開発の新たな“主戦場”
“AIエージェントの次”のトレンドは何か Gartnerが描く未来志向型インフラのハイプ・サイクルCopyright © ITmedia, Inc. All Rights Reserved.