ITmedia NEWS > AI+ >
ITmedia AI+ AI活用のいまが分かる

未経験からデータサイエンティストになれる? 「死の谷」を越えた独学プログラマーが伝えたいことこれからのAIの話をしよう(独学エンジニア編)(4/4 ページ)

» 2019年05月13日 07時00分 公開
[松本健太郎ITmedia]
前のページへ 1|2|3|4       

未経験からデータサイエンティストになりたい人へ

 いま需要が高まっているデータサイエンティストについては、Daiさんは「もっと具体的な役割で考えた方がいいのでは」という印象を持っています。なぜならデータサイエンティストが指すものは多様で、ビジネスサイドでリサーチの要件を決めるのか、SQLをたたいてデータアナリストをするのか、AIを用いて課題を解決する機械学習エンジニアになるのか、データ基盤を作るエンジニアになるのかで、学ぶべきことが全く変わってくるからです。

 一般的にデータサイエンティストはPythonやRなどのプログラミング言語、統計学、数学の知識が求められるとされていますが、Daiさんは「(データ分析の)初級としてはExcelでも十分だと思います」と述べます。

 「データベースを扱うSQLなどの言語を学ぶのは後でも良いでしょう。結局、RDB(関係データベース)はExcelが理解できないと難しいですし。SQLでテーブル結合を行うJOINは、ExcelのVLOOKUP関数が理解できないと意味が分からないでしょう」(Daiさん)

 Excelを使ったデータ分析については、西内啓さんの著書「1億人のための統計解析」を勧めていました。この本を読むことで「だいぶイメージがつかめる」としています。

 「データ分析を行う上で、Excelでできることをまず理解し、実際に使えるようにしましょう。その後に、例えば大規模なデータの分析や、より専門的な統計解析手法を使うなら、PythonやR言語などのより詳しい数理統計の知識を身につける必要があると思います。しかし、データサイエンスの基礎としてまずは簡単なリサーチデザインの設計や仮説設定、簡単なクロス集計、検定などの基礎概念をエクセルで身につける方が良いです。ほとんどの仕事はExcelで完結するような分析なので、まずはExcelを使いこなせるようになり、それ以上のことをしたいときにはじめてPythonやR、SQLを理解すればいいでしょう」

 基礎的な知識を身に付けた後は、自分の立ち位置によって学ぶべき内容が変わってきます。例えば経営者などのビジネスサイドの人間は、Pythonで書かれたコードの意味まで理解する必要はあるのでしょうか。

 それについては「間違ったコードのテスト実装コストや、新規機能開発における実装リソースの配分に関して優先順位をつけられるぐらいの理解はあった方がいいでしょう。しかし、関数の意味やコードの内容の詳しい理解まではなくてもよいかなと思います」という返答がありました。また、プロマネや経営者でも、ビジネスの文脈でAIを理解し、どんな価値が生まれるかを考えられる人は重宝されるのではないかという考えもあるようです。

 一方で、機械学習エンジニアになりたい人の場合は「初心者だったらまずサーバサイドの経験を積んでからの方が良いでしょう」と言います。「チューニングだけでなく実装までやらないといけませんから。機械学習エンジニア=高収入というイメージを持っている人が多いですが、入口の入口に立っただけでは、高い年収や裕福な生活が待っているわけではないです」

取材後記

 いまでも時々、日本テレビ系列で放映していたテレビドラマ「女王の教室」を思い返します。天海祐希さん演じる阿久津先生は「勉強はしなきゃいけないものではなく、したいと思うものだ」と断言しました。

 筆者の大学時代の恩師は口を酸っぱくして「学び続ける情熱を持て」と言っていました。大学生活と共に勉強が終わるのではなく、社会人になっても「これは面白いから学ぼう」と思える情熱があれば、何歳からでも机に向かって勉強が始められると言うのです。大切なのは情熱を絶やさないことでしょう。

 その意味において、Daiさんの「今までの勉強と同じように読み書きで学ぶのではなく、実際にモノを作ったり創造力を働かせたりして体現していく」という考え方は大変参考になります。Daiさんが独学でも通用した理由は、まさに「したいと思って勉強したから」なのでしょう。

著者プロフィール:松本健太郎

株式会社デコム R&D部門マネージャー。 セイバーメトリクスなどのスポーツ分析は評判が高く、NHKに出演した経験もある。他にも政治、経済、文化などさまざまなデータをデジタル化し、分析・予測することを得意とする。 本業はインサイトを発見するためのデータアナリティクス手法を開発すること。

著者連絡先はこちら→kentaro.matsumoto@decom.org


著者より単行本発売のお知らせ

今最も注目を集めるデータサイエンティストの1人が、データの読み方に注目して「うそを見抜く技術」を解説します。世論調査の結果はなぜ各社異なるのか? アベノミクスによって景気は良くなったのか? 人手不足なのにどうして給料は増えないのか? 「最近の若者は……」論の誤り、本当に地球は温暖化しているのか? などなど。

新時代の教養「データサイエンス」の入門書として、数学が苦手な人、統計学に挫折した人にも分かりやすい一冊に仕上がりました。詳細はこちらから。

前のページへ 1|2|3|4       

Copyright © ITmedia, Inc. All Rights Reserved.