データ系職種6つを整理してみた


悩むトリケラトプス

データアナリストとかデータサイエンティストとか色々あるけど、違いがよく分からないよ、、



この記事では、こんな悩みに答えていきたい。



私自身は現在データアナリストとして働いている。データアナリスト以外の経験はないが、自分の周りの情報を参考にしつつ、この記事を書いている。

データ系職種6選


データ系職種の分類や定義は人や企業によって様々であることを前置きしつつ、今回私は以下の6つの職種について整理を行った。

  1. データ集計屋
  2. データアナリスト
  3. データサイエンティスト
  4. データエンジニア
  5. データアーキテクト
  6. 機械学習エンジニア

上記の6つである。



基本的にデータ系の職種と聞いて、パッと思い浮かぶものは含まれているのではなかろうか。これら6つの職種について整理してみる。


データ系職種を整理してみた


上記の6つの職種を自分なりに整理してみたのが以下の図である。


横軸はエンジニアリング寄りか、ビジネス活用寄りかという軸で分けている。この軸はTJO氏のこちらの記事で書かれている内容を参考にしていて、データ分析系の職種はこの軸で二つに分けるとかなり見やすくなると思っている。


縦軸のイメージはドラクエの上級職と基本職のようなものである。基本職の戦士と魔法使いをLv50にすれば、魔法戦士に転職できる。

データサイエンティストであれば、アナリスト・分析基盤・機械学習などが全てLv50になれば、データサイエンティストになれるようなイメージだと考えている。

こんなイメージ


さらに1点補足しておくと、現実は上図のように職務範囲が綺麗に分かれていることは全くない。現実は以下のような状態である。


これだと可視性がかなり下がるので、元々の図のように単純化を行っている。

以降では、各職種について簡単に概要を説明していきたい。



各データ系職種の説明


データ集計屋


まずはじめは「データ集計屋」である。


一般的にはデータアナリストと呼ばれており、完全に私個人の整理ではあるが、データアナリストになろうとしている人は、まずこのデータ集計屋になるイメージを持つと良いと思っている。

データ集計屋は、データアナリストと違って、コンサルティング力や施策提案力は必要ない。SQLが書けて、ExcelやPPTでの可視化がそれなりに出来れば十分である。


データ集計が完璧にできてくれば、「じゃあ分析設計からやってみよう」とか「じゃあ結果から施策提案まで作ってみよう」となり、グラデーション的にデータアナリストへとステップアップしていくことが可能である。

一歩目としてはオススメ




データアナリスト


上記のデータ集計スキルに加えて、コンサルティング力などを身に着けるとデータアナリストとして独り立ちできる。


コンサルティング力というのは具体的には以下のようなことができることを想定している。

  • 顧客の課題を理解できる
  • 課題を検証するためのイシューを立てられる
  • イシューに答える分析が設計できる
  • 分析結果を解釈し示唆を出せる
  • 施策提案ができる

上記の感じである。


上記を見て分かると思うが、データアナリストとして必要な能力というのは、ほとんどがソフトスキルになってくる。「データ集計屋」スキルはベースとして必要だが、価値の源泉は明らかにセンス・論理的思考力・経験値などの要素である。


このように、必要となるスキルのベクトルが大きくことなってくるため、あえて「データ集計屋」とは分類を分けて説明した。


データサイエンティスト


続いて、お馴染みのデータサイエンティストである。

データサイエンティストは今回挙げた職種の中で最もよくわからない。実態がつかめない。雲のような存在と言ってもいい。

こんな感じ



私自身がデータサイエンティストと名乗れる立場にないので、またもやTJO氏のこちらの記事から引用させて頂く。

  • データサイエンティストは「アナリスト」の延長
    • 統計分析で「意思決定を支援する(場合によっては自ら意思決定する)」のがメイン
    • 必要に応じて機械学習で「自動化の推進」も進める
    • オールラウンダー的な立ち位置のため、必要に応じてデータ基盤・データ活用体制の構築も担う

上記のように説明されている。



つまり、データアナリストに、以下のようなスキル・知見を加えたものと考えられる。

  • 統計分析の知見
  • 機械学習の知見
  • データ分析基盤・活用体制構築の知見



したがって、職種整理の図に戻ると、アナリストの上級職種でありつつ、エンジニアリングの方に裾野を広げるポジションに位置している職種であると考えている

再掲




データエンジニア


続いて、右半分のエンジニアリング側に視点を移して、「データエンジニア」について紹介する。

データエンジニアは一言でいうと、分析基盤を構築するエンジニアである。職務範囲としては、データの発生ポイントから、データアナリストが分析できるように、データの収集・保存・加工を行うというポジションになる。



JapanTaxiのスライドに分かりやすく説明されているので、こちらも参考にして頂ければと思う。

データエンジニアとデータアナリストを兼任して良かったこと



データアーキテクト


続いて、データアーキテクトだが、データアーキテクトという職種はあまり一般的でないように思う。

indeedの検索ヒット数を見てもデータアーキテクトは、まだ一般的な職種であるとは言えない。


データアーキテクトとデータエンジニアを区別する点としては、データアーキテクトは分析基盤の全体構成を設計する立場であるのに対して、データエンジニアは実際に各構成要素を作成する役割を担う。

したがって、データアーキテクトはデータエンジニアの上位職種と見ることもできるし、データアナリスト寄りの知見も必要になるという見方もできる。


機械学習エンジニア


最後に、機械学習エンジニアである。

機械学習エンジニアは、機械学習モデルをアプリやWebサービスに組み込む役割を担っている。したがって、ソフトウェアエンジニアやシステムエンジニアの延長に位置していると言えるだろう。

近年、機械学習システムはAWSやGCPのようなクラウドサービス上で行うことが主流なので、その扱いに長けているデータエンジニアからのステップアップも比較的しやすいと思われる。

スキルセットはかなりエンジニアリング寄り

基本的に、機械学習に対する深い理解が求められる職種であることは間違いないが、今後伸びてくるであろうAutoMLによって、必要とされる理解度が低下していくのかは、個人的に気になっている所である。

実際クラウドサービスのAutoMLを使えば、Kaggleのタイタニックコンペ経験レベルでも機械学習システムを構築することが可能であり、機械学習について少し学んだ程度のソフトウェアエンジニアでも参入が可能になっているという話も聞いたことがある。

したがって、データサイエンティストと比べると、統計学・機械学習への理解というよりは、かなりエンジニアリング寄りのスキルセットが求められることは間違いないだろう。




まとめ


以上、データ系職種を6つ紹介した。

  1. データ集計屋
  2. データアナリスト
  3. データサイエンティスト
  4. データエンジニア
  5. データアーキテクト
  6. 機械学習エンジニア



また、上記の職種を整理したのが以下の図である。



データ分析系のキャリアを築いていく上で、少しでも指針となれば幸いである。



ではこのへんで。