データアナリストは理系職なのか?


一般的に、データアナリストという仕事は「理系の仕事」として扱われている。


しかし、データアナリストをやっている身として、データアナリストが理系的な仕事というのは少々誤解を招く部分があると思っている。この記事は、データアナリストを理系職と定義することへの違和感について書いている。


そもそもの話として、理系職と文系職は明確に分けられるものでもないし、分ける意味も全くないというのが個人的な意見であるが、今の日本社会においてはまだ理系・文系という切り分けが一線で使われているので、この記事もその前提にのっとっている。

理系的な要素はデータアナリスト業務のごく一部


以前、データアナリスト業務の全体像について、こちらの記事でまとめた。

簡単に内容を要約したのが以下の画像である。

この全10プロセスのうち、いわゆる「理系的」なプロセスは以下の二つだけである。

  1. 分析設計
  2. データ集計

上記の二つについて、なぜ理系的であると言えるのかを順に解説していく。

高度な分析を実施する際には理系的な素養が必要となる


まず分析設計についてだが、このプロセスでどのような分析を設計するかによって、理系的かどうかが決まってくる。したがって、必ずしも分析設計=理系的という訳ではない。


例えば、以下のような分析を実施する場合、はっきり言って全く理系的ではない。

  • 単純な数値の比較
  • 単純な統計量(平均値・中央値など)の比較
  • クロス集計

そして、分析と呼ばれるものの多くは、上記のようなシンプルな集計で事足りることが多い。したがって、この分析設計プロセスにおいても理系的な要素は一部に限られているという見解である。



一方で、以下のような分析をする場合、理系的な素養が必要となる。

  • 統計的仮説検定
  • 効果検証(傾向スコアなど)
  • 機械学習による予測
  • クラスタリング分析

上記のような分析である。



反論として、

悩むトリケラトプス

別に文系でもこういう分析をしてたけど

という反論が予想されるが、これらの分析は理論の理解に数学的素養を一定必要としているため、「理系的」と位置づけている。ご了承いただきたい。


一般的にプログラミングは理系的


次にデータ集計についてだが、ここでは基本的にSQLやPythonのようなプログラミング言語を書いて、データの加工を行うことを想定している。

したがって、このプロセスは「理系的」であると言えるだろう。


「プログラミング=理系」という図式には、ややクエスチョンマークであるが、社会的コンセンサスに鑑みると、そういう位置づけになると思われる。



以上を踏まえると、データアナリスト業務において理系的な業務はごく一部であり、その理系的な業務でさえも「文系が手も足も出ない」ような領域ではないことが理解いただけたのではないだろうか。




データ分析への敷居は下げておいたほうがいい



最後に、このような疑問を投げかけている私の意図を簡単にまとめて終わりにしたい。


端的に言うと、「データアナリストは理系・文系問わず誰でもなれるもの」という実感を持っている。

一方で、データアナリストを理系的と定義してしまうことにより、データ分析を敬遠してしまう人が増えてしまうのは、きわめて勿体ないと思っている



データ分析を敬遠してしまう人が増えるのは、データ分析に携わる人にとっても良いことではない。

  • データ分析結果が他部署の人に響かない
  • データ分析結果が意思決定に反映されない

上記のような課題は、データ分析をやっている人であれば10人中10人が感じたことがあると思う。


データ分析はそれ自体で価値を生むことは少なく、誰かに使われて初めて価値になる。その際に、自分の周りに「データ分析を敬遠している人」が溢れていたら大変なのは、データアナリスト自身ということになる。



まとめ


以上、データアナリスト業務は理系職でも何でもないから、皆どんどんデータ分析していこうという話。

ではこのへんで。