Pythonや統計学、scikit-learnなども重要ですが、今回紹介するのはそれとは別です。
はじめに、データサイエンティストのスキルを大きく2つのカテゴリに分解すると、ツールスキルとコアスキルに分けられます。
フォーカスするのはコアスキルの方です。
ツールスキル
ツールスキルは、PythonやPytorchなどの言語やフレームワークを用いてデータ分析を行うことで、問題を解決する手段として使うものです。
こちらもビジネス課題を解決していく上では、必須のスキルですが、その前段階でコアスキルが必要になってきます。
コアスキル
コアスキルというのは具体的には次のようなものです。
- 問題解決能力
- 分析的思考
- 批判的思考(クリティカルシンキング)
更に掘り下げると、1つ目がビジネス理解です。
例えば、アパレルショップを経営している企業で売上が低下していて、あなたにデータサイエンティストとして改善してもらいたい状況があるとします。
まず、必要なのがビジネスを理解することです。
AmazonのようなECサイトが企業ビジネスにどのような影響を与えているかを読み解く。
トレンドなっている・なりつつあるもの、年代別のよく着る服の変化など
このビシネス理解を育てるには、2つのアプローチがあります。
ドメイン知識を得る
ドメイン知識を得るのにもいくつか方法があります。
一番オーソドックスなのが、その業界・業種の分野を大学で既に勉強しているパターンです。
つまり、学位で既に知識を得ているのが1つのパターンです。
2つ目が特定の業種で働いてみること。職種は何でもいいです
その業界で働いていると、社内・社外問わず同じような業種の人と多数話す機会がある。そうすると、その業界ならではの課題やボトルネックに触れることができる。
一度知って理解してしまえば、別のことに活かせるケースも増えてきます。
先程の小売業を例に出すと、Amazonのようなショッピングサイトがすごい勢いで売上を拡大しているのか(実際は売上は出ているが利益はそこまで出ていない)、個人経営はどう対処するべきかが見えてくる
書籍や記事でもある程度の知識は得られるので、好奇心と客観視スキルをもてば、ドメイン知識を得ることは難しくありません。
分析思考
2つ目の重要なスキルが分析思考
分析思考は、全てものに使えるツールです。全てに使えるというのは、問題の種類や状況によって左右されないといったことです。
具体的には、ある問題を与えられた時に問題を分解して考えることで解決法を思いつくといったものです。
言い換えると、問題解決のスキルとも言えるのですが、この思考で物事を見ると取捨選択の判断を下すための感覚が身につきます。
一般的に、課題がありその課題が構成されている問題が全て与えられていて解決策が示唆されているといったケースは稀です。このような状況であれば、機械学習系の知識があれば解決できると思います(物によっては苦労するかと思いますが)。
上のように、ツールスキルを使って課題解決する人を機械学習エンジニアと言ったりもしますが、この辺りの境界線は曖昧です。
なので、課題がどんな問題で構成されているのかを考えるのもデータサイエンティストの仕事だったりします。
これが出来ると、深層学習などの複雑なことを用いなくても、単純な回帰で実装できるという判断を下せ、工数やリソース削減にもつながる。
そうすると、上司からの評価も上がりやすくなったりします。
コミュケーション
ここで言う、コミュニケーションというのは作り上げた機械学習モデルで出力した結果が何故そのようになったかを説明できるかと言ったことです。
データサイエンティストはこういった結果が出ましたという報告だけで終わることはできません。
何故このデータを用いて、あるデータは組み込まなかったかといった説明やこの出力精度ではどの場面では使用可能かもしくは不可能かなどの説明(プレゼンやストーリーテリング)が求められます。
まとめ
データサイエンティストにはPythonやTensorFlowなどの知識だけでなく、問題解決力といったことも求められることが増えてきました。
この機会にデータサイエンティストを目指す方は必要なスキルについてコアスキルにも目を向けてみて下さい。
最近では、Web開発までも必要とされているので多岐に渡りますが、こちら側はあくまでエンジニアの界隈なので学ぶのは難しくないはずです。
コアスキルを磨くための書籍をいくつか紹介して終わりたいと思います。