手順としては、次の通りになります。
微妙な違い(もっと細分化して方がいいなど)はあるかもしれませんが、今回は大枠で捉えていきます。
機械学習を業務に取り入れる手順
1)ゴールの決定->機械学習で何がしたいのか?
2)データの収集->一定の量の学習データを用意(これが一番大変)
3)データの整形・加工->特徴抽出と呼ばれる作業
4)データを学習
– 機械学習の手法を選択->モデル選択
– パラメーターの調整->初期値の設定
– データを学習してモデルを構築
5)モデルを評価->テストデータで精度を測ってみる
6)十分な精度が出なければ4)に戻る
7)業務で活用
6)の十分な精度など抽象的な内容になってしまいますが、ここは1)で決めたゴールの内容によって左右されるところなので、人間がボーダーラインを決めて上げる必要があります。
例えば、医療現場で癌検査に機械学習を導入したいという要望があったとします。
そこで、CT検査などをした画像を機械学習にかけて、どの程度の精度があれば現場に導入できるでしょうか?
モデルの評価として90%の精度が出たします。直感的にわかる通りこれは10人中1人の割合で誤診します。
この割合を許容できるか否かの判断をするのは人間の仕事です。
もし、許容できなくても、残りの1割を人間がカバーするのであれば、導入しても良いとなるかもしれません。
つまり、機械学習を業務に取り入れるには、作る側だけではなく、業務に導入しようとする側のリテラシーも必要になってくるので、注意が必要です。