機械学習

最新AI技術の情報収集方法

Leaderboard, Competions

実際の企業が抱えているデータを元に、あるテーマに沿って、精度を競い合うコンペディションがあります。例えば、Kaggleやcoco Dataset Challenge、KITTI Dataset、SIG KDDなどがあります。
これらのコンペは成績上位者のカーネルが公開されており、得られる知見が豊富な点が有意義な点です。
※Leaderboard:成績上位者

coco(全般)やKITTI(自動運転専門)は基本的に画像に関するコンペです。
参加している人は、大学の研究室であったり、企業の人たちが大半です。

kaggleでは色々な企業がコンペに掲載しており、面白いテーマがいくつも溢れています。最近ですと、Youtubeチャレンジというものがあり、動画を分類するというテーマが一際有名でした。

こういったコンペはまだ、個人で上位に組み込むのは数が少なかったりしますが、試しに挑戦する価値は十分にあると思います。上位に組み込めれば、賞金をもらえるかもしれませんし、ヘッドハンティングや本の執筆依頼などが来ることがあるので、自身のブランディングを行う良い機会になります。

企業がデータを出品するメリットととしては、優勝した人のアルゴリズムを使えたりするといったことがあります。有名な例としては、Netflixさんが最たる例です。その時の賞金額としては1億円相当でした。
見方を変えれば、これも一種のアウトソーシングです。

これらの良いところは、上位入賞者のコードを全て見られるわけではないが、一部のコードが公開されており、そこでコメントを用いて、活発な議論が繰り広げられるのが特徴です。この知見は本などでは、学べない試行錯誤のプロセスを追うことができます。

個人で参加するデメリットとしては、GPUの環境などは自前で用意しないといけないことです。参加するコンペ(Youtubeなど)によっては、高性能なGPU環境を用意しないと全く歯が立たなかったりするので注意が必要です。

International Conferences(国際学会)

代表的な所としては、NIPS・CVPR・AAAI・IEEE・ICML・KDDなどがあります。他にも日本で開催されるものも含めていくつも存在します。
こういった学会では開催日の1・2ヶ月前に発表された論文を読み込むことができます。
最近だと、学会によっては、keynoteなどがyoutubeにアップされてたりもします。
後は、ライブストリーミングなどもされるケースも増えてきたので、学会に直接行かなくても見れたりするので、とても便利です。

興味のある論文を探すには、探すためのキーワードを持っておき、音声認証であればVoice Idのような形で、abstractを追っていくのが手堅いです。

学会に参加するのであれば、事前にアクセプトされた論文の中から興味のある分野に関しては触っておいた方がいいです。

ただ、いきなりこれらの論文にいってしまうと、何をいっているか分からず、挫折してしまうので、ある程度の基本は押さえた上で、読むことを推奨します。

ちなみに、NIPSでアクセプトされる倍率は、100~1000倍と言われています。

Papers with Codes

AIの論文の中には、Githubなどのコードが付随していることがあります。
良くあるケースとしては、論文の後ろの方にGithubのURLが記載されているケースが多いです。

コードが付いているかどうかはarxivの場合、abstractに書いてあるので、最初の1ページだけ見ればわかるようになっています。

これらの情報を活用して、AIの最先端情報をキャッチアップして見てください。

NIPSの学会は12月に開催されますが、既にチケットは完売しています。
オンラインで見れるかもしれないので、気になる方はチェックしておきましょう。