2018年4月16日月曜日

データサイエンティストの成分の8割は

こんにちは。2年目になったエンジニアの佐々木です。

今日は読書の春(?)ということで今読んでいる本を紹介します。
その名も、「前処理大全」という本です。

この本はこのごつい名前からもわかる通り、機械学習のモデルの話ではなく
前処理の話が全てというとても漢気溢れる本です。
しかし、前処理は非常に大事で、データサイエンティストの仕事の
8割は前処理だと言われるくらいです。

この本のいいところは本の随所にAwesome(素晴らしい)なコード例が
SQL、R、Pytnonで載っているのと、Not Awesome(やらないほうがいい)な
コード例が載っていることです。

特にやらない方がいいパターンまで書いてくれるのが個人的にはうれしいです。
これのおかげで、ただパターンで覚えるのではなく、なぜそれが良いのかを
理解しながら読み進められています。

皆さんもぜひ、「前処理大全」で素敵なマエショリストになりませんか?

人気の投稿