AIとかIoTとかと一緒に聞くデータサイエンスって何?
データサイエンスについての本を知りたい!
データが価値を生み出す時代において、データサイエンスという分野はこれからますます重要になってきます。
そこで、レベルにあったデータサイエンスのおすすめ書籍を6冊厳選いたしました。データサイエンスというものが何かを知りたいという方から、実践しながらデータサイエンティストに必要なスキルを学びたいという方はぜひ参考にしてください。
初心者向け、中級者向け、上級者向けという3つのレベルに分けてご紹介していきます。
データサイエンス初心者向け
大学4年間のデータサイエンスが10時間でざっと学べる
編集部コメント
データサイエンスとは何か、から実際にどのようなことを使い、どのようなことをするのかをサクッと紹介している本です。難しい知識や数式は紹介していないため、短時間で体系的に概要を掴むには良書。
実際に参考図書も多く紹介されているので、これをきっかけに興味を持った方はそちらでさらに知識を深めることができます。
読者レビュー
データサイエンスの基礎となるコンピュータ科学や情報技術を概観できる本。トランジスタの原理から、アルゴリズム、データベース、機械学習、ディープラーニング(RNN、CNN、GANまで!)まで、本当に大学4年間分くらい幅広い内容を実際10時間程度でざっと学ぶことができます。内容は非常に整理されており、一つ一つの内容も“ミソ”となる部分が明確なので、読んで頭がとてもすっきりしました。きちんと学ぶには何冊も専門書を何日もかけて読まないといけないと思いますが、そのための参考文献や推薦図書は豊富に紹介されていました。
文系のための データサイエンスがわかる本
編集部コメント
本書は学生時代に数学がとことん嫌いになってしまった人でもわかりやすく、具体的な事例と共にデータサイエンスとは何かについて紹介してくれます。
データサイエンスを本格的に始めようとすると高度な数学的知識が必要になりますが、数式などは用いていないため、読み物としてデータサイエンスを知ることができる書籍です。
読者レビュー
https://twitter.com/4dq3kHLaATdW1Aj/status/1175802354798485505
データサイエンス中級者向け
データサイエンスのための数学 (データサイエンス入門シリーズ)
編集部コメント
データサイエンスの理解に必要となる線形代数・微分積分・確率の要点をコンパクトにまとめ、教科書としても使いやすい仕様となっています。
データサイエンスとの関係がわかるよう、様々な数学テクニックの活用事例も紹介しているので、文系理系を問わず、どのように使えるのかを理解しながら学習を進めることができます。
読者レビュー
https://twitter.com/taku555drums/status/1175722297086185472
RとPythonで学ぶ[実践的]データサイエンス&機械学習
編集部コメント
データ分析に使うプログラミング言語のRをメインとしてデータサイエンスの実務的なコードを紹介しています。pythonの機械学習も扱っていますが、本書を通じて本質的な数学の数式を使わずに図解や言葉で表現しているので、多少データサイエンスを理解している程度や言語初心者の方でも非常に役立つ書籍です。実務的コードの紹介をしているので、実践しながら学習できます。
読者レビュー
https://twitter.com/s51517765/status/1181175001799512064
データサイエンス上級者向け
Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理
編集部コメント
データサイエンスを仕事としてしたい方は避けては通れないpythonの教科書的存在です。NumPyやPandas,matplotlibといった、分析に必要なライブラリのかなりしっかりした知識が詰め込まれているので、ある程度理解している状態でさらなる知識の深化をしていきたい方は飛躍的にpythonの技術的な向上ができる良書です。
実践的な要素も多いので、仕事で使う時にも最適です。
読者レビュー
pandasすごい。
「Pythonによるデータ分析入門」を図書館で借りたんだけど、時系列データをresample ().ohlc()の1行で任意の時間足作れたり、移動平均とか相関も1行。しかも高速。
作者のWes McKinneyさんはpandas公開してくれて神。投資運用会社で作ってただけあって金融データ処理と相性いい。 pic.twitter.com/b8UBsL3rQI
— あっかぎ (@akkagi0416) August 5, 2019
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
編集部コメント
Pythonを業務で使う・使い始めるプロ向けの一冊。タイトル通り、Jupyterを用いて、それぞれのライブラリを紹介しています。データサイエンスを学ぶ上で欠かせない機械学習も重点的に扱っていて、実践的にデータサイエンスで必要な知識が体系的に書かれています。
サンプルコードもついているため、どのように動作しているかも確認しながら進めることができます。
読者レビュー
https://twitter.com/morisin0409/status/1141266023175188480
まとめ
ここまでは、
- データサイエンスって何?データサイエンティストってどんなことするの?という全く知らない人向けの書籍の紹介
- 多少聞いたり、内容は聞いたことあるけど、実際何しているの?という方向けの書籍の紹介
- データサイエンスを実際に仕事にしたい、あるいは少し始めているという方が、もっと飛躍的に上達したいという時にオススメの書籍の紹介
をしてきました。
世界的にデータサイエンティストの人材が不足しており、特に日本では高校の数学の教育課程に統計が入るほど、避けては通れない分野になっています。
今回の記事を参考に、まずは「データサイエンスとは何か・データサイエンスでできること」を理解してから、興味を持った方には、次に実際にデータサイエンスですることを理解し、最終的には仕事として活躍できるようになります。
データを扱える、というだけで企業はとても魅力的に感じるようになる時代で、今回の書籍を参考に、世界で活躍できる人材になっていきましょう。