R初学者のためのオススメ書籍

スポンサーリンク

データ分析を行うにあたって Python と並んで人気の言語が R です。様々な統計解析や可視化を簡単なコマンドで実行でき、SQL の集計ではカバーできない範囲の分析を行う際には私もよく使用しています。

この記事では、私が R を学ぶ際に参考にした書籍を紹介したいと思います。高度な ML Ops の構築や深層学習といったものまではカバーできていませんが、アドホックに分析を行うにあたってはまずはこれらの書籍の内容をカバーできれば太刀打ちできると思います。

手を動かしながら R を学ぶ

最初に R を学ぶ際におススメしたいのが「Rによるやさしい統計学」です。

Rの初歩の初歩から始め、基礎的な仮説検定から始めることで手を動かしながら R と初歩的な統計学を学ぶことができます。

とりあえず R に手を付けてみたい方であったり、R と統計学を一緒に学びたい方であれば、まずはこの本から始めてみるのが良いと考えています。説明も易しく、複雑な数式や理論が出てくるわけではないので、まさに初学者向けの本と言えます。 

 

様々な分析手法を習得する

こちらは現場で活用できる様々な分析手法の紹介やケーススタディと、それを R で記述する際のサンプルコードが記載されています。

主成分分析や因子分析といった次元削減、クラスター分析、線形 / 非線形の回帰分析、生存分析や時系列データの分析、樹木モデルや集団学習など、紹介されている範囲も広く、この本に記載されている内容をマスターすれば様々な業務でそれらを活用できること間違いなしです。

 こちらも初版は 2007年と古めですが、2017年に第二版も発行されており、長年愛されるロングセラーとして持っておくのが良いと思います。

   

R でベイズ統計モデリングを学ぶ

ベイズ統計モデリングも、分析の実業務では活用する機会があるかと思います。

そのベイズ統計モデリングを学びつつ、R でのコーディングを学べるのがこちらの本です。通称「アヒル本」と呼ばれてデータサイエンティストの方々に親しまれている本です。

ベイズ統計モデリングを行う際は R のほかに、Stan という言語を使うことになりますが、このアヒル本ではその Stan の書き方も易しく書かれており、基本的な単回帰分析から最後のほうまで行くと状態空間モデルや多層ベイズモデルといったより柔軟で複雑なモデルについても学ぶことができます。

R だけでなく、とりあえず Stan を勉強してベイズ統計モデリングをできるようになりたいという方にもおススメの1冊です。 

最近でたこちらも内容としては初学者にもわかりやすいように書かれており、かつ上のアヒル本ではカバーされていない範囲も載っていたりするので、併せて読むとよりベイズ統計モデリングに関する理解が深まるかと思います。