単回帰分析
すでに2年ほど前の話ですが、2021年11月、一般社団法人データサイエンティスト協会から「データサイエンティスト スキルチェックリストver.4」が発表されました。
数百項目にも及ぶ詳細なスキルチェックリストになっているので、このリストを参考にデータサイエンスに関するビジネスや技術に関するスキルを磨かれている方も多いのではないでしょうか。
今回は、そのスキルチェックリストのなかでも「データサイエンス力」の No. 56、予測 1 (回帰・分類) の項にある「単回帰分析において最小二乗法、回帰係数、標準誤差、決定係数を理解し、モデルを構築できる」の内容を参考文献をもとにまとめました。
その内容を以下の GitHub で公開しています。信頼できる文献をもとにまとめたつもりですが、もし万が一私の理解が間違っていたり、誤字・脱字があった場合は私の責任です。ご容赦ください。
「単回帰分析の基礎」の内容について
内容としては、回帰分析とは何か、そこで用いられている最小二乗法、回帰係数、標準誤差、決定係数についての説明をまとめた形になっています。
前半が上記の概念についての説明で、終盤に python によるサンプルコードを簡単ではありますが載せてあります。
最後に参考文献も付けていますので、より詳しくしっかりと理解したい方はぜひ、その参考文献に当たってみてください。
今回の内容は回帰分析の基礎の基礎ということで、普段からデータアナリスト、データサイエンティストとして活躍されている方々には当たり前すぎるものかもしれません。
これからデータサイエンスの勉強をしようと思っている方、データアナリストとしてキャリアを歩み始めているが統計解析まわりをこれから勉強されている方など、これからデータサイエンスを勉強していこうと思っている方々の参考になればよいなと思います。