遊覧飛行ーゲーム分析・データサイエンス・歴史・ワインー

ゲーム業界のデータアナリスト兼インディー歴史家のブログ。ゲームに関する分析の話題や歴史のトピック、さらには趣味のワインについてまで書いているブログです。

データサイエンス

【初心者におすすめ】因果推論を学ぶ超入門書

データ分析の専門会社に対して因果推論のコンサルを経験したことのある筆者が、因果推論をこれから勉強してみようか悩んでいる方におすすめする本を紹介する。

『マーケティングの統計モデル』第8章の階層ベイズモデルをStanでモデリングしてみた

はじめに 階層ベイズモデルによるブランド選択行動のモデル化 分析内容 モデル式の記述 Stan コード はじめに 『マーケティングの統計モデル』の第8章で登場する階層ベイズモデル (階層ベイズモデルによるブランド選択行動のモデル化) を Stan でモデリング…

Causal Forest 検証 (1)

はじめに Lalonde データについて Lalonde データとは ランダム化試験による因果効果 Causal Forest による因果効果の推定 複数データでの Causal Forest の検証 はじめに 最近、データサイエンスの界隈でも因果推論に関する盛り上がりが以前にも増して見ら…

機械学習を用いた因果推論のための最新 Python パッケージ "CausalML" の紹介

はじめに CausalML とは 現在 CausalML で提供されているもの CausalMLがどういう分野で適用可能か Targeting Optimization Causal Impact Analysis Personalization おわりに はじめに 本記事は H. Chen et al. (2020), "CausalML: Python Package for Caus…

読了メモ:R. Dehejia (2005), "Practical Propensity Score Matching: A Reply to Smith and Todd"

はじめに 論文の主旨 1. Smith and Todd(2005) において誤解ないしは看過されている点 2. 傾向スコアのモデル特定 (specification) に関する問題 3. 傾向スコアのモデル特定における感度 (sensitivity) の問題 はじめに 本記事は R. Dehejia (2005), "Practi…

岩波データサイエンスvol.3のCM接触の因果効果を他の方法で推定してみた(3)

はじめに Meta-Learner T-Learner S-Learner X-Learner Domain Adaptation Learner 因果効果の推定 おわりに はじめに 岩波データサイエンスvol.3のCM接触の因果効果を他の方法で推定してみた、第三弾です。第一弾で「傾向スコアマッチング」と「Causal Fore…

岩波データサイエンスvol.3のCM接触の因果効果を他の方法で推定してみた(2)

はじめに Causal Forest 因果効果の推定 おわりに はじめに 岩波データサイエンスvol.3のCM接触の因果効果を他の方法で推定してみた、第二弾です。今回は「非均質性を伴った処置効果(Heterogeneous Treatment Effects)」の推定で数年前に提唱された Causal F…

岩波データサイエンスvol.3のCM接触の因果効果を他の方法で推定してみた(1)

はじめに データの準備 手法の説明 因果効果の推定 傾向スコアマッチング はじめに 最近、業務の中で統計的因果推論の手法を適用するにあたって勉強をしており、その一環として各手法や実装方法の理解を深めるために巷に出回っているデータを用いて実験的に…

IPWsurvival パッケージを用いた統計的因果推論 x 生存分析

はじめに 継続に関する分析は簡単ではない 統計的因果推論 x 継続分析 IPWsurvival パッケージを用いた生存分析 IPW 推定量を用いずにそのまま生存分析を行う IPW 推定量を用いて生存分析を行う log-rank検定を実施 はじめに スマホゲームのようなアプリの運…

python で日本の年収分布の "推移" をグラフ化してみた

はじめに データの準備 puthon でコードを記述 実行結果 Takeaways はじめに 国税庁からサラリーマンなど民間企業で働く人の去年の平均年収が発表されました。 https://news.tbs.co.jp/newseye/tbs_newseye3789683.htmlnews.tbs.co.jp 分布が偏っているにも…

R初学者のためのオススメ書籍

データ分析を行うにあたって Python と並んで人気の言語が R です。 様々な統計解析や可視化を簡単なコマンドで実行でき、SQL の集計ではカバーできない範囲の分析を行う際には私もよく使用しています。 この記事では、私が R を学ぶ際に参考にした書籍を紹…

Google BigQuery の View でうまく Partition を指定する方法

TL; DR BigQuery の View を作成する際、Partition の情報を SELECT 句で引っ張ってきて外部参照できるようにした。 Partition を外部参照できるようにすることで、View を呼ぶときに欲しい部分だけの Partition を切ることで、取得するデータの Partition (…

施策の効果測定について -いかに因果関係を見出すか-

スマホゲームの分析を行っていると、プロデューサーやディレクター、はたまたプランナーから「この前行った○○キャンペーンの効果測定をお願いしたい」という依頼が来ることが多い (むしろ、分析を行っている人間からすれば、そのような依頼が来る前に自発的…

SQLを学ぶ上で参考になったものまとめ

自分がSQLを勉強するにあたって、参考になったサービスや書籍を紹介していくページです。

MySQLメモーDAU、課金UU、課金率の集計ー

MySQLでDAU、課金UU、課金率を集計するクエリです。

R の caret パッケージメモ~train:caret 決定木~

R の caret パッケージの使い方の備忘録です。 今回は train関数の method に "rpart" を指定し、決定木の構築を行う方法をメモします。

R の caret パッケージメモ~train:caret 一般化線形モデル~

R の caret パッケージの使い方の備忘録です。 今回は train関数の method に "glm" を指定し、一般化線形回帰モデルの構築を行う方法をメモします。

R の caret パッケージメモ~train:caret 線形回帰~

R の caret パッケージの使い方の備忘録です。 今回は train関数の method に "lm" を指定し、線形回帰モデルの作成を行う方法をメモします。