causal_statのノート

R, Tex, データサイエンスに関するノート

パネルデータによる処置効果の推定

Estimation of treatment effect by panel data Estimation of average treatment effects with panel data: Asymptotic theory and implementation. Kathleen T. Li , David R. Bell

Tex で行列を書く方法

Tex

Tex amsmath を使った行列の書き方https://medemanabu.net/latex/matrix-pmatrix-bmatrix/

Synthetic Control Method (SCM)

論文SCM はパネルデータを用いてATT (処置群における平均処置効果)を推定する方法である。 コントロールユニットの系列ベクトルたちの1次結合より合成コントロールを構成する。 The Economic Costs of Conflict: A Case Study of the Basque Country. Abadi…

LASSO リソース

LASSO リソースHastie, Tibshirani and Wainwright, Statistical Learning with Sparsity: The Lasso and Generalizations SLSと省略するLASSOの計算方法 Coordinate descent, SLS, p15Elastic Net, SLS chapter 4Fused Lasso, SLSGroup LassoAdaptive Lasso…

Papers on CV

Survey Sylvain Arlot and Alain Celisse (2010). A survey of cross-validation procedures for model selection Statist. Surv.Volume 4 (2010), 40-79. Regression L. Breiman and P. Spector (1992). Submodel selection and evaluation in regression. …

Papers on U-statistics

List of papers on U-statistics by subjects Fundamental Wassily Hoeffding (1948). A Class of Statistics with Asymptotically Normal Distribution Ann. Math. Statist., Volume 19, Number 3 (1948), 293-325.Strong law W Hoeffding (1961). The stro…

Tex で索引作製

Tex

www.biwako.shiga-u.ac.jp

Tex用の変換ツール

texwiki.texjp.org 変換ツール online のものもある。

Leave-p-out Cross validation

Compute risk of prediction regression classification Compute the variance of where is subsample estimator of risk Compute the variance of the extraporated estimator

Empirical Process のリソース

Shorack and Wellnervan der Vaart and WellnerPollard Dudley

U-statistics

Variance of U-statistics Lee p12. Sefling p183 Infinite Order U-Statistics Frees (1989)Helig and NolanHoeffding decompositionU 統計量をdegree がc で互いに無相関なU統計量の和に書くことができる。 この表現をHoeffding decomposition またはANOVA…

U-statistics リソース

Bartlett lecturehttps://www.stat.berkeley.edu/~bartlett/courses/2013spring-stat210b/Bose and chatterjee この本では、U統計量の重複対数の法則の結果も説明されている。Denker Feregusan lecture noteLee

Feature selection in SVM

variable importance in SVMthe importance of predictor variables for individual classes in svmFeature slection Optimal feature selection for support vector machines Minh Hoai Nguyen , Fernando de la Torre

R関数や引数の名前の意味

R

Rの関数や関数の引数では、多くの省略形で名前がついていいるが、何をabbreviate しているか 以下に書いてあった。便利 http://jeromyanglim.blogspot.com/2010/05/abbreviations-of-r-commands-explained.htmlたとえば cex はcharacter extension の略 mgp …

Radmacher 平均

Radmacher 平均Radmacher平均のテクニックを用いて、期待値と標本平均の差の期待値の上限を求める 機械学習で有用http://ttic.uchicago.edu/~tewari/lectures/lecture9.pdf

R plot 内に数式を書く

R

https://stats.biopapyrus.jp/r/graph/expression.html

SVM and related methods

Support Vector Machine Support Vector Clustering Support Vector Regression https://cs.adelaide.edu.au/~chhshen/teaching/ML_SVR.pdf Transductive support vector machines

Rで2標本問題

Rで2標本問題竹澤氏 http://cse.naro.affrc.go.jp/takezawa/r-tips/r/65.html松岡氏の記事 2標本問題の新展開~古典的手法からカーネル法まで~ https://qiita.com/yuchi_m/items/7132b426d848dc81ad9f

統計的学習理論:リソース

統計的学習理論鈴木氏資料 http://ibisml.org/archive/ibis2012/ibis2012-suzuki.pdfVapnick氏論文 http://internet.math.arizona.edu/~hzhang/math574m/Read/vapnik.pdfSridharan氏の講義ノート(主に理論) http://www.cs.cornell.edu/courses/cs6783/2018…

Causal Inference : Categorization

Causal Inference : CategorizationTreatments : 2値、多値、順序変数、連続型 Assignments: RCT, Regular assignments Estimand: ATE, ATT Dose-response function Response variables

Causal Inference for Continuous Treatments

Causal inference for continuous treatmentsEstimation of a continuous dose-response function 〇Hirano, K. and Imbens, G. W. (2004). The propensity score with continuous treatments. In Gelman, A. and Meng, X.-L., editors, Applied Bayesian Mo…

Multi-valued treatment のPropensity Score

Multi-valued treatment のPropensity Scoreについての論文Imbens (2000), BiometrikaLechner, M. (2001): Identification and Estimation of Causal Effects of Multiple Treatments Under The Conditional Independence Assumption, in Econometric Evalua…

R glm, lm における欠損値の処理

R 欠損値の処理実際のデータ分析では欠損値が頻繁に表れる。特にglm, lm などでNAがあるobservations がdeleteされるので、 その処理に以下のページの説明が非常に役立つ。 関数complete.cases()を使う。https://stackoverflow.com/questions/23345419/r-fla…

カーネル法、カーネルトリックのリソース

カーネル法、カーネルトリックのリソース結構ある @kilometer氏のブログ https://qiita.com/kilometer/items/58376b9a103743329b2f福水氏の資料 http://www.ism.ac.jp/~fukumizu/OsakaU2014/OsakaU_1intro.pdf再生核ヒルベルト空間、その他 Jordan氏の講義ノ…

R :データフレームの因子データを数値データに変換する

R

データフレームの因子データを一括で数値データに変換するyad 氏のブログのページ https://dev.classmethod.jp/statistics/r-dataframe-lapply/

Support Vector Machine

Support Vector MachineSVMのリソースページ http://www.svms.org/「多変量解析入門」小西貞則著, (SVM、凸最適化の簡潔な説明) 「カーネル法入門」福水健次著、朝倉書店概説 https://en.wikipedia.org/wiki/Support_vector_machine (Empirical Risk Minimiz…

R 列名を指定してデータを抽出

R

R 列名を指定してデータを抽出 非常に便利。 character型のベクトルを使うことが重要ひつじ助氏のブログが有用 https://qiita.com/hitsujisuke/items/d71ee40daa0786ae1680character 型への変換はas.character() http://cse.naro.affrc.go.jp/takezawa/r-tip…

r で括弧を描く:pBrackets

R

pBrackets パッケージで簡単に括弧を描けるhttps://cran.r-project.org/web/packages/pBrackets/pBrackets.pdf例 https://cran.r-project.org/web/packages/pBrackets/vignettes/pBrackets_vignette.pdf

RでPropensity Score 分析

RでPropensity Score 分析岩波データサイエンス 加藤・星野論文のコードとデータがgithub にある https://github.com/iwanami-datascience/vol3CM接触とゲーム使用時間の因果性分析

Rでmatching : ATE, ATTの推定

Rでmatching Matching パッケージMatchIt パッケージ Ho, Imai, King, Stuart による解説 https://r.iq.harvard.edu/docs/matchit/2.4-20/matchit.pdfA Step-by-Step Guide to Propensity Score Matching in R 応用 CMの効果 https://tjo.hatenablog.com/ent…