causal_statのノート

R, Tex, データサイエンスに関するノート

Rでロジットモデル推定

Rでロジットモデル推定glm()関数を使う http://cse.naro.affrc.go.jp/takezawa/r-tips/r/72.html

CART : RでCART

CART Classification and Regression TreeCART のまとめは一度書いたがもう一度トライ 主に、Breiman Friedman, Olshen, Stone (BFOS)と下川・杉本・後藤に基づく。CARTは次の3つのプロセスから構成される (i) Tree を 最大まで(基準を満たすまで)成長させ…

RでCART, Random Forest:リソース

RでCART rpart パッケージを使う。Recursive Partitioning: Large Companies and Glaucoma Diagnosis https://cran.r-project.org/web/packages/HSAUR/vignettes/Ch_recursive_partitioning.pdf (これが一番詳しい) https://www.r-bloggers.com/using-cart-i…

Causal inference オリジナル文献

Causal inference 文献 Neyman, JerzyPotential outcomes Neyman, Jerzy. 1923 [1990]. “On the Application of Probability Theory to Agricultural Experiments. Essay on Principles. Section 9.” Statistical Science 5 (4): 465–472. Trans. Dorota M. …

R 論理演算子

R

R 論理演算子http://cse.naro.affrc.go.jp/takezawa/r-tips/r/28.html ==, != など

Random forest : Use of out-of-bag data

Random forest : Use of out-of-bag data Generalization error を推定するout-of-bag 推定という巧妙な方法がある。Generalization errorは ] で定義される。ただし はトレーニングセットRandom Forest は、Bagging (Bootstrap aggregation)とtreeのsplit …

Causal Inference by Imbens and Rubin

Causal Inference by Imbens and Rubin Chapter 1 Causality : Basic Framework以下のサイトに資料あり https://www2.stat.duke.edu/courses/Spring14/sta320.01/Chapter 3 Assignment mechanism Def. 1 Individualistic assignment Def2. Probabilistic ass…

Random forest : Statistical inference

Random Forest と統計的推論Athey and Wager Wager established asymptotic normality of predictor. Wager, Hastie and Efron (2014) proposed the infinitesimal jackknife to construct a confidence interval with Random Forest. Q:regression tree …

Boosting

BoostingBoosting の考え方は非常に面白い。 Base Learner の弱いところを見つけ、強化していく。 Boosting はメタアルゴリズム。(Base Learner がインプット。) 複数回強化したBase Learner の重み付平均(重み付投票)が Boosting learner である。CART…

CART 1

CART Classification and Regression Tree Binary tree model Classifier Learning set the set of measurements the set of classes d: classifier (clasification rule) Criterion for which variable to use for splits Gini index をimpurity measure に…

Bagging

Bagging が有効な予測量 unstable な予測 CART regression after variable selection

R 確率分布に関連する関数

R

R 確率分布に関連する関数 pnorm, dnorm, qnor,m rnorm http://cse.naro.affrc.go.jp/takezawa/r-tips/r/60.html

Bagging and Random Forest 

Bagging and Random Forest difference between Bagging and Random forest https://www.quora.com/What-are-the-differences-between-bagged-trees-and-random-forests 疑問:Random ForestのBagging に対する優位性はあるのか?

LASSO

LASSO Tibshirani http://statweb.stanford.edu/~tibs/lasso.html Statistical inference in LASSO https://arxiv.org/abs/1311.6238

Random forest : main idea

BreimanとCutler のrandom forestのページ https://www.stat.berkeley.edu/~breiman/RandomForests/ http://www.math.usu.edu/adele/RandomForests/index.htm Random forest のアルゴリズム サイズ のブートストラップ標本をから 生成する。 Breiman は1994…

統計学のリソース

統計学のリソース STATISTICAL METHODS FOR RESEARCH WORKERS By Ronald A. Fisher (1925) http://psychclassics.yorku.ca/Fisher/Methods/ random http://www.randomservices.org/random/index.html

Random assignment

Random assignment https://en.wikipedia.org/wiki/Random_assignment#cite_note-Neyman-6 https://psychclassics.yorku.ca/Peirce/small-diffs.htm Random assignment の最も早い時点の提唱者がCharles Peirce であったことに驚いた。 Random assignment の…

双曲線関数

双曲線関数 https://mathtrain.jp/hyperbolic http://examist.jp/mathematics/math-3/function/soukyokusen-gyakukansuu/

Tex 小技

Tex

Tex テクニック 1文で右揃えする方法 証明された。\hfill $\Box$ 数式での空白制御 http://cns-guide.sfc.keio.ac.jp/2004/11/4/7.html

LASSOの一般形

LASSOの一般形 はf のcomplexityを意味する はデータから決める Tibshirani type Use cross validation to choose

Causal inference の一般形

Causal inference の一般形 を反応変数とすると一般形は以下のように書ける。 あるいは ただしは確率分布の集合からへの写像。

はてなブログでTexを書く方法

Tex

Tex での表示例 が成り立つようなを特徴付けなさい。 参考(はてなブログでTexを書く方法) https://www.milkmemo.com/entry/hatena_tex https://minus9d.hatenablog.com/entry/2014/08/10/233945

Tex 箇条書き

Tex

Tex 文章 箇条書き 箇条書きの微調整 カウンタの調整の方法が理解できていないが、以下のページに 説明がある。 http://www3.otani.ac.jp/fkdsemi/pLaTeX_manual/kajyo.html

Tex 文章 小技

Tex

Tex 文章 フォントサイズ http://www.latex-cmd.com/style/size.html 空白、改行など(長さの単位も) http://www.latex-cmd.com/struct/space.html 書体とフォント. Typewriter 書体など https://hwb.ecc.u-tokyo.ac.jp/current/applications/latex/font/ 入…

R 行列

R

R 行列の定義と計算 〇データサイエンスの中心は行列計算 データサイエンスは多数の変数からなるデータを扱い、行列の計算はデータサイエンスにおいては最も基本的演算である。その意味で、専門家以外でも常識として知っていなければならない知識であり、高…

Tex 数式入力の作法

Tex

Tex 数式 コマンド集(忘れたときに見やすい) http://www.latex-cmd.com/equation/sum_product.html 数式入力の作法 東北大学の黒木氏の文書 https://www.math.tohoku.ac.jp/~kuroki/LaTeX/howtolatex.html に丁寧に書かれていて大変便利。たとえば、 積分…

Tex amsmathパッケージ

Tex

Tex amsmathパッケージ cases 環境 数式で場合分けが簡単にできる http://www.latex-cmd.com/equation/if.html cases 環境は、自動で中括弧を書いてくれる。コードが簡潔。

Tex 定理環境

Tex

Tex 定理環境 amsthm を用いて定理環境を作っている。 amsthmを用いると定理番号の後にピリオドが着くが、これをなくす方法。 https://www.biwako.shiga-u.ac.jp/sensei/kumazawa/tex/amsthm.html 東北大学の黒木氏のページにもamsthm パッケージを用いると…

Rのリソース

R

Rのリソース マニュアル、テキスト Rについてのマニュアル、テキスト類は多いが、 まずはRの総本山 https://cran.r-project.org/ のマニュアル 日本語のマニュアルもある https://cran.r-project.org/doc/contrib/manuals-jp/Mase-Rstatman.pdf このフォルダ…

R 確率密度関数のグラフを描く

R

R 確率密度関数のグラフを描く グラフの一部を塗りつぶす polygon関数 http://aaaaushisan.blogspot.com/2012/04/r_13.html polygon関数の引数の意味がこちらにわかりやすく書いてある。 http://tips-r.blogspot.com/2014/05/polygon.html