Rでロジットモデル推定glm()関数を使う http://cse.naro.affrc.go.jp/takezawa/r-tips/r/72.html
CART Classification and Regression TreeCART のまとめは一度書いたがもう一度トライ 主に、Breiman Friedman, Olshen, Stone (BFOS)と下川・杉本・後藤に基づく。CARTは次の3つのプロセスから構成される (i) Tree を 最大まで(基準を満たすまで)成長させ…
RでCART rpart パッケージを使う。Recursive Partitioning: Large Companies and Glaucoma Diagnosis https://cran.r-project.org/web/packages/HSAUR/vignettes/Ch_recursive_partitioning.pdf (これが一番詳しい) https://www.r-bloggers.com/using-cart-i…
Causal inference 文献 Neyman, JerzyPotential outcomes Neyman, Jerzy. 1923 [1990]. “On the Application of Probability Theory to Agricultural Experiments. Essay on Principles. Section 9.” Statistical Science 5 (4): 465–472. Trans. Dorota M. …
R 論理演算子http://cse.naro.affrc.go.jp/takezawa/r-tips/r/28.html ==, != など
Random forest : Use of out-of-bag data Generalization error を推定するout-of-bag 推定という巧妙な方法がある。Generalization errorは ] で定義される。ただし はトレーニングセットRandom Forest は、Bagging (Bootstrap aggregation)とtreeのsplit …
Causal Inference by Imbens and Rubin Chapter 1 Causality : Basic Framework以下のサイトに資料あり https://www2.stat.duke.edu/courses/Spring14/sta320.01/Chapter 3 Assignment mechanism Def. 1 Individualistic assignment Def2. Probabilistic ass…
Random Forest と統計的推論Athey and Wager Wager established asymptotic normality of predictor. Wager, Hastie and Efron (2014) proposed the infinitesimal jackknife to construct a confidence interval with Random Forest. Q:regression tree …
BoostingBoosting の考え方は非常に面白い。 Base Learner の弱いところを見つけ、強化していく。 Boosting はメタアルゴリズム。(Base Learner がインプット。) 複数回強化したBase Learner の重み付平均(重み付投票)が Boosting learner である。CART…
CART Classification and Regression Tree Binary tree model Classifier Learning set the set of measurements the set of classes d: classifier (clasification rule) Criterion for which variable to use for splits Gini index をimpurity measure に…
Bagging が有効な予測量 unstable な予測 CART regression after variable selection
R 確率分布に関連する関数 pnorm, dnorm, qnor,m rnorm http://cse.naro.affrc.go.jp/takezawa/r-tips/r/60.html
Bagging and Random Forest difference between Bagging and Random forest https://www.quora.com/What-are-the-differences-between-bagged-trees-and-random-forests 疑問:Random ForestのBagging に対する優位性はあるのか?
LASSO Tibshirani http://statweb.stanford.edu/~tibs/lasso.html Statistical inference in LASSO https://arxiv.org/abs/1311.6238
BreimanとCutler のrandom forestのページ https://www.stat.berkeley.edu/~breiman/RandomForests/ http://www.math.usu.edu/adele/RandomForests/index.htm Random forest のアルゴリズム サイズ のブートストラップ標本をから 生成する。 Breiman は1994…
統計学のリソース STATISTICAL METHODS FOR RESEARCH WORKERS By Ronald A. Fisher (1925) http://psychclassics.yorku.ca/Fisher/Methods/ random http://www.randomservices.org/random/index.html
Random assignment https://en.wikipedia.org/wiki/Random_assignment#cite_note-Neyman-6 https://psychclassics.yorku.ca/Peirce/small-diffs.htm Random assignment の最も早い時点の提唱者がCharles Peirce であったことに驚いた。 Random assignment の…
双曲線関数 https://mathtrain.jp/hyperbolic http://examist.jp/mathematics/math-3/function/soukyokusen-gyakukansuu/
Tex テクニック 1文で右揃えする方法 証明された。\hfill $\Box$ 数式での空白制御 http://cns-guide.sfc.keio.ac.jp/2004/11/4/7.html
LASSOの一般形 はf のcomplexityを意味する はデータから決める Tibshirani type Use cross validation to choose
Causal inference の一般形 を反応変数とすると一般形は以下のように書ける。 あるいは ただしは確率分布の集合からへの写像。
Tex での表示例 が成り立つようなを特徴付けなさい。 参考(はてなブログでTexを書く方法) https://www.milkmemo.com/entry/hatena_tex https://minus9d.hatenablog.com/entry/2014/08/10/233945
Tex 文章 箇条書き 箇条書きの微調整 カウンタの調整の方法が理解できていないが、以下のページに 説明がある。 http://www3.otani.ac.jp/fkdsemi/pLaTeX_manual/kajyo.html
Tex 文章 フォントサイズ http://www.latex-cmd.com/style/size.html 空白、改行など(長さの単位も) http://www.latex-cmd.com/struct/space.html 書体とフォント. Typewriter 書体など https://hwb.ecc.u-tokyo.ac.jp/current/applications/latex/font/ 入…
R 行列の定義と計算 〇データサイエンスの中心は行列計算 データサイエンスは多数の変数からなるデータを扱い、行列の計算はデータサイエンスにおいては最も基本的演算である。その意味で、専門家以外でも常識として知っていなければならない知識であり、高…
Tex 数式 コマンド集(忘れたときに見やすい) http://www.latex-cmd.com/equation/sum_product.html 数式入力の作法 東北大学の黒木氏の文書 https://www.math.tohoku.ac.jp/~kuroki/LaTeX/howtolatex.html に丁寧に書かれていて大変便利。たとえば、 積分…
Tex amsmathパッケージ cases 環境 数式で場合分けが簡単にできる http://www.latex-cmd.com/equation/if.html cases 環境は、自動で中括弧を書いてくれる。コードが簡潔。
Tex 定理環境 amsthm を用いて定理環境を作っている。 amsthmを用いると定理番号の後にピリオドが着くが、これをなくす方法。 https://www.biwako.shiga-u.ac.jp/sensei/kumazawa/tex/amsthm.html 東北大学の黒木氏のページにもamsthm パッケージを用いると…
Rのリソース マニュアル、テキスト Rについてのマニュアル、テキスト類は多いが、 まずはRの総本山 https://cran.r-project.org/ のマニュアル 日本語のマニュアルもある https://cran.r-project.org/doc/contrib/manuals-jp/Mase-Rstatman.pdf このフォルダ…
R 確率密度関数のグラフを描く グラフの一部を塗りつぶす polygon関数 http://aaaaushisan.blogspot.com/2012/04/r_13.html polygon関数の引数の意味がこちらにわかりやすく書いてある。 http://tips-r.blogspot.com/2014/05/polygon.html