2018-01-01から1年間の記事一覧
variable importance in SVMthe importance of predictor variables for individual classes in svmFeature slection Optimal feature selection for support vector machines Minh Hoai Nguyen , Fernando de la Torre
Rの関数や関数の引数では、多くの省略形で名前がついていいるが、何をabbreviate しているか 以下に書いてあった。便利 http://jeromyanglim.blogspot.com/2010/05/abbreviations-of-r-commands-explained.htmlたとえば cex はcharacter extension の略 mgp …
Radmacher 平均Radmacher平均のテクニックを用いて、期待値と標本平均の差の期待値の上限を求める 機械学習で有用http://ttic.uchicago.edu/~tewari/lectures/lecture9.pdf
https://stats.biopapyrus.jp/r/graph/expression.html
Support Vector Machine Support Vector Clustering Support Vector Regression https://cs.adelaide.edu.au/~chhshen/teaching/ML_SVR.pdf Transductive support vector machines
Rで2標本問題竹澤氏 http://cse.naro.affrc.go.jp/takezawa/r-tips/r/65.html松岡氏の記事 2標本問題の新展開~古典的手法からカーネル法まで~ https://qiita.com/yuchi_m/items/7132b426d848dc81ad9f
統計的学習理論鈴木氏資料 http://ibisml.org/archive/ibis2012/ibis2012-suzuki.pdfVapnick氏論文 http://internet.math.arizona.edu/~hzhang/math574m/Read/vapnik.pdfSridharan氏の講義ノート(主に理論) http://www.cs.cornell.edu/courses/cs6783/2018…
Causal Inference : CategorizationTreatments : 2値、多値、順序変数、連続型 Assignments: RCT, Regular assignments Estimand: ATE, ATT Dose-response function Response variables
Causal inference for continuous treatmentsEstimation of a continuous dose-response function 〇Hirano, K. and Imbens, G. W. (2004). The propensity score with continuous treatments. In Gelman, A. and Meng, X.-L., editors, Applied Bayesian Mo…
Multi-valued treatment のPropensity Scoreについての論文Imbens (2000), BiometrikaLechner, M. (2001): Identification and Estimation of Causal Effects of Multiple Treatments Under The Conditional Independence Assumption, in Econometric Evalua…
R 欠損値の処理実際のデータ分析では欠損値が頻繁に表れる。特にglm, lm などでNAがあるobservations がdeleteされるので、 その処理に以下のページの説明が非常に役立つ。 関数complete.cases()を使う。https://stackoverflow.com/questions/23345419/r-fla…
カーネル法、カーネルトリックのリソース結構ある @kilometer氏のブログ https://qiita.com/kilometer/items/58376b9a103743329b2f福水氏の資料 http://www.ism.ac.jp/~fukumizu/OsakaU2014/OsakaU_1intro.pdf再生核ヒルベルト空間、その他 Jordan氏の講義ノ…
データフレームの因子データを一括で数値データに変換するyad 氏のブログのページ https://dev.classmethod.jp/statistics/r-dataframe-lapply/
Support Vector MachineSVMのリソースページ http://www.svms.org/「多変量解析入門」小西貞則著, (SVM、凸最適化の簡潔な説明) 「カーネル法入門」福水健次著、朝倉書店概説 https://en.wikipedia.org/wiki/Support_vector_machine (Empirical Risk Minimiz…
R 列名を指定してデータを抽出 非常に便利。 character型のベクトルを使うことが重要ひつじ助氏のブログが有用 https://qiita.com/hitsujisuke/items/d71ee40daa0786ae1680character 型への変換はas.character() http://cse.naro.affrc.go.jp/takezawa/r-tip…
pBrackets パッケージで簡単に括弧を描けるhttps://cran.r-project.org/web/packages/pBrackets/pBrackets.pdf例 https://cran.r-project.org/web/packages/pBrackets/vignettes/pBrackets_vignette.pdf
RでPropensity Score 分析岩波データサイエンス 加藤・星野論文のコードとデータがgithub にある https://github.com/iwanami-datascience/vol3CM接触とゲーム使用時間の因果性分析
Rでmatching Matching パッケージMatchIt パッケージ Ho, Imai, King, Stuart による解説 https://r.iq.harvard.edu/docs/matchit/2.4-20/matchit.pdfA Step-by-Step Guide to Propensity Score Matching in R 応用 CMの効果 https://tjo.hatenablog.com/ent…
Rでロジットモデル推定glm()関数を使う http://cse.naro.affrc.go.jp/takezawa/r-tips/r/72.html
CART Classification and Regression TreeCART のまとめは一度書いたがもう一度トライ 主に、Breiman Friedman, Olshen, Stone (BFOS)と下川・杉本・後藤に基づく。CARTは次の3つのプロセスから構成される (i) Tree を 最大まで(基準を満たすまで)成長させ…
RでCART rpart パッケージを使う。Recursive Partitioning: Large Companies and Glaucoma Diagnosis https://cran.r-project.org/web/packages/HSAUR/vignettes/Ch_recursive_partitioning.pdf (これが一番詳しい) https://www.r-bloggers.com/using-cart-i…
Causal inference 文献 Neyman, JerzyPotential outcomes Neyman, Jerzy. 1923 [1990]. “On the Application of Probability Theory to Agricultural Experiments. Essay on Principles. Section 9.” Statistical Science 5 (4): 465–472. Trans. Dorota M. …
R 論理演算子http://cse.naro.affrc.go.jp/takezawa/r-tips/r/28.html ==, != など
Random forest : Use of out-of-bag data Generalization error を推定するout-of-bag 推定という巧妙な方法がある。Generalization errorは ] で定義される。ただし はトレーニングセットRandom Forest は、Bagging (Bootstrap aggregation)とtreeのsplit …
Causal Inference by Imbens and Rubin Chapter 1 Causality : Basic Framework以下のサイトに資料あり https://www2.stat.duke.edu/courses/Spring14/sta320.01/Chapter 3 Assignment mechanism Def. 1 Individualistic assignment Def2. Probabilistic ass…
Random Forest と統計的推論Athey and Wager Wager established asymptotic normality of predictor. Wager, Hastie and Efron (2014) proposed the infinitesimal jackknife to construct a confidence interval with Random Forest. Q:regression tree …
BoostingBoosting の考え方は非常に面白い。 Base Learner の弱いところを見つけ、強化していく。 Boosting はメタアルゴリズム。(Base Learner がインプット。) 複数回強化したBase Learner の重み付平均(重み付投票)が Boosting learner である。CART…
CART Classification and Regression Tree Binary tree model Classifier Learning set the set of measurements the set of classes d: classifier (clasification rule) Criterion for which variable to use for splits Gini index をimpurity measure に…
Bagging が有効な予測量 unstable な予測 CART regression after variable selection
R 確率分布に関連する関数 pnorm, dnorm, qnor,m rnorm http://cse.naro.affrc.go.jp/takezawa/r-tips/r/60.html