background preloader

Statistics

Facebook Twitter

Introduction to R for Data Mining. Rでウォーリを探してみた. マルコフ連鎖モンテカルロ法. 求められる特性を持つマルコフ連鎖を作成することは通常難しくない。 問題は許容できる誤差内で定常分布に収束する試行の回数を決めることである。 適切な連鎖なら任意の位置から始めても定常分布に速く達し、これを高速混合(rapid mixing)とよぶ。 典型的なMCMCは常にある程度の初期値の影響が残るため目標分布しか近似することができない。 CFTP法(coupling from the past)など、より洗練されたMCMCベースのアルゴリズムは完全標本を作成することができるが、より多くの計算と(期待値では有限だが)限界のない実行時間を要する[1]。 このアルゴリズムの最も一般的な応用は多重積分を数値的に計算することである。 多重積分はベイズ統計学、計算物理学、計算生物学などにしばしば現れるため、そのような分野でMCMC法も広く使われている。 ランダムウォーク法[編集] マルコフ連鎖モンテカルロ法において、均衡分布の近辺を小さなステップで無作為に動き回る粒子を想定したアルゴリズムが多い。 M-H アルゴリズム:提案密度(proposal density)と提案された候補の棄却法を用いてランダムウォークを生成する。

ランダムウォークの回避[編集] より洗練されたマルコフ連鎖モンテカルロ法は粒子が折り返してしまうのを防ぐなんらかの方策を用いる。 SOR法:モンテカルロ法を応用したSOR法はギブスサンプリングの一種とみなすことができ、ランダムウォークを避けることがある。 次元の変化[編集] 関連記事[編集] 拡張アンサンブル法 参考文献[編集] ^ 来嶋秀治、松井知己、完璧にサンプリングしよう、 "オペレーションズ・リサーチ",vol. 50 (2005),第一話「遥かなる過去から」, no. 3, pp. 169--174, 第二話「天と地の狭間で」, no. 4, pp. 264--269, 第三話「終りある未来」, no. 5, pp. 329--334.^ Jeff Gill (2008). データマイニングで使われるトップ10アルゴリズム - iAnalysis ~おとうさんの解析日記~ ぼくのかんがえたとうけいがくぶかりきゅらむ - iAnalysis ~おとうさんの解析日記~

連載:機械学習 はじめよう.