モンテカルロ法について

スポンサードリンク

モンテカルロ法

モンテカルロ法というのは・・・
乱数を使ってシミュレーション(囲碁ではプレイアウト/poと呼ぶ)を行い、
統計によって近似的に答えを求めるための方法です。

 

名前の由来は
F1やカジノで有名なモナコ公国における最大の都市【モンテカルロ】から来ているそうです。

US Air Force Academy タグ・ホイヤー タグ・ホイヤー 時計 - メンズ Monaco モナコ 腕時計

高!! 478,000円

1/18 アルピーヌ ルノー A110 モンテカルロ 1971

12,430円

タグ・ホイヤー モナコ スティーブ・マックイーン CAW2111.FC6183 TAG HEUER MONACO

高!? 318,000円

モンテカルロ法を使った例

其の壱

円

例えば…
右図のような円を考えます。

 

円の面積を求める公式というと
円の面積=半径×半径×π

 

ではでは…問題です!

半径を1cm
πを使ってはいけない

 

この条件で
皆さんは円の面積を…おおよそで良いので求めることができますか?

 

これを可能にするのが
乱数を使ったシミュレーションによるモンテカルロ法です。

 

其の二

円にペン

この円を書いた紙の上にペンを落とします。
ペンを落として、乱数的に点々をいっぱい書いてやりましょう。

 

時間があったら試してみてくださいね!
紙に適当に点をいっぱい書いたあとに円を書くのでもOKです。

 

そうすると
円の外側と内側に点々が別れたと思います。

 

点々の数を数えますよ。

 

其の参

円に点

これは僕が適当に点を書いた図です。

外側…17個
内側…56個
合計…73個

数え間違ってたらすいません(^^;)

 

ではこの点の数を使って何をするか…です。

 

次のように考えるわけです。

点の合計(73個)=四角の面積
内側の点の合計(56個)=円の面積

 

四角形の一辺を2cmとすると…

四角形の面積=2×2=4

 

四角形の面積:円の面積=73:56
四角形の面積×56=円の面積×73
4×56=円の面積×73

 

円の面積=3.068

 

四角形の一辺が2cmということは
円の半径は1cmですよね?

公式:半径1cmの円の面積=1×1×π=π
モンテカルロ:半径1cmの円の面積=3.068

 

π≒3.068

 

モンテカルロ法を使うことで

近似的な円の面積
近似的なπの値

これらを求めることができました。

 

ではでは・・・
これらを囲碁に応用するとどうなるでしょう。

 

【続き】コンピュータ囲碁とモンテカルロ

スポンサードリンク

モンテカルロ法について関連ページ

思考ゲームへの応用
コンピュータ囲碁へのモンテカルロ法の応用方法を紹介します。
強くなった理由
モンテカルロ法を使用して、コンピュータ囲碁が強くなった真の理由を歴史と共にお話します。
多腕バンディットとUCB
スロットマシンの報酬を最大にするアルゴリズムとして知られる多腕バンディット問題とUCBアルゴリズムの関係を紹介。
UCT探索
コンピュータ囲碁におけるUCT探索について簡単に紹介します。
学習によるシミュレーション改良
コンピュータ囲碁(モンテカルロ法)の改良として学習によるシミュレーションの改良などが行われています。ELOレーティング・Bradley-Terryモデル・パターン学習など。
並列化
コンピュータ囲碁の並列化に関する簡単なお話です。
定石データベース・詰碁探索
コンピュータ囲碁に使われている定石データベースや詰碁探索についてお話します。

logo logo logo