最強囲碁AI アルファ碁 解体新書 深層学習、モンテカルロ木探索、強化学習から見たその仕組み


最強囲碁AI アルファ碁 解体新書 深層学習、モンテカルロ木探索、強化学習から見たその仕組み


翔泳社


著者:大槻知史
監修:三宅陽一郎


はじめに
監修のことば
目次
対局レポート アルファ碁と世界ナンバーワン棋士・柯潔九段の最終決戦

Chapter1 アルファ碁の登場
01 ゲームAIの歴史と進歩
02 天才デミス・ハサビスの登場
03 アルファ碁の活躍
04 囲碁AIの基礎
05 まとめ

Chapter2 ディープラーニング ~囲碁AIは瞬時にひらめく~
01 ディープラーニングとは
02 手書き数字認識の例
03 アルファ碁における畳み込みニューラルネットワーク
04 ChainerでCNNを学習させてみる
05 まとめ

Chapter3 強化学習~囲碁AIは経験に学ぶ~
01 強化学習とは
02 強化学習の歴史
03 多腕バンディット問題
04 迷路を解くための強化学習
05 テレビゲームの操作獲得のための強化学習
06 アルファ碁における強化学習
07 まとめと課題

Chapter4 探索~囲碁AIはいかにして先読みするか~
01 2人ゼロ和有限確定完全情報ゲーム
02 ゲームにおける探索
03 従来のゲーム木探索(ミニマックス木探索)
04 囲碁におけるモンテカルロ木探索
05 モンテカルロ木探索の成功要因と課題
06 まとめ

Chapter5 アルファ碁の完成
01 アルファ碁の設計図
02 非同期方策価値更新モンテカルロ木探索(APV-MCTS)
03 大量のCPU・GPUの利用
04 APV-MCTSの効果
05 アルファ碁の弱点
06 アルファ碁の先の未来

Appendix1 数式について
01 畳み込みニューラルネットワークの学習側の導出
02 強化学習の学習則の導出

Appendix2 囲碁プログラム用のUIソフト「GoGui」およびGoGui用プログラム「DeltaGo」の利用方法
01 DeltaGoとは
02 GoGuiのインストールとGoGui用プログラム「DeltaGo」の利用方法

おわりに
検索キーワード

書籍目次

Posted by shi-n