学習とそのアルゴリズム


学習とそのアルゴリズム POD版―ニューラルネットワーク・遺伝アルゴリズム・強化学習


森北出版


編者:電気学会 GA・ニューロを用いた学習法とその応用調査専門委員会


序文
目次

第1章 ニューラルネットワークとその学習アルゴリズムの基礎
1.1 ニューラルネットワークとその学習アルゴリズム
1.2 2結合層ニューラルネットワークの入出力方程式
1.3 教師付き学習問題の定式化と解の存在性
1.4 学習アルゴリズム
1.4.1 学習問題の数値計算上の特徴
1.4.2 勾配系学習アルゴリズムー最急降下法による学習アルゴリズム
1.4.3 慣性系学習アルゴリズム
1.4.4 可変計量勾配系学習アルゴリズムー準ニュートン法による学習アルゴリズム
1.5 ベンチマークによるテスト計算結果
文献

第2章 ニューラルネットワークによる連想記憶とその学習法
2.1 連想記憶モデル
2.2 ポップフィールドネットワーク
2.3 BAM
2.4 連想記憶モデルの学習法
2.4.1 連立不等式の解法1(緩和法)
2.4.2 連立不等式の解法2(擬似緩和法)
2.4.3 PRLAB
2.4.4 クイック学習
2.4.5 交点学習
2.4.6 各学習法の比較
2.5 まとめ
文献

第3章 ファジィニューロの学習アルゴリズム
3.1 学習ベクトル量子化とファジィニューラルネットワーク
3.1.1 LVQによるメンバシップ関数の自動生成
3.1.2 連想によるファジィ推論
3.2 適応事例
3.2.1 適応制御への適応例
3.2.2 ヒューマンインタフェースへの適用例
文献

第4章 ニューラルネットワークによる電力需要予測
4.1 翌日最大電力需要について
4.2 翌日最大電力需要予測システムの概要
4.2.1 基準需要
4.2.2 季節分類
4.2.3 平日・平日以外および特異期間
4.2.4 基準需要の補正
4.2.5 電力需要の長期的増加への対応
4.2.6 翌日最大電力需要予測の流れ
4.3 ニューラルネットワークの学習
4.3.1 季節分類ネットワークの学習
4.3.2 基準需要予測用ネットワークの学習
4.3.3 基準需要補正用ネットワークの学習
4.4 翌日最大電力需要予測結果
4.5 まとめ
文献

第5章 遺伝アルゴリズムと機械学習の基礎
5.1 はじめに
5.2 遺伝アルゴリズム
5.3 遺伝的機械学習
5.3.1 Pittsアプローチ
5.3.2 Michiganアプローチ
5.3.3 2つのアプローチの比較
5.4 スケジューリングへの適用例
5.4.1 優先度を用いたスケジューリング
5.4.2 GBMLの適用方法
5.4.3 計算例
5.5 終わりに
文献

第6章 ニューラルネット・遺伝アルゴリズムの金融工学への応用
6.1 はじめに
6.2 金融資産と金融市場
6.2.1 オプション
6.2.2 オプション価格公式
6.2.3 デルタヘッジ
6.2.4 株価の確率過程
6.2.5 金融市場
6.3 オプション価格公式とニューラルネット・遺伝プログラミング
6.3.1 ニューラルネットの応用
6.3.2 遺伝プログラミングの応用
6.4 人工株式市場と遺伝アルゴリズム
6.4.1 株式価格付けの問題
6.4.2 人工株式市場を用いた株式価格付け方法
6.4.3 人工株式市場のシミュレーション結果
6.5 まとめ
文献

第7章 サッケード眼球運動の神経回路モデルとその進化的学習法
7.1 はじめに
7.2 サッケード眼球運動とその神経生理学的知見
7.2.1 サッケード眼球運動と脳幹に関する試験系生理学的知見
7.2.2 上丘と上位中枢に関する神経生理学的知見
7.3 2次元サッケード眼球運動モデル
7.3.1 サッケード眼球運動モデルのダイナミクス
7.3.2 サッケード眼球運動モデルの入出力情報
7.4 分散型サッケード眼球運動モデルのパラメータ学習
7.4.1 学習の考え方
7.4.2 上丘の側制御相互結合の学習
7.4.3 フィードフォワード係数とフィードバック係数の学習
7.5 シミュレーションの結果
7.5.1 上丘の側制御相互結合の学習
7.5.2 サッケード眼球運動の生成
7.5.3 インターラプテッドサッケードの生成
7.5.4 遅延メモリーサッケードの生成
7.5.5 サッケード眼球運動モデルの評価
7.6 まとめと今後の課題
7.6.1 まとめ
7.6.2 今後の課題
文献

第8章 強化学習とそのアルゴリズム
8.1 はじめに
8.2 強化学習の特徴と種類
8.2.1 強化学習の特徴
8.2.2 強化学習の基礎
8.2.3 動的計画法
8.2.4 TD学習
8.2.5 モンテカルロ(MC)法
8.2.6 nステップTD予測
8.2.7 TD(λ)アルゴリズムと適格度トレース
8.2.8 アクタークリティック手法
8.2.9 分類子システムを用いた強化学習
8.3 Q-learningのアルゴリズム
8.3.1 Q-learningの基本的なアルゴリズム
8.3.2 Q(λ)
8.3.3 Dyna-Q
8.3.4 履歴記憶型のQ-learning
8.4 強化学習の適用事例
8.4.1 マルチエージェントによる追跡問題
8.4.2 Acrobotによる大車輪学習問題
8.5 おわりに
文献

第9章 学習オートマトン理論とそのアルゴリズム
9.1 はじめに
9.2 学習オートマトンの基礎理論
9.2.1 基本定義
9.2.2 学習オートマトンの評価基準
9.2.3 強化法の2つの一般形
9.2.4 典型的な強化法
9.3 強化学習システムをモデル化するための学習オートマトン
9.3.1 連想強化学習アルゴリズムAR-P
9.3.2 REINFORCE
9.3.3 Q学習機能を有する学習オートマトン
9.3.4 学習オートマトン計算法
9.4 おわりに
文献

索引

書籍目次

Posted by shi-n