発売日：2024/09/30
出版社：近代科学社
ISBN：9784764907102

サンプルサンプル

最適化のための強化学習

Name: 最適化のための強化学習
Brand: 近代科学社
Price: 3520.0 JPY
ISBN: 9784764907102

最適化のための強化学習

久保幹雄 (監修)

小林和博

3,520 円（税込）

SALE 売り切れ

ためし読み

発売日：2024/09/30
出版社：近代科学社
ISBN：9784764907102

ネットストア在庫詳細

読み込み中...

My店舗在庫

My店舗登録で店頭在庫と店舗お受け取り可否が確認できます。(要ログイン)

店舗在庫

全店舗の在庫一覧

商品説明

　本書では、強化学習における基本的な考え方や計算手法を紹介し、実際にPython を用いて実現する方法をまとめている。具体的にはマルコフ決定過程、価値関数、方策評価、方策反復、価値反復、モンテカルロ評価、SARSA、Q学習を扱う。ほとんどの内容は簡単な数学の知識があれば問題なく理解できるよう記...

商品説明

　本書では、強化学習における基本的な考え方や計算手法を紹介し、実際にPython を用いて実現する方法をまとめている。具体的にはマルコフ決定過程、価値関数、方策評価、方策反復、価値反復、モンテカルロ評価、SARSA、Q学習を扱う。ほとんどの内容は簡単な数学の知識があれば問題なく理解できるよう記述し、読者の学びやすさを優先して繰り返しの説明や既出の数式を再掲するなど工夫している。Pythonの基礎から強化学習の利用までを詳細に解説した充実の一冊。

第1章　Python で強化学習を行うための環境構築1.1 オンラインサービスを利用する方法1.2 手元のコンピュータに実行環境を整える方法1.3 パッケージのインストール1.4 実行環境第2章　Python の基礎2.1 データ構造2.2 科学技術計算パッケージNumPy2.3 条件分岐2....

第1章　Python で強化学習を行うための環境構築
1.1 オンラインサービスを利用する方法
1.2 手元のコンピュータに実行環境を整える方法
1.3 パッケージのインストール
1.4 実行環境

第2章　Python の基礎
2.1 データ構造
2.2 科学技術計算パッケージNumPy
2.3 条件分岐
2.4 繰り返し処理
2.5 擬似乱数生成パッケージrandom
2.6 可視化ライブラリMatplotlib
2.7 関数
2.8 内包表記

第3章　強化学習の概要

第4章　マルコフ決定過程
4.1 マルコフ性
4.2 推移確率行列
4.3 マルコフ過程
4.4 マルコフ報酬過程
4.5 リターン
4.6 価値関数
4.7 方策
4.8 マルコフ決定過程

第5章　動的計画
5.1 例1: 整数の和
5.2 例2: 最短路問題
5.3 動的計画による価値関数の評価
5.4 方策評価
5.5 方策改善
5.6 方策反復
5.7 価値反復

第6章　モンテカルロ学習
6.1 全幅探索とサンプル探索
6.2 モンテカルロ方策評価
6.3 First-visit モンテカルロ方策評価
6.4 Every-visit モンテカルロ方策評価
6.5 平均の増分計算

第7章　Temporal Difference 学習
7.1 TD(0) 学習
7.2 オンポリシー学習とオフポリシー学習
7.3 オンポリシーモンテカルロ学習
7.4 オンポリシーTD 学習ーSARSA
7.5 オフポリシーTD 学習ーQ 学習

詳細を表示する

カスタマーレビュー

honto本の通販ストアのレビュー(0件)

並び順:

1/1ページ

最近チェックした商品

サンプル

サンプル

サンプル

最適化のための強化学習

最適化のための強化学習

カスタマーレビュー

honto本の通販ストアのレビュー(0件)

最近チェックした商品

コミック

新書・選書

文庫

文芸

学習参考書

児童書

芸術

人文

語学

ビジネス·経済·法律

医学·福祉

理工

コンピュータ

実用

地図旅行

雑誌

輸入雑貨