第1章 モデルの構造
1.1 導入
1.2 ニューラルネットワーク
1.3 畳み込みニューラルネットワーク(CNN)
1.4 Transformer
1.5 グラフニューラルネットワーク(GNN)
1.6 専門家の混合(MoE)
1.7 拡散モデル
第2章 損失関数と評価指標
2.1 導入
2.2 専門分野のタスク
2.3 大規模言語モデル(LLM)
2.4 マルチモーダル大規模モデル
2.5 検索拡張生成(RAG)
2.6 視覚生成大規模モデル
第3章 モデルの学習
3.1 導入
3.2 モデルの最適化
3.3 誤差逆伝播法
3.4 パラメータ初期化
3.5 正則化
3.6 指数移動平均(EMA)
3.7 勾配流
第4章 深層強化学習
4.1 導入
4.2 理論的基礎と枠組み
4.3 アルゴリズム体系
4.4 モジュール
4.5 深層強化学習と大規模言語モデル(LLM)
4.6 マルチエージェント強化学習(MARL)
4.7 検証可能な報酬からの強化学習(RLVR)
第5章 モデルの構築
5.1 導入
5.2 軽量型モデルの構築
5.3 大規模言語モデル(LLM) の構築
5.4 マルチモーダルモデルの構築
5.5 世界モデル
第6章 実用モデル
6.1 導入
6.2 超軽量型畳み込みニューラルネットワーク(CNN) モデル
6.3 BitNet
6.4 Qwen3 シリーズモデル
6.5 検索拡張生成(RAG)
6.6 HunyuanVideo
6.7 HunyuanWorld 1.5
第7章 深層学習の説明性
7.1 導入
7.2 畳み込みニューラルネットワーク(CNN) の説明性
7.3 注意機構の説明性
7.4 グラフニューラルネットワーク(GNN) の説明性
7.5 大規模言語モデル(LLM) の説明性
7.6 マルチモーダル大規模モデルの説明性
第8章 連合深層学習
8.1 導入
8.2 基礎理論
8.3 プライバシーとセキュリティ技術
8.4 通信効率最適化
8.5 異種性問題
8.6 連合LLM
8.7 連合深層強化学習