深度学习思维导图

如题

深度学习

网络结构

线性结构

池化结构

卷积结构

LSTM

激活结构

sigmoid

ReLU

tanh

强化学习特定结构

Dueling Network

学习方式

监督学习

半监督学习

无监督学习

强化学习

理论

基础理论

TD Target

价值学习

策略学习

状态连续：神经网络

动作连续

Deterministic Policy Network

Stochastic Policy Network

多智能体

训练方式

基于价值

Sarsa

Q-Learning

DQN

基于策略

Policy Gradient

A2C

优化方法

熵正则

经验回放(off-policy适用)

Double DQN

Target network

Multi-step TD Target

Dueling network

TRPO

PPO

参数更新策略

SGD

动量

Adam