[PDF][PDF] 深度Q 学习的二次主动采样方法

赵英男, 刘鹏, 赵巍, 唐降龙 - 自动化学报, 2019 - aas.net.cn
摘要实现深度Q 学习的一种方式是深度Q 网络(Deep Q-networks, DQN).
经验回放方法利用经验池中的样本训练深度Q 网络, 构造经验池需要智能体与环境进行大量交互 …