Backstepping Temporal Difference Learning

文章

学术资源搜索

获得 1 条结果（用时0.03秒）

我的图书馆

Backstepping Temporal Difference Learning

在引用文章中搜索

[PDF] arxiv.org

Analysis of Off-Policy Multi-Step TD-Learning with Linear Function Approximation

D Lee - arXiv preprint arXiv:2402.15781, 2024 - arxiv.org

This paper analyzes multi-step TD-learning algorithms within thedeadly triad'scenario,
characterized by linear function approximation, off-policy learning, and bootstrapping. In …