Yuan Pu 个人学术档案 - 学术资源搜索

引用次数

	总计	2019 年至今
引用	33	33
h 指数	3	3
i10 指数	1	1

0

16

8

2022202320244 13 16

开放获取的出版物数量

1 篇文章

1 篇文章

可查看的文章

无法查看的文章

根据资助方的强制性开放获取政策

Yuan Pu

Yuan Pu

Shanghai AI Laboratory

没有经过验证的电子邮件地址 - 首页

Reinforcement Learning MCTS World Models LLMs


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Decomposed soft actor-critic method for cooperative multi-agent reinforcement learning Y Pu, S Wang, R Yang, X Yao, B Li arXiv preprint arXiv:2104.06655, 2021	17	2021
LightZero: A unified benchmark for monte carlo tree search in general sequential decision scenarios Y Niu, Y Pu, Z Yang, X Li, T Zhou, J Ren, S Hu, H Li, Y Liu Advances in Neural Information Processing Systems 36, 2024	9	2024
Boltzmann Exploration for Deterministic Policy Optimization S Wang, Y Pu, S Yang, X Yao, B Li Neural Information Processing: 27th International Conference, ICONIP 2020 …, 2020	4	2020
Context-based soft actor critic for environments with non-stationary dynamics Y Pu, S Wang, X Yao, B Li arXiv preprint arXiv:2105.03310, 2021	2	2021
ReZero: Boosting MCTS-based Algorithms by Just-in-Time and Speedy Reanalyze C Xuan, Y Niu, Y Pu, S Hu, J Yang arXiv preprint arXiv:2404.16364, 2024	1	2024
UniZero: Generalized and Efficient Planning with Scalable Latent World Models Y Pu, Y Niu, J Ren, Z Yang, H Li, Y Liu arXiv preprint arXiv:2406.10667, 2024		2024
Unifying Diverse Decision-Making Scenarios with Learned Discrete Actions Y Niu, Y Pu, Y Chen, C Xuan, Z Yang, Y Liu, H Li
Neural Discrete Reinforcement Learning Y Niu, Y Pu, C Li, Z Yang, H Li, Y Liu

系统目前无法执行此操作，请稍后再试。

文章 1–8

共建清朗的网络空间,如遇有害信息,请举报。
本站数据皆整合自互联网公开资源索引,方便科研学术方面查询,并不存储相关数据资源;如对此有异议,请联系我们解决.
© 2023 学术资源搜索 @联系我们 | 申请短期会员 | 数据源提交