Ruiyang Sun 个人学术档案 - 学术资源搜索

引用次数

	总计	2019 年至今
引用	529	529
h 指数	6	6
i10 指数	6	6

0

440

220

110

330

2023202499 430

合著作者

Yaodong YangBOYA (博雅) Assistant Professor at Peking University在 pku.edu.cn 的电子邮件经过验证
Xuehai PanPeking University在 pku.edu.cn 的电子邮件经过验证
Yiran GengTuring Class, Peking University在 stu.pku.edu.cn 的电子邮件经过验证

Ruiyang Sun

Ruiyang Sun

Undergraduate student, Peking University

在 stu.pku.edu.cn 的电子邮件经过验证 - 首页

Machine Learning Reinforcement Learning AI Safety


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Baichuan 2: Open large-scale language models A Yang, B Xiao, B Wang, B Zhang, C Bian, C Yin, C Lv, D Pan, D Wang, ... arXiv preprint arXiv:2309.10305, 2023	231	2023
Beavertails: Towards improved safety alignment of llm via a human-preference dataset J Ji, M Liu, J Dai, X Pan, C Zhang, C Bian, B Chen, R Sun, Y Wang, ... Advances in Neural Information Processing Systems 36, 2024	141	2024
Safe rlhf: Safe reinforcement learning from human feedback J Dai, X Pan, R Sun, J Ji, X Xu, M Liu, Y Wang, Y Yang arXiv preprint arXiv:2310.12773, 2023	94	2023
Safety gymnasium: A unified safe reinforcement learning benchmark J Ji, B Zhang, J Zhou, X Pan, W Huang, R Sun, Y Geng, Y Zhong, J Dai, ... Advances in Neural Information Processing Systems 36, 2023	27	2023
OmniSafe: An Infrastructure for Accelerating Safe Reinforcement Learning Research J Ji, J Zhou, B Zhang, J Dai, X Pan, R Sun, W Huang, Y Geng, M Liu, ... arXiv preprint arXiv:2305.09304, 2023	24	2023
Pku-beaver: Constrained value-aligned llm via safe rlhf J Dai, X Pan, J Ji, R Sun, Y Wang, Y Yang	12	2023

系统目前无法执行此操作，请稍后再试。

文章 1–6

共建清朗的网络空间,如遇有害信息,请举报。
本站数据皆整合自互联网公开资源索引,方便科研学术方面查询,并不存储相关数据资源;如对此有异议,请联系我们解决.
© 2023 学术资源搜索 @联系我们 | 申请短期会员 | 数据源提交