Jiaming Ji (吉嘉铭) 个人学术档案

引用次数

	总计	2019 年至今
引用	646	645
h 指数	10	10
i10 指数	11	11

480

240

120

360

2022202320243 167 474

开放获取的出版物数量

查看全部

4 篇文章

0 篇文章

可查看的文章

无法查看的文章

根据资助方的强制性开放获取政策

合著作者

Yaodong YangBOYA (博雅) Assistant Professor at Peking University在 pku.edu.cn 的电子邮件经过验证
Xuehai PanPeking University在 pku.edu.cn 的电子邮件经过验证
Boyuan ChenPeking University在 stu.pku.edu.cn 的电子邮件经过验证
Tianyi (Alex) QiuPeking University在 stu.pku.edu.cn 的电子邮件经过验证
Hantao LouPeking University在 stu.pku.edu.cn 的电子邮件经过验证
Yiran GengTuring Class, Peking University在 stu.pku.edu.cn 的电子邮件经过验证
Yuanpei ChenSouth China University of Technology在 stanford.edu 的电子邮件经过验证

关注

Jiaming Ji (吉嘉铭)

Peking University

在 stu.pku.edu.cn 的电子邮件经过验证 - 首页

AI Alignment Reinforcement Learning Large Language Model


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Baichuan 2: Open large-scale language models A Yang, B Xiao, B Wang, B Zhang, C Bian, C Yin, C Lv, D Pan, D Wang, ... arXiv preprint arXiv:2309.10305, 2023	238*	2023
Beavertails: Towards improved safety alignment of llm via a human-preference dataset J Ji, M Liu, J Dai, X Pan, C Zhang, C Bian, R Sun, Y Wang, Y Yang NeurIPS 2023, 2023	104	2023
Ai alignment: A comprehensive survey J Ji, T Qiu, B Chen, B Zhang, H Lou, K Wang, Y Duan, Z He, J Zhou, ... arXiv preprint arXiv:2310.19852, 2023	88	2023
Safe rlhf: Safe reinforcement learning from human feedback J Dai, X Pan, R Sun, J Ji, X Xu, M Liu, Y Wang, Y Yang ICLR 2024 Spotlight, 2023	60	2023
Constrained update projection approach to safe policy optimization L Yang, J Ji, J Dai, L Zhang, B Zhou, P Li, Y Yang, G Pan NeurIPS 2022, 2022	31	2022
Safety-Gymnasium: A Unified Safe Reinforcement Learning Benchmark J Ji, B Zhang, J Zhou, X Pan, W Huang, R Sun, Y Geng, Y Zhong, J Dai, ... NeurIPS 2023, 2023	28*	2023
Omnisafe: An infrastructure for accelerating safe reinforcement learning research J Ji, J Zhou, B Zhang, J Dai, X Pan, R Sun, W Huang, Y Geng, M Liu, ... arXiv preprint arXiv:2305.09304, 2023	19	2023
Aligner: Achieving efficient alignment through weak-to-strong correction J Ji, B Chen, H Lou, D Hong, B Zhang, X Pan, J Dai, Y Yang arXiv preprint arXiv:2402.02416, 2024	13	2024
Heterogeneous-Agent Reinforcement Learning Y Zhong, JG Kuba, S Hu, J Ji, Y Yang JMLR, 2023	12	2023
Cup: A conservative update policy algorithm for safe reinforcement learning L Yang, J Ji, J Dai, Y Zhang, P Li, G Pan arXiv preprint arXiv:2202.07565, 2022	12	2022
Pku-beaver: Constrained value-aligned llm via safe rlhf J Dai, X Pan, J Ji, R Sun, Y Wang, Y Yang	10	2023
SafeDreamer: Safe Reinforcement Learning with World Models W Huang, J Ji, B Zhang, C Xia, Y Yang ICLR 2024, 2023	7	2023
Bi-DexHands: Towards Human-Level Bimanual Dexterous Manipulation Y Chen, Y Geng, F Zhong, J Ji, J Jiang, Z Lu, H Dong, Y Yang IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023	6	2023
VOCE: Variational Optimization with Conservative Estimation for Offline Safe Reinforcement Learning J Guan, G Chen, J Ji, L Yang, A Zhou, Z Li NeurIPS 2023, 2023	6	2023
Augmented proximal policy optimization for safe reinforcement learning J Dai, J Ji, L Yang, Q Zheng, G Pan Proceedings of the AAAI Conference on Artificial Intelligence 37 (6), 7288-7295, 2023	6	2023
Rethinking Information Structures in RLHF: Reward Generalization from a Graph Theory Perspective T Qiu, F Zeng, J Ji, D Yan, K Wang, J Zhou, H Yang, J Dai, X Pan, Y Yang arXiv preprint arXiv:2402.10184, 2024	4	2024
MyoChallenge 2022: Learning contact-rich manipulation using a musculoskeletal hand V Caggiano, G Durandau, H Wang, A Chiappa, A Mathis, P Tano, N Patel, ... NeurIPS 2022 Competition Track, 233-250, 2023	2	2023
Language Models Resist Alignment J Ji, K Wang, T Qiu, B Chen, JZCLHL YaodongYang, PKUA Team arXiv preprint arXiv:2406.06144, 2024		2024
The application of large language models in medicine: A scoping review X Meng, X Yan, K Zhang, D Liu, X Cui, Y Yang, M Zhang, C Cao, J Wang, ... Iscience, 2024		2024
AI アラインメント: 包括的サーベイ J Ji, T Qiu, B Chen, B Zhang, HLK Wang, YDZHJ Zhou, ZZFZJ Dai, ...

系统目前无法执行此操作，请稍后再试。

文章 1–20

每年引用数

重复的引用

合并的引用

添加合著者合著作者

上传 PDF

关注此作者

引用次数

合著作者

引用