Ruiqi Zhang 个人学术档案 - 学术资源搜索

引用次数

	总计	2019 年至今
引用	146	146
h 指数	5	5
i10 指数	3	3

2022202320248 50 88

开放获取的出版物数量

查看全部

2 篇文章

0 篇文章

可查看的文章

无法查看的文章

根据资助方的强制性开放获取政策

合著作者

Peter BartlettProfessor, EECS and Statistics, UC Berkeley在 cs.berkeley.edu 的电子邮件经过验证
Spencer FreiUC Davis在 ucdavis.edu 的电子邮件经过验证
Mengdi WangCenter for Statistics & Machine Learning, ECE, Princeton University在 princeton.edu 的电子邮件经过验证
Xuezhou ZhangBoston University在 bu.edu 的电子邮件经过验证
Chengzhuo NiPrinceton University在 alumni.princeton.edu 的电子邮件经过验证
Andrea ZanetteAssistant Professor, Carnegie Mellon University在 andrew.cmu.edu 的电子邮件经过验证
Licong LinPhD student at UC Berkeley在 berkeley.edu 的电子邮件经过验证
Song MeiAssistant Professor at UC Berkeley在 berkeley.edu 的电子邮件经过验证
Yu BaiOpenAI在 salesforce.com 的电子邮件经过验证
Xiang JiPrinceton University在 princeton.edu 的电子邮件经过验证
Zhaorun ChenPh.D. Student, UChicago CS在 uchicago.edu 的电子邮件经过验证
Zhuokai ZhaoResearch Scientist, Meta AI在 uchicago.edu 的电子邮件经过验证
Huaxiu YaoAssistant Professor of Computer Science and Data Science, UNC Chapel Hill在 cs.unc.edu 的电子邮件经过验证
Bhiksha RajCarnegie Mellon University在 cs.cmu.edu 的电子邮件经过验证
Xiang LiCarnegie Mellon University在 andrew.cmu.edu 的电子邮件经过验证
Jingfeng WuUniversity of California, Berkeley在 berkeley.edu 的电子邮件经过验证
Yuexiang ZhaiUC Berkeley在 berkeley.edu 的电子邮件经过验证

关注

Ruiqi Zhang

Ph.D. Student, Statistics Department at University of California, Berkeley

在 berkeley.edu 的电子邮件经过验证 - 首页

Statistical Machine Learning Deep Learning Theory LLM Alignment Sequential Decision Making


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Trained transformers learn linear models in-context R Zhang, S Frei, PL Bartlett Journal of Machine Learning Research 25 (49), 1-55, 2024	97	2024
Off-policy fitted q-evaluation with differentiable function approximators: Z-estimation and inference theory R Zhang, X Zhang, C Ni, M Wang International Conference on Machine Learning, 26713-26749, 2022	18	2022
Negative preference optimization: From catastrophic collapse to effective unlearning R Zhang, L Lin, Y Bai, S Mei arXiv preprint arXiv:2404.05868, 2024	14	2024
AutoPRM: Automating Procedural Supervision for Multi-Step Reasoning via Controllable Question Decomposition Z Chen, Z Zhao, Z Zhu, R Zhang, X Li, B Raj, H Yao NAACL 2024, 2024	5	2024
Optimal estimation of policy gradient via double fitted iteration C Ni, R Zhang, X Ji, X Zhang, M Wang International Conference on Machine Learning, 16724-16783, 2022	5*	2022
Policy Finetuning in Reinforcement Learning via Design of Experiments using Offline Data R Zhang, A Zanette Advances in Neural Information Processing Systems, 2024, 2023	4	2023
In-context learning of a linear Transformer block: benefits of the MLP component and one-step GD initialization R Zhang, J Wu, PL Bartlett arXiv preprint arXiv:2402.14951, 2024	3	2024
Is Offline Decision Making Possible with Only Few Samples? Reliable Decisions in Data-Starved Bandits via Trust Region Enhancement R Zhang, Y Zhai, A Zanette arXiv preprint arXiv:2402.15703, 2024		2024
Accelerating Best-of-N via Speculative Rejection R Zhang, M Haider, M Yin, J Qiu, M Wang, P Bartlett, A Zanette 2nd Workshop on Advancing Neural Network Training: Computational Efficiency …, 0

系统目前无法执行此操作，请稍后再试。

文章 1–9

每年引用数

重复的引用

合并的引用

添加合著者合著作者

上传 PDF

关注此作者

引用次数

合著作者

引用