Ryan S Park 个人学术档案 - 学术资源搜索

Ryan S Park

Ryan S Park

Stanford Student

在 stanford.edu 的电子邮件经过验证


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
From to : Your Language Model is Secretly a Q-Function R Rafailov, J Hejna, R Park, C Finn arXiv preprint arXiv:2404.12358, 2024	21	2024
Disentangling length from quality in direct preference optimization R Park, R Rafailov, S Ermon, C Finn arXiv preprint arXiv:2403.19159, 2024	17	2024
Scaling Laws for Reward Model Overoptimization in Direct Alignment Algorithms R Rafailov, Y Chittepu, R Park, H Sikchi, J Hejna, B Knox, C Finn, ... arXiv preprint arXiv:2406.02900, 2024	3	2024
Preference Optimization for Molecular Language Models R Park, R Theisen, N Sahni, M Patek, A Cichońska, R Rahman arXiv preprint arXiv:2310.12304, 2023	2	2023

系统目前无法执行此操作，请稍后再试。

文章 1–4

共建清朗的网络空间,如遇有害信息,请举报。
本站数据皆整合自互联网公开资源索引,方便科研学术方面查询,并不存储相关数据资源;如对此有异议,请联系我们解决.
© 2023 学术资源搜索 @联系我们 | 申请短期会员 | 数据源提交