yaswanth chittepu 个人学术档案

yaswanth chittepu

在 umass.edu 的电子邮件经过验证


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Scaling laws for reward model overoptimization in direct alignment algorithms R Rafailov, Y Chittepu, R Park, H Sikchi, J Hejna, B Knox, C Finn, ... arXiv preprint arXiv:2406.02900, 2024	23	2024

系统目前无法执行此操作，请稍后再试。

每年引用数