Sobhan Miryoosefi 个人学术档案

引用次数

	总计	2019 年至今
引用	461	461
h 指数	6	6
i10 指数	6	6

160

120

2020202120222023202413 57 143 135 111

开放获取的出版物数量

查看全部

1 篇文章

0 篇文章

可查看的文章

无法查看的文章

根据资助方的强制性开放获取政策

合著作者

Chi JinAssistant Professor, Princeton University在 princeton.edu 的电子邮件经过验证
Miroslav DudikMicrosoft Research在 microsoft.com 的电子邮件经过验证
Kianté BrantleyCornell University在 cornell.edu 的电子邮件经过验证
Qinghua LiuPrinceton University在 princeton.edu 的电子邮件经过验证
Sanjiv KumarGoogle Fellow, VP, Google Research在 google.com 的电子邮件经过验证
Hal Daumé IIIAssociate Professor of Computer Science, University of Maryland在 umiacs.umd.edu 的电子邮件经过验证
Robert SchapireMicrosoft Research在 microsoft.com 的电子邮件经过验证
Wen SunAssistant Professor, Cornell University在 cornell.edu 的电子邮件经过验证
Thodoris LykourisMIT在 mit.edu 的电子邮件经过验证
MAX SIMCHOWITZMIT在 mit.edu 的电子邮件经过验证
Aleksandrs SlivkinsSenior Principal Researcher, Microsoft Research NYC在 microsoft.com 的电子邮件经过验证
Yonathan EfroniMeta, New York在 fb.com 的电子邮件经过验证
Akshay KrishnamurthyUniversity of Massachusetts Amherst在 cs.umass.edu 的电子邮件经过验证
Sashank J. ReddiResearch Scientist, Google Research在 cs.cmu.edu 的电子邮件经过验证
Daliang LiAnthropic在 anthropic.com 的电子邮件经过验证
Manzil ZaheerGoogle Research在 cmu.edu 的电子邮件经过验证
Zonglin LiGoogle Research在 google.com 的电子邮件经过验证
Satyen KaleResearch Scientist, Google Research在 google.com 的电子邮件经过验证

关注

Sobhan Miryoosefi

Google Research

在 google.com 的电子邮件经过验证 - 首页

Machine Learning Theoretical Machine Learning Reinforcement Learning Natural Language Processing


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Bellman Eluder dimension: New rich classes of RL problems, and sample-efficient algorithms C Jin, Q Liu, S Miryoosefi Advances in Neural Information Processing Systems 34, 13406-13418, 2021	231	2021
Reinforcement learning with convex constraints S Miryoosefi, K Brantley, H Daumé III, M Dudík, R Schapire Advances in Neural Information Processing Systems 32, 14093-14102, 2019	97	2019
Constrained episodic reinforcement learning in concave-convex and knapsack settings K Brantley, M Dudik, T Lykouris, S Miryoosefi, M Simchowitz, A Slivkins, ... Advances in Neural Information Processing Systems 33, 16315-16326, 2020	53	2020
Provable reinforcement learning with a short-term memory Y Efroni, C Jin, A Krishnamurthy, S Miryoosefi International Conference on Machine Learning, 5832-5850, 2022	32	2022
A simple reward-free approach to constrained reinforcement learning S Miryoosefi, C Jin International Conference on Machine Learning, 15666-15698, 2022	32	2022
Rest meets react: Self-improvement for multi-step reasoning llm agent R Aksitov, S Miryoosefi, Z Li, D Li, S Babayan, K Kopparapu, Z Fisher, ... arXiv preprint arXiv:2312.10003, 2023	12	2023
Efficient training of language models using few-shot learning SJ Reddi, S Miryoosefi, S Karp, S Krishnan, S Kale, S Kim, S Kumar International Conference on Machine Learning, 14553-14568, 2023	4	2023
Landscape-Aware Growing: The Power of a Little LAG S Karp, N Saunshi, S Miryoosefi, SJ Reddi, S Kumar arXiv preprint arXiv:2406.02469, 2024		2024
Efficient Stagewise Pretraining via Progressive Subnetworks A Panigrahi, N Saunshi, K Lyu, S Miryoosefi, S Reddi, S Kale, S Kumar arXiv preprint arXiv:2402.05913, 2024		2024
Provable Reinforcement Learning with Constraints and Function Approximation SSM Yoosefi Princeton University, 2022		2022

系统目前无法执行此操作，请稍后再试。

文章 1–10

每年引用数

重复的引用

合并的引用

添加合著者合著作者

上传 PDF

关注此作者

引用次数

合著作者

引用