Andrea Michi 个人学术档案 - 学术资源搜索

引用次数

	总计	2019 年至今
引用	1090	1090
h 指数	7	7
i10 指数	6	6

0

880

440

220

660

2020202120222023202411 37 52 112 870

开放获取的出版物数量

2 篇文章

0 篇文章

可查看的文章

无法查看的文章

根据资助方的强制性开放获取政策

合著作者

Cosmin PaduraruDeepMind在 google.com 的电子邮件经过验证
Daniel J. MankowitzGoogle Deepmind在 google.com 的电子邮件经过验证

Andrea Michi

Andrea Michi

Google DeepMind

在 google.com 的电子邮件经过验证


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context G Team, P Georgiev, VI Lei, R Burnell, L Bai, A Gulati, G Tanzer, ... arXiv preprint arXiv:2403.05530, 2024	633	2024
Hyperparameter selection for offline reinforcement learning TL Paine, C Paduraru, A Michi, C Gulcehre, K Zolna, A Novikov, Z Wang, ... arXiv preprint arXiv:2007.09055, 2020	167	2020
Faster sorting algorithms discovered using deep reinforcement learning DJ Mankowitz, A Michi, A Zhernov, M Gelmi, M Selvi, C Paduraru, ... Nature 618 (7964), 257-263, 2023	164	2023
Nash learning from human feedback R Munos, M Valko, D Calandriello, MG Azar, M Rowland, ZD Guo, Y Tang, ... arXiv preprint arXiv:2312.00886, 2023	78	2023
A generic human–machine annotation framework based on dynamic cooperative learning Y Zhang, A Michi, J Wagner, E André, B Schuller, F Weninger IEEE transactions on cybernetics 50 (3), 1230-1239, 2019	19	2019
Bond: Aligning llms with best-of-n distillation PG Sessa, R Dadashi, L Hussenot, J Ferret, N Vieillard, A Ramé, ... arXiv preprint arXiv:2407.14622, 2024	13	2024
Conditional Language Policy: A General Framework for Steerable Multi-Objective Finetuning K Wang, R Kidambi, R Sullivan, A Agarwal, C Dann, A Michi, M Gelmi, ... arXiv preprint arXiv:2407.15762, 2024	7	2024
Towards practical reinforcement learning for tokamak magnetic control BD Tracey, A Michi, Y Chervonyi, I Davies, C Paduraru, N Lazic, F Felici, ... Fusion Engineering and Design 200, 114161, 2024	5	2024
Towards practical reinforcement learning for tokamak magnetic control BD Tracey, A Michi, Y Chervonyi, I Davies, C Paduraru, N Lazic, F Felici, ... arXiv preprint arXiv:2307.11546, 2023	4	2023
OFFLINE HYPERPARAMETER SELECTION FOR OFFLINE REINFORCEMENT LEARNING T Le Paine, C Paduraru, A Michi, C Gulcehre, K Zołna, A Novikov, ...

系统目前无法执行此操作，请稍后再试。

文章 1–10

共建清朗的网络空间,如遇有害信息,请举报。
本站数据皆整合自互联网公开资源索引,方便科研学术方面查询,并不存储相关数据资源;如对此有异议,请联系我们解决.
© 2023 学术资源搜索 @联系我们 | 申请短期会员 | 数据源提交