Edward Beeching 个人学术档案 - 学术资源搜索

引用次数

	总计	2019 年至今
引用	701	700
h 指数	10	10
i10 指数	10	10

0

500

250

125

375

202020212022202320247 19 34 144 490

开放获取的出版物数量

3 篇文章

0 篇文章

可查看的文章

无法查看的文章

根据资助方的强制性开放获取政策

Edward Beeching

Edward Beeching

Research Scientist, Hugging Face

在 insa-lyon.fr 的电子邮件经过验证 - 首页

Machine Learning


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Zephyr: Direct distillation of lm alignment L Tunstall, E Beeching, N Lambert, N Rajani, K Rasul, Y Belkada, ... arXiv preprint arXiv:2310.16944, 2023	226	2023
Open llm leaderboard E Beeching, C Fourrier, N Habib, S Han, N Lambert, N Rajani, ... Hugging Face, 2023	174	2023
Trl: Transformer reinforcement learning L von Werra, Y Belkada, L Tunstall, E Beeching, T Thrush, N Lambert, ... GitHub. Available online at: https://github. com/lvwerra/trl, 2020	101	2020
Learning to plan with uncertain topological maps E Beeching, J Dibangoye, O Simonin, C Wolf European Conference on Computer Vision, 473-490, 2020	42	2020
Deep reinforcement learning on a budget: 3d control and reasoning without a supercomputer E Beeching, J Debangoye, O Simonin, C Wolf 2020 25th International Conference on Pattern Recognition (ICPR), 158-165, 2021	29	2021
The alignment handbook L Tunstall, E Beeching, N Lambert, N Rajani, S Huang, K Rasul, AM Rush, ...	25	2023
Egomap: Projective mapping and structured egocentric memory for deep RL E Beeching, J Dibangoye, O Simonin, C Wolf Joint European conference on machine learning and knowledge discovery in …, 2020	23	2020
Stackllama: An rl fine-tuned llama model for stack exchange question and answering, 2023 E Beeching, Y Belkada, K Rasul, L Tunstall, L von Werra, N Rajani, ... URL https://huggingface. co/blog/stackllama 1 (4.1), 4.1, 2023	18	2023
Godot reinforcement learning agents E Beeching, J Debangoye, O Simonin, C Wolf arXiv preprint arXiv:2112.03636, 2021	13	2021
Creating a Coding Assistant with StarCoder. Hugging Face Blog (2023) L Tunstall, N Lambert, N Rajani, E Beeching, T Le Scao, L von Werra, ...	12	2023
Graph augmented deep reinforcement learning in the gamerland3d environment E Beeching, M Peter, P Marcotte, J Debangoye, O Simonin, J Romoff, ... arXiv preprint arXiv:2112.11731, 2021	9	2021
No robots N Rajani, L Tunstall, E Beeching, N Lambert, AM Rush, T Wolf	7	2023
Creating a coding assistant with starcoder L Tunstall, N Lambert, N Rajani, E Beeching, T Le Scao, L von Werra, ... Hugging Face Blog, 2023	7	2023
Open LLM Leaderboard. 2023 E Beeching, C Fourrier, N Habib, S Han, N Lambert, N Rajani, ... URL https://huggingface. co/spaces/HuggingFaceH4/open_llm_leaderboard, 0	6
Trl: Transformer reinforcement learning (2020) L von Werra, Y Belkada, L Tunstall, E Beeching, T Thrush, N Lambert, ... URL https://github. com/huggingface/trl, 0	5
Can foundation models label data like humans? N Rajani, N Lambert, S Han, J Wang, O Nitski, E Beeching, L Tunstall Hugging Face Blog, 2023	4	2023
Jack of All Trades, Master of Some, a Multi-Purpose Transformer Agent Q Gallouédec, E Beeching, C Romac, E Dellandréa arXiv preprint arXiv:2402.09844, 2024		2024
Large-scale automatic learning of autonomous agent behavior with structured deep reinforcement learning E Beeching Université de Lyon, 2022		2022

系统目前无法执行此操作，请稍后再试。

文章 1–18

共建清朗的网络空间,如遇有害信息,请举报。
本站数据皆整合自互联网公开资源索引,方便科研学术方面查询,并不存储相关数据资源;如对此有异议,请联系我们解决.
© 2023 学术资源搜索 @联系我们 | 申请短期会员 | 数据源提交