Aidan Ewart 个人学术档案 - 学术资源搜索

引用次数

	总计	2019 年至今
引用	64	64
h 指数	2	2
i10 指数	2	2

0

60

30

2023202410 54

合著作者

Lee D SharkeyApollo Research在 apolloresearch.ai 的电子邮件经过验证
Dylan Hadfield-MenellMassachusetts Institute of Technology在 csail.mit.edu 的电子邮件经过验证
Aengus LynchPhD Student, University College London在 ucl.ac.uk 的电子邮件经过验证
Phillip GuoUniversity of Maryland在 umd.edu 的电子邮件经过验证
Stephen CasperPhD student, MIT在 mit.edu 的电子邮件经过验证

Aidan Ewart

Aidan Ewart

Maths Undergrad @ University of Bristol

在 bristol.ac.uk 的电子邮件经过验证 - 首页

ML Safety AI Safety AI Alignment


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Sparse Autoencoders Find Highly Interpretable Features in Language Models R Huben, H Cunningham, LR Smith, A Ewart, L Sharkey The Twelfth International Conference on Learning Representations, 2023	52*	2023
Eight methods to evaluate robust unlearning in llms A Lynch, P Guo, A Ewart, S Casper, D Hadfield-Menell arXiv preprint arXiv:2402.16835, 2024	12	2024
Robust Unlearning via Mechanistic Localizations PH Guo, A Syed, A Sheshadri, A Ewart, GK Dziugaite ICML 2024 Workshop on Mechanistic Interpretability, 0

系统目前无法执行此操作，请稍后再试。

文章 1–3

共建清朗的网络空间,如遇有害信息,请举报。
本站数据皆整合自互联网公开资源索引,方便科研学术方面查询,并不存储相关数据资源;如对此有异议,请联系我们解决.
© 2023 学术资源搜索 @联系我们 | 申请短期会员 | 数据源提交