Danny Halawi 个人学术档案 - 学术资源搜索

引用次数

	总计	2019 年至今
引用	127	127
h 指数	4	4
i10 指数	2	2

0

80

40

20212022202320242 1 47 77

开放获取的出版物数量

1 篇文章

0 篇文章

可查看的文章

无法查看的文章

根据资助方的强制性开放获取政策

合著作者

Jacob SteinhardtStanford University在 cs.stanford.edu 的电子邮件经过验证
Nora BelroseResearch Lead, EleutherAI在 eleuther.ai 的电子邮件经过验证
Jean-Stanislas DenainUC Berkeley在 berkeley.edu 的电子邮件经过验证
Fred ZhangPhD Candidate, UC Berkeley在 berkeley.edu 的电子邮件经过验证
Yueh-Han ChenUC Berkeley在 berkeley.edu 的电子邮件经过验证
Choudhry ShuaibIAS Fellow, University of Warwick在 warwick.ac.uk 的电子邮件经过验证

Danny Halawi

Danny Halawi

在 berkeley.edu 的电子邮件经过验证

Machine Learning AI Safety


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Eliciting latent predictions from transformers with the tuned lens N Belrose, Z Furman, L Smith, D Halawi, I Ostrovsky, L McKinney, ... arXiv preprint arXiv:2303.08112, 2023	89	2023
Overthinking the truth: Understanding how language models process false demonstrations D Halawi, JS Denain, J Steinhardt ICLR 2024, 2023	23	2023
Approaching Human-Level Forecasting with Language Models D Halawi, F Zhang, C Yueh-Han, J Steinhardt arXiv preprint arXiv:2402.18563, 2024	8	2024
Verifying source citations in the hadith literature M Syed, D Halawi, B Sadeghi, N Saquib Journal of Medieval Worlds 1 (3), 5-20, 2019	4	2019
Trophic analysis of a historical network reveals temporal information C Shuaib, M Syed, D Halawi, N Saquib Applied Network Science 7 (1), 31, 2022	3	2022
Covert Malicious Finetuning: Challenges in Safeguarding LLM Adaptation D Halawi, A Wei, E Wallace, TT Wang, N Haghtalab, J Steinhardt ICML 2024, 2024		2024
Dominion: A New Frontier for AI Research D Halawi, A Sarmasi, S Saltzen, J McCoy CoRL 2022: Workshop on Strategic Multi-Agent Interactions, 2022		2022

系统目前无法执行此操作，请稍后再试。

文章 1–7

共建清朗的网络空间,如遇有害信息,请举报。
本站数据皆整合自互联网公开资源索引,方便科研学术方面查询,并不存储相关数据资源;如对此有异议,请联系我们解决.
© 2023 学术资源搜索 @联系我们 | 申请短期会员 | 数据源提交