关注
Jiaming Tang
Jiaming Tang
Ph.D. student, MIT
在 mit.edu 的电子邮件经过验证 - 首页
标题
引用次数
引用次数
年份
AWQ: Activation-aware Weight Quantization for LLM Compression and Acceleration
J Lin*, J Tang*, H Tang, S Yang, X Dang, S Han
MLSys 2024, 2023
315*2023
OliVe: Accelerating Large Language Models via Hardware-friendly Outlier-Victim Pair Quantization
C Guo*, J Tang*, W Hu, J Leng, C Zhang, F Yang, Y Liu, M Guo, Y Zhu
ISCA 2023, 2023
432023
Quest: Query-Aware Sparsity for Efficient Long-Context LLM Inference
J Tang*, Y Zhao*, K Zhu, G Xiao, B Kasikci, S Han
ICML 2024, 2024
42024
系统目前无法执行此操作,请稍后再试。
文章 1–3