Zhihang Yuan 个人学术档案 - 学术资源搜索

引用次数

	总计	2019 年至今
引用	695	652
h 指数	11	11
i10 指数	12	12

240

120

180

201720182019202020212022202320247 34 53 47 68 74 170 240

开放获取的出版物数量

查看全部

7 篇文章

3 篇文章

可查看的文章

无法查看的文章

根据资助方的强制性开放获取政策

合著作者

Guangyu SunSchool of Integrated Circuits, Peking University在 pku.edu.cn 的电子邮件经过验证
Bingzhe WuTencent AI Lab在 pku.edu.cn 的电子邮件经过验证
Yuzhang ShangIllinois Institute of Technology在 hawk.iit.edu 的电子邮件经过验证
Yijin GuanComputing Technology Lab, Alibaba DAMO Academy在 alibaba-inc.com 的电子邮件经过验证
Chenhao XueSchool of Integrated Circuits, Peking University在 pku.edu.cn 的电子邮件经过验证
Jingsheng Jason CongVolgenau Chair for Engineering Excellence, Computer Science and Electrical Engineering, University在 cs.ucla.edu 的电子邮件经过验证
Xinggang WangProfessor, Huazhong University of Science and Technology在 hust.edu.cn 的电子邮件经过验证
Wenyu LiuThe University of Sydney在 sydney.edu.au 的电子邮件经过验证
Yan YanIllinois Institute of Technology在 iit.edu 的电子邮件经过验证
Yiqi ChenPeking University在 pku.edu.cn 的电子邮件经过验证
Dawei YangFudan University在 fudan.edu.cn 的电子邮件经过验证
Yizeng Han (韩益增)Department of Automation, Tsinghua University在 mails.tsinghua.edu.cn 的电子邮件经过验证
Yifan Pu (浦一凡)Department of Automation, Tsinghua University在 mails.tsinghua.edu.cn 的电子邮件经过验证
Gao Huang （黄高）Associate Professor, Tsinghua University在 tsinghua.edu.cn 的电子邮件经过验证
Zhen DongPhD & Postdoc at Berkeley AI Research在 berkeley.edu 的电子邮件经过验证
Shiwan ZhaoIndependent Researcher, Research Scientist of IBM Research - China (2000-2020)在 cn.ibm.com 的电子邮件经过验证
Yuchao YangPeking University在 pku.edu.cn 的电子邮件经过验证
Zhe ZhouPhD. Candidate of Computer Architecture, Peking University在 pku.edu.cn 的电子邮件经过验证

关注

Zhihang Yuan

Infini-AI

在 infini-ai.com 的电子邮件经过验证 - 首页

Efficient AI Deep Learning


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
FPGA-based accelerator for long short-term memory recurrent neural networks Y Guan, Z Yuan, G Sun, J Cong 2017 22nd Asia and South Pacific Design Automation Conference (ASP-DAC), 629-634, 2017	229	2017
Ptq4vit: Post-training quantization for vision transformers with twin uniform quantization Z Yuan, C Xue, Y Chen, Q Wu, G Sun European conference on computer vision, 191-207, 2022	106*	2022
Post-training quantization on diffusion models Y Shang, Z Yuan, B Xie, B Wu, Y Yan Proceedings of the IEEE/CVF conference on computer vision and pattern …, 2023	62	2023
Rptq: Reorder-based post-training quantization for large language models Z Yuan, L Niu, J Liu, W Liu, X Wang, Y Shang, G Sun, Q Wu, J Wu, B Wu arXiv preprint arXiv:2304.01089, 2023	41	2023
Pd-quant: Post-training quantization based on prediction difference metric J Liu, L Niu, Z Yuan, D Yang, X Wang, W Liu Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern …, 2023	37	2023
Reducing overfitting in deep convolutional neural networks using redundancy regularizer B Wu, Z Liu, Z Yuan, G Sun, C Wu Artificial Neural Networks and Machine Learning–ICANN 2017: 26th …, 2017	32	2017
S2DNAS: Transforming static CNN model for dynamic inference via neural architecture search Z Yuan, B Wu, G Sun, Z Liang, S Zhao, W Bi Computer Vision–ECCV 2020: 16th European Conference, Glasgow, UK, August 23 …, 2020	31	2020
NAS4RRAM: neural network architecture search for inference on RRAM-based accelerators Z Yuan, J Liu, X Li, L Yan, H Chen, B Wu, Y Yang, G Sun Science China Information Sciences 64 (6), 160407, 2021	21	2021
Latency-aware spatial-wise dynamic networks Y Han, Z Yuan, Y Pu, C Xue, S Song, G Sun, G Huang Advances in Neural Information Processing Systems 35, 36845-36857, 2022	19	2022
Pb-llm: Partially binarized large language models Y Shang, Z Yuan, Q Wu, Z Dong arXiv preprint arXiv:2310.00034, 2023	14	2023
A survey on efficient inference for large language models Z Zhou, X Ning, K Hong, T Fu, J Xu, S Li, Y Lou, L Wang, Z Yuan, X Li, ... arXiv preprint arXiv:2404.14294, 2024	11	2024
Using data compression for optimizing FPGA-based convolutional neural network accelerators Y Guan, N Xu, C Zhang, Z Yuan, J Cong International workshop on advanced parallel processing technologies, 14-26, 2017	11	2017
Llm inference unveiled: Survey and roofline model insights Z Yuan, Y Shang, Y Zhou, Z Dong, C Xue, B Wu, Z Li, Q Gu, YJ Lee, ... arXiv preprint arXiv:2402.16363, 2024	9	2024
Asvd: Activation-aware singular value decomposition for compressing large language models Z Yuan, Y Shang, Y Song, Q Wu, Y Yan, G Sun arXiv preprint arXiv:2312.05821, 2023	9	2023
Latency-aware unified dynamic networks for efficient image recognition Y Han, Z Liu, Z Yuan, Y Pu, C Wang, S Song, G Huang arXiv preprint arXiv:2308.15949, 2023	9	2023
Enas4d: Efficient multi-stage cnn architecture search for dynamic inference Z Yuan, X Liu, B Wu, G Sun arXiv preprint arXiv:2009.09182, 2020	7	2020
Crane: mitigating accelerator under-utilization caused by sparsity irregularities in cnns Y Guan, G Sun, Z Yuan, X Li, N Xu, S Chen, J Cong, Y Xie IEEE Transactions on Computers 69 (7), 931-943, 2020	7	2020
Wkvquant: Quantizing weight and key/value cache for large language models gains more Y Yue, Z Yuan, H Duanmu, S Zhou, J Wu, L Nie arXiv preprint arXiv:2402.12065, 2024	6	2024
Reconfigurable ASIC implementation of asynchronous recurrent neural networks S Nelson, SY Kim, J Di, Z Zhou, Z Yuan, G Sun 2021 27th IEEE International Symposium on Asynchronous Circuits and Systems …, 2021	5	2021
Quest: Low-bit diffusion model quantization via efficient selective finetuning H Wang, Y Shang, Z Yuan, J Wu, Y Yan arXiv preprint arXiv:2402.03666, 2024	3	2024

系统目前无法执行此操作，请稍后再试。

文章 1–20

每年引用数

重复的引用

合并的引用

添加合著者合著作者

上传 PDF

关注此作者

引用次数

合著作者

引用