AI文摘

blog-thum
LLM百倍推理加速之量化篇

【点击】加入大模型技术交流群原文:https:zhuanlanzhihucomp680341931本文主要基于当前主流GPU硬件、量化算法最新论文,参考量化开源项目,探讨一下量化推理加速的

read more