AI文摘

blog-thum
大模型量化技术原理-LLMint8()、GPTQ

【点击】加入大模型技术交流群近年来,随着Transformer、MOE架构的提出,使得深度学习模型轻松突破上万亿规模参数,从而导致模型变得越来越大,因此,我们需要一些大模型压缩技术来降低模型部署的成本

read more
blog-thum
面向大模型的检索增强生成(RAG)综述

【点击】加入大模型技术交流群RAG最近有一篇广受关注的综述,最近是花了不少时间给啃了个大概,里面提及的挺多文章其实都挺精彩的,甚至是让人兴奋的。我先把链接放上。论文:Retrieval-Augment

read more