AI文摘

blog-thum
RAG如何消除大模型幻觉

什么是大模型幻觉假设我们有一个基于大型生成模型(如GPT-3)的问答系统,该系统用于回答药企内部知识库中的问题。我们向其提出一个问题:“阿司匹林的主要药理作用是什么?”正确的答案应该是:“阿司匹林主要

read more
blog-thum
图解Transformer多头注意力机制

这是关于Transformer的系列文章第三篇,在本系列中,我们由浅入深地介绍了Transformer的功能。在前面的文章里,我们已经了解了Transformer是什么,它的架构以及其工作

read more
blog-thum
图解大模型推理优化之KVCache

此前,我们更多专注于大模型训练方面的技术分享和介绍,然而在完成模型训练之后,上线推理也是一项非常重要的工作。后续,我们将陆续撰写更多关于大模型推理优化的技术文章,包括但不限于KVCache、Page

read more