AI文摘

blog-thum
大语言模型知识蒸馏最新综述!!

本文转自专知本综述深入探讨了大型语言模型(LLMs)领域内的知识蒸馏(KD)技术,突出了KD在将GPT-4等专有巨头的复杂能力转移至LLaMA和Mistral等可访问的开源模型中的关键作用。在不断演变

read more
blog-thum
商汤用AI复活了汤老师

作者:白交西风转自:量子位公众号QbitAI大家好,我们又见面了。在商汤2024年年会上,汤晓鸥数字人现身,来了一场跨越时空的重逢。按照以往习惯,每年汤老师都会说上一段脱口秀,已经成为商汤年

read more