©作者 郑奘巍单位 新加坡国立大学研究方向 高效机器学习与神经网络优化从理论分析入手把握大规模神经网络优化的规律,可以指导实践中的超参数选择。反过来,实践中的超参数选择也可以指导理论分析。
read more鱼羊萧箫发自凹非寺量子位公众号QbitAI谁能想到,大模型风暴袭来,钢铁侠里的贾维斯俨然成了最忙碌的“漫威英雄”(手动狗头)。原因无他,实在是超级助手这个概念太火爆,从手机到PC再到智能
read more今天是2023年12月11日,星期一,北京,初雪。我们在之前的文章中有介绍过longbench评测,其中有多文档QA这一任务。最近看到的一个工作,《KnowledgeGraphPrompting
read more几番“交手”,全球大模型玩家迎来了令人兴奋的“实力值”排行榜更新。继11月初零一万物发布性能优异的Yi-34B基座模型后,Yi-34B-Chat微调模型在11月24日开源上线,再度获得全球开发
read more今天是2023年12月10日,周日,北京,天气阴,很冷。本文主要讲三件事。一个是关于RAG中的上下文构造问题。《CompressingContexttoEnhanceInferenceEff
read more大模型场景微调里面,最关键地的一个是问题是:选择什么样的数据微调?大的方向上大家都能把握,大概无非是要注意数据的多样性,要注意数据的质量,那在实践中有哪些技巧呢?比如我们会经常遇到下面几种情况:1数
read more