今天是2023年11月19日,星期日,北京,天气晴。最近在做长文本相关工作,我们来看看长文本评估。大语言模型(LLM)尽管在各种语言任务中表现抢眼,但通常仅限于处理上下文窗口大小范围内的文本。有越来越
read moreLoRA模型是一种微调模型,它不能独立生成图片,常常用作大模型的补充,用来生成某种特定主体或者风格的图片。下载模型在模型下载网站,如果模型是LoRA模型,网站会特别标识出来。以liblibai为
read more今天是2023年11月18日,星期六,北京,天气晴。在昨天的文章中,我们谈了谈《IN-CONTEXTLEARNINGWITHITERATIVEDEMON-STRATIONSELECTION
read more来自巴斯大学计算机科学教授SimonJDPrince撰写的《理解深度学习》新书,共有19章,从机器学习基础概念到深度学习各种模型,包括最新的Transformer和图神经网络,比较系统全面,值
read more什么是提示词你可能没写过提示词,但是一定听说过“提示词”这几个字,也大概能知道它的重要性。没听说过也没关系,下面我就带你认识认识。提示词就是我们给AI模型下发的指令。提示词写对了,AI才能输出相应的结
read more西风发自凹非寺量子位公众号QbitAI大模型“幻觉”,终于有系统综述了!一口气49页,详细阐述了幻觉定义、分类、导致幻觉的原因,还有检测幻觉、减轻幻觉的方法。这篇最新综述来自哈工大和华为,
read more