AI文摘

blog-thum
LLMMamba:LLM新架构的浅探

目前大型语言模型(LLM)领域发展如火如荼,本文将重点探索在单个消费级GPU上可以有效运行的小型模型(≤7B个参数)。    我们将从以下几个方面重点介绍基于新架构的语言模型:🐍Mamba模型

read more
blog-thum
微博的AI评论机器人,实在是太抽象了

昨天朋友给我发了一张图。我CPU差点干烧了。实在是太抽象了。然后我抽空搜了搜,发现微博为了活跃自己家社区,搞了个AI评论机器人。去年9月份的时候我记得我刷微博的时候我还见过这玩意,那时候它名字叫“评论

read more