AI文摘

blog-thum
5图解Bert

Bert是一种TransformerEncoder架构,Encoder架构能够充分利用上下文信息,擅长文本理解任务。   本文将图解Bert,本系列还有图解Tokenization,Word2Ve

read more
blog-thum
一览大模型长文本能力

【点击】加入大模型技术交流群前言如今的大模型被应用在各个场景,有些场景则需要模型能够支持处理较长文本的能力(比如8k甚至更长),其中已经有很多开源或者闭源模型具备该能力比如GPT4、Baichuan2

read more