跳转至

大语言模型

概要

这一部分记录 Transformer 之后的大语言模型体系,包括 Decoder-only LLM 架构、预训练任务和数据处理等.