大语言模型 概要 这一部分记录 Transformer 之后的大语言模型体系,包括 Decoder-only LLM 架构、预训练任务和数据处理等. 目录 LLM Architecture Pretraining and Data Llama2