基础理论¶
稳定的核心知识,低频更新。涵盖深度学习架构原理与大模型的基石技术。
-
自注意力、MoE
-
KV Cache 存储特征、GQA、Prefill/Decode、压缩权衡
-
状态空间模型、选择性扫描、线性复杂度替代架构
-
文本/图像/音频/视频的数据特征差异与技术路线对比
-
DDPM、Latent Diffusion、DiT 与 Flow Matching
-
规则系统 → 特征工程 → 表示学习:三次范式转换的技术瓶颈与突破点
-
BM25、向量检索、混合检索与 RRF 融合算法