跳转至

模型档案

对重要前沿模型的深度技术分析,聚焦能力评估、对齐研究和架构创新。

  • Claude Mythos Preview


    Anthropic 245 页 System Card 的结构化中文摘要——RSP 评估、网络安全能力、对齐评估、模型福利

  • DeepSeek-V4


    首个原生百万 token 上下文开源 MoE——混合压缩注意力将 1M 推理 FLOPs 降至 V3.2 的 27%,KV Cache 缩至 10%