具身算法¶

机器人基础模型与学习算法，涵盖 VLA 微调框架和世界模型。

OpenVLA-OFT

VLA 优化微调方法论——并行解码替代自回归、MLP action head 直接回归连续动作、L1 loss 简胜 diffusion，微调策略比预训练数据覆盖更重要
OpenPI 微调框架

Physical Intelligence 开源 VLA 模型框架——双专家架构、三层 Transform 数据管线、位置语义化的固定观测结构
τ₀-World Model

5B 视频-动作统一世界模型——视频扩散骨干联合生成未来帧与动作序列，异构数据模态级监督掩码，推理时 Propose-Evaluate-Revise
StarVLA

模块化 VLA 统一实验平台——Backbone–Action Head 解耦统一四种动作解码范式，StarVLA-α 极简基线证明强 VLM 下复杂设计收益有限