返回模型
说明文档
该模型在 commabody 数据集的更大版本(总计 194 分钟)上进行了训练。 它包含一个在 ImageNet 上微调的 vqgan 编码器/解码器。它将 160x256 大小的图像压缩为 10x16 个 token。
它还包含一个经过训练的 GPT2 模型,用于预测下一帧、轮速和动作。它可以用作模拟器或策略。更多详情请参阅我们的博客文章。
<video title="基于 3 秒上下文的想象推演" controls> <source src="https://blog.comma.ai/img/body_patrol/rollouts.webm" type="video/webm"> </video>
你可以使用 body-jim 中的示例脚本在 comma body 上运行它。
commaai/commabody-gpt2
作者 commaai
robotics
↓ 0
♥ 2
创建时间: 2024-05-31 01:55:28+00:00
更新时间: 2024-06-03 19:02:57+00:00
在 Hugging Face 上查看文件 (5)
.gitattributes
README.md
decoder.onnx
ONNX
encoder.onnx
ONNX
gpt2.onnx
ONNX