ONNX 模型库
返回模型

说明文档

该模型在 commabody 数据集的更大版本(总计 194 分钟)上进行了训练。 它包含一个在 ImageNet 上微调的 vqgan 编码器/解码器。它将 160x256 大小的图像压缩为 10x16 个 token。

它还包含一个经过训练的 GPT2 模型,用于预测下一帧、轮速和动作。它可以用作模拟器或策略。更多详情请参阅我们的博客文章

<video title="基于 3 秒上下文的想象推演" controls> <source src="https://blog.comma.ai/img/body_patrol/rollouts.webm" type="video/webm"> </video>

你可以使用 body-jim 中的示例脚本在 comma body 上运行它。

commaai/commabody-gpt2

作者 commaai

robotics
↓ 0 ♥ 2

创建时间: 2024-05-31 01:55:28+00:00

更新时间: 2024-06-03 19:02:57+00:00

在 Hugging Face 上查看

文件 (5)

.gitattributes
README.md
decoder.onnx ONNX
encoder.onnx ONNX
gpt2.onnx ONNX