ONNX 模型库
返回模型

说明文档

<div> <p style="margin-top: 0;margin-bottom: 0;"> <em><a href="https://docs.unsloth.ai/basics/unsloth-dynamic-v2.0-gguf">Unsloth Dynamic 2.0</a> 实现了卓越的准确率,并超越了其他领先的量化方案。</em> </p> <div style="display: flex; gap: 5px; align-items: center; "> <a href="https://github.com/unslothai/unsloth/"> <img src="https://github.com/unslothai/unsloth/raw/main/images/unsloth%20new%20logo.png" width="133"> </a> <a href="https://discord.gg/unsloth"> <img src="https://github.com/unslothai/unsloth/raw/main/images/Discord%20button.png" width="173"> </a> <a href="https://docs.unsloth.ai/basics/qwen3-how-to-run-and-fine-tune"> <img src="https://raw.githubusercontent.com/unslothai/unsloth/refs/heads/main/images/documentation%20green%20button.png" width="143"> </a> </div> </div>

Seed-Coder-8B-Instruct

<div align="left" style="line-height: 1;"> <a href="https://bytedance-seed-coder.github.io/" target="_blank" style="margin: 2px;"> <img alt="Homepage" src="https://img.shields.io/badge/Seed--Coder-Homepage-a468fe?color=a468fe&logoColor=white" style="display: inline-block; vertical-align: middle;"/> </a>

<a href="https://github.com/ByteDance-Seed/Seed-Coder/blob/master/Seed-Coder.pdf" target="_blank" style="margin: 2px;"> <img alt="Technical Report" src="https://img.shields.io/badge/(upcoming)-Technical%20Report-brightgreen?logo=arxiv&logoColor=white" style="display: inline-block; vertical-align: middle;"/> </a>

<a href="https://huggingface.co/ByteDance-Seed" target="_blank" style="margin: 2px;"> <img alt="Hugging Face" src="https://img.shields.io/badge/%F0%9F%A4%97%20Hugging%20Face-ByteDance%20Seed-536af5?color=536af5&logoColor=white" style="display: inline-block; vertical-align: middle;"/> </a>

<a href="https://github.com/ByteDance-Seed/Seed-Coder/blob/master/LICENSE" style="margin: 2px;"> <img alt="License" src="https://img.shields.io/badge/License-MIT-f5de53?color=f5de53&logoColor=white" style="display: inline-block; vertical-align: middle;"/> </a> </div>

简介

我们很高兴地介绍 Seed-Coder,这是一个强大、透明且参数高效的 8B 规模开源代码模型家族,包含基础版、指令版和推理版三个变体。Seed-Coder 通过以下亮点推动开源代码模型的演进。

  • 以模型为中心: Seed-Coder 主要利用 LLM 而非手工规则进行代码数据过滤,最大限度地减少了预训练数据构建中的人工投入。
  • 透明: 我们公开分享以模型为中心的数据管道的详细见解,包括策划 GitHub 数据、commits 数据和代码相关网络数据的方法。
  • 强大: Seed-Coder 在同类规模的开源模型中,在各种代码任务上实现了最先进的性能。

<p align="center"> <img width="100%" src="imgs/seed-coder_intro_performance.png"> </p>

本仓库包含 Seed-Coder-8B-Instruct 模型,其具有以下特性:

  • 类型:因果语言模型
  • 训练阶段:预训练 & 后训练
  • 数据来源:公开数据集、合成数据
  • 上下文长度:32,768

模型下载

模型名称 长度 下载 备注
Seed-Coder-8B-Base 32K 🤗 模型 在我们以模型为中心的代码数据上预训练。
👉 Seed-Coder-8B-Instruct 32K 🤗 模型 指令微调,用于与用户意图对齐。
Seed-Coder-8B-Reasoning 64K 🤗 模型 强化学习训练以提升推理能力。
Seed-Coder-8B-Reasoning-bf16 64K 🤗 模型 强化学习训练以提升推理能力。

环境要求

您需要安装最新版本的 transformersaccelerate

pip install -U transformers accelerate

快速开始

以下是一个简单示例,演示如何使用 Hugging Face pipeline API 加载模型并生成代码:

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

model_id = "ByteDance-Seed/Seed-Coder-8B-Instruct"

tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.bfloat16, device_map="auto", trust_remote_code=True)

messages = [
    {"role": "user", "content": "Write a quick sort algorithm."},
]

input_ids = tokenizer.apply_chat_template(
    messages,
    tokenize=True,
    return_tensors="pt",
    add_generation_prompt=True,  
).to(model.device)

outputs = model.generate(input_ids, max_new_tokens=512)
response = tokenizer.decode(outputs[0][input_ids.shape[-1]:], skip_special_tokens=True)
print(response)

评估

Seed-Coder-8B-Instruct 已在广泛的代码任务上进行了评估,包括代码生成、代码推理、代码编辑和软件工程,在 ~8B 开源模型中实现了最先进的性能。

模型 HumanEval MBPP MHPP BigCodeBench (Full) BigCodeBench (Hard) LiveCodeBench (2410 – 2502)
CodeLlama-7B-Instruct 40.9 54.0 6.7 25.7 4.1 3.6
DeepSeek-Coder-6.7B-Instruct 74.4 74.9 20.0 43.8 15.5 9.6
CodeQwen1.5-7B-Chat 83.5 77.7 17.6 43.6 15.5 3.0
Yi-Coder-9B-Chat 82.3 82.0 26.7 49.0 17.6 17.5
Llama-3.1-8B-Instruct 68.3 70.1 17.1 40.5 13.5 11.5
OpenCoder-8B-Instruct 83.5 79.1 30.5 50.9 18.9 17.1
Qwen2.5-Coder-7B-Instruct 88.4 83.5 26.7 48.8 20.3 17.3
Qwen3-8B 84.8 77.0 32.8 51.7 23.0 23.5
Seed-Coder-8B-Instruct 84.8 85.2 36.2 53.3 26.4 24.7

有关详细的基准测试性能,请参阅我们的 📑 技术报告

许可证

本项目采用 MIT 许可证。详情请参阅 LICENSE 文件

<!-- ## Citation

If you find our work helpful, feel free to give us a cite.

@article{zhang2025seedcoder,
    title={Seed-Coder: Let the Code Model Curate Data for Itself},
    author={Xxx},
    year={2025},
    eprint={2504.xxxxx},
    archivePrefix={arXiv},
    primaryClass={cs.CL},
    url={https://arxiv.org/abs/xxxx.xxxxx}, 
}
``` -->

Prince-1/Seed-Coder-8B-Instruct

作者 Prince-1

text-generation onnxruntime-genai
↓ 0 ♥ 0

创建时间: 2025-07-04 07:37:28+00:00

更新时间: 2025-07-04 07:38:52+00:00

在 Hugging Face 上查看

文件 (8)

.gitattributes
README.md
genai_config.json
model.onnx ONNX
model.onnx.data
special_tokens_map.json
tokenizer.json
tokenizer_config.json