说明文档
Qwen3-Reranker-8B (ONNX 版本)
- 转换为开放神经网络交换格式,用于 Rust 推理
- 💡 直接从 Docker 镜像中心拉取镜像 💡
<p align="center"> <img src="https://qianwen-res.oss-accelerate-overseas.aliyuncs.com/logo_qwen3.png" width="400"/> <p>
亮点
Qwen3 Embedding 模型系列是 Qwen 家族的最新专有模型,专为文本嵌入和排序任务设计。基于 Qwen3 系列的稠密基础模型构建,提供了多种尺寸(0.6B、4B 和 8B)的完整文本嵌入和重排序模型。该系列继承了其基础模型卓越的多语言能力、长文本理解和推理能力。Qwen3 Embedding 系列在多个文本嵌入和排序任务上取得了显著进展,包括文本检索、代码检索、文本分类、文本聚类和双语文本挖掘。
卓越的通用性:嵌入模型在广泛的下游应用评估中取得了最先进的性能。8B 尺寸的嵌入模型在 MTEB 多语言排行榜上排名第一(截至 2025 年 6 月 5 日,分数 70.58),而重排序模型在各种文本检索场景中表现出色。
全面的灵活性:Qwen3 Embedding 系列为嵌入和重排序模型提供了全尺寸范围(从 0.6B 到 8B),满足优先考虑效率和效果的不同使用场景。开发者可以无缝组合这两个模块。此外,嵌入模型允许在所有维度上灵活定义向量,嵌入和重排序模型都支持用户自定义指令,以增强特定任务、语言或场景的性能。
多语言能力:得益于 Qwen3 模型的多语言能力,Qwen3 Embedding 系列支持超过 100 种语言。这包括各种编程语言,并提供强大的多语言、跨语言和代码检索能力。
模型概述
Qwen3-Reranker-8B 具有以下特性:
- 模型类型:文本重排序
- 支持语言:100+ 种语言
- 参数数量:8B
- 上下文长度:32k
更多详细信息,包括基准评估、硬件需求和推理性能,请参阅我们的 博客、GitHub。
documents = [
"中国的首都是北京。",
"重力是一种将两个物体相互吸引的力。它赋予物理物体重量,并负责行星围绕太阳的运动。",
]
pairs = [format_instruction(task, query, doc) for query, doc in zip(queries, documents)]
# 对输入文本进行分词
inputs = process_inputs(pairs)
scores = compute_logits(inputs)
print("scores: ", scores)
📌 提示:我们建议开发者根据其特定场景、任务和语言自定义 instruct。我们的测试表明,在大多数检索场景中,查询端不使用 instruct 可能会导致检索性能下降约 1% 到 5%。
评估
| 模型 | 参数量 | MTEB-R | CMTEB-R | MMTEB-R | MLDR | MTEB-Code | FollowIR |
|---|---|---|---|---|---|---|---|
| Qwen3-Embedding-0.6B | 0.6B | 61.82 | 71.02 | 64.64 | 50.26 | 75.41 | 5.09 |
| Jina-multilingual-reranker-v2-base | 0.3B | 58.22 | 63.37 | 63.73 | 39.66 | 58.98 | -0.68 |
| gte-multilingual-reranker-base | 0.3B | 59.51 | 74.08 | 59.44 | 66.33 | 54.18 | -1.64 |
| BGE-reranker-v2-m3 | 0.6B | 57.03 | 72.16 | 58.36 | 59.51 | 41.38 | -0.01 |
| Qwen3-Reranker-0.6B | 0.6B | 65.80 | 71.31 | 66.36 | 67.28 | 73.42 | 5.41 |
| Qwen3-Reranker-4B | 4B | 69.76 | 75.94 | 72.74 | 69.97 | 81.20 | 14.84 |
| Qwen3-Reranker-8B | 8B | 69.02 | 77.45 | 72.94 | 70.19 | 81.22 | 8.05 |
注意:
- 重排序模型的评估结果。我们使用 MTEB(eng, v2)、MTEB(cmn, v1)、MMTEB 和 MTEB(Code)的检索子集,分别为 MTEB-R、CMTEB-R、MMTEB-R 和 MTEB-Code。
- 所有分数都是基于稠密嵌入模型 Qwen3-Embedding-0.6B 检索的前 100 个候选结果的运行结果。
引用
如果您觉得我们的工作有帮助,欢迎引用。
@article{qwen3embedding,
title={Qwen3 Embedding: Advancing Text Embedding and Reranking Through Foundation Models},
author={Zhang, Yanzhao and Li, Mingxin and Long, Dingkun and Zhang, Xin and Lin, Huan and Yang, Baosong and Xie, Pengjun and Yang, An and Liu, Dayiheng and Lin, Junyang and Huang, Fei and Zhou, Jingren},
journal={arXiv preprint arXiv:2506.05176},
year={2025}
}
DocDBrown/Qwen3-rerank-8B-onnx
作者 DocDBrown
创建时间: 2025-12-12 12:45:03+00:00
更新时间: 2025-12-24 01:41:07+00:00
在 Hugging Face 上查看