ONNX 模型库
返回模型

说明文档

intfloat/e5-small-v2 的 ONNX 量化版本

本仓库包含 intfloat/e5-small-v2 的 ONNX 导出版本和多个量化版本。

使用方法

from sentence_transformers import SentenceTransformer

# 加载 Int8 模型(ARM64 示例)
model = SentenceTransformer(
    "jrc2139/e5-small-v2-ONNX",
    backend="onnx",
    model_kwargs={"file_name": "onnx/model_qint8_arm64.onnx"},
    trust_remote_code=True
)

jrc2139/e5-small-v2-ONNX

作者 jrc2139

feature-extraction sentence-transformers
↓ 0 ♥ 0

创建时间: 2025-12-30 05:38:59+00:00

更新时间: 2026-02-06 13:49:13+00:00

在 Hugging Face 上查看

文件 (17)

.gitattributes
1_Pooling/config.json
README.md
config.json
config_sentence_transformers.json
modules.json
onnx/model.onnx ONNX
onnx/model_qint4.onnx ONNX
onnx/model_qint8_arm64.onnx ONNX
onnx/model_qint8_avx512.onnx ONNX
onnx/model_qint8_avx512_vnni.onnx ONNX
onnx/model_quint8_avx2.onnx ONNX
sentence_bert_config.json
special_tokens_map.json
tokenizer.json
tokenizer_config.json
vocab.txt