ONNX 模型库
返回模型

说明文档

使用 onnx o4 优化

from pathlib import Path
from transformers import AutoTokenizer
from optimum.onnxruntime import ORTModelForSequenceClassification, ORTOptimizer
from optimum.onnxruntime import AutoOptimizationConfig

model = "nreimers/mmarco-mMiniLMv2-L6-H384-v1"
tokenizer = AutoTokenizer.from_pretrained(model)
ort_model = ORTModelForSequenceClassification.from_pretrained(model, export=True)

save_dir = Path("/tmp/optimized_models")
save_dir.mkdir(exist_ok=True, parents=True)

optimizer = ORTOptimizer.from_pretrained(ort_model)
optimizer.optimize(
    optimization_config=AutoOptimizationConfig.O4(),
    save_dir=save_dir,
)

使用 onnx 运行

import torch
from transformers import AutoTokenizer
from transformers.pipelines.text_classification import ClassificationFunction
from optimum.pipelines import pipeline as ort_pipeline
from optimum.onnxruntime import ORTModelForSequenceClassification


model = "Slite/mmarco-mMiniLMv2-L6-H384-v1-onnx-o4"
device = torch.device(0) if torch.cuda.is_available() else -1
tokenizer = AutoTokenizer.from_pretrained(model)
ort_model = ORTModelForSequenceClassification.from_pretrained(
    model, file_name="model_optimized.onnx")
cross_encoder = ort_pipeline(
    task="text-classification",
    model=ort_model,
    tokenizer=tokenizer,
    device=device,
    function_to_apply=ClassificationFunction.SIGMOID,
    padding=True,
    truncation=True)

cross_encoder([{
    "text":
    "Quel est le but de la vie ?",
    "text_pair":
    "Le but de la vie est une question subjective et dépend de la croyance et de la perspective personnelle de chaque individu. Pour certains, le but peut être de trouver la bonheur et le contentement personnel, pour d'autres cela peut être de faire une différence positive dans le monde, de vivre en harmonie avec les autres, de découvrir la signification et le propre but de leur existence, entre autres. En fin de compte, le but de la vie est déterminé par chaque individu eux-mêmes."
}])

Slite/mmarco-mMiniLMv2-L6-H384-v1-onnx-o4

作者 Slite

text-classification transformers
↓ 51 ♥ 0

创建时间: 2023-11-28 22:40:43+00:00

更新时间: 2023-11-28 23:12:58+00:00

在 Hugging Face 上查看

文件 (9)

.gitattributes
README.md
config.json
model_optimized.onnx ONNX
ort_config.json
sentencepiece.bpe.model
special_tokens_map.json
tokenizer.json
tokenizer_config.json