返回模型
说明文档
使用 onnx o4 优化
from pathlib import Path
from transformers import AutoTokenizer
from optimum.onnxruntime import ORTModelForSequenceClassification, ORTOptimizer
from optimum.onnxruntime import AutoOptimizationConfig
model = "nreimers/mmarco-mMiniLMv2-L6-H384-v1"
tokenizer = AutoTokenizer.from_pretrained(model)
ort_model = ORTModelForSequenceClassification.from_pretrained(model, export=True)
save_dir = Path("/tmp/optimized_models")
save_dir.mkdir(exist_ok=True, parents=True)
optimizer = ORTOptimizer.from_pretrained(ort_model)
optimizer.optimize(
optimization_config=AutoOptimizationConfig.O4(),
save_dir=save_dir,
)
使用 onnx 运行
import torch
from transformers import AutoTokenizer
from transformers.pipelines.text_classification import ClassificationFunction
from optimum.pipelines import pipeline as ort_pipeline
from optimum.onnxruntime import ORTModelForSequenceClassification
model = "Slite/mmarco-mMiniLMv2-L6-H384-v1-onnx-o4"
device = torch.device(0) if torch.cuda.is_available() else -1
tokenizer = AutoTokenizer.from_pretrained(model)
ort_model = ORTModelForSequenceClassification.from_pretrained(
model, file_name="model_optimized.onnx")
cross_encoder = ort_pipeline(
task="text-classification",
model=ort_model,
tokenizer=tokenizer,
device=device,
function_to_apply=ClassificationFunction.SIGMOID,
padding=True,
truncation=True)
cross_encoder([{
"text":
"Quel est le but de la vie ?",
"text_pair":
"Le but de la vie est une question subjective et dépend de la croyance et de la perspective personnelle de chaque individu. Pour certains, le but peut être de trouver la bonheur et le contentement personnel, pour d'autres cela peut être de faire une différence positive dans le monde, de vivre en harmonie avec les autres, de découvrir la signification et le propre but de leur existence, entre autres. En fin de compte, le but de la vie est déterminé par chaque individu eux-mêmes."
}])
Slite/mmarco-mMiniLMv2-L6-H384-v1-onnx-o4
作者 Slite
text-classification
transformers
↓ 51
♥ 0
创建时间: 2023-11-28 22:40:43+00:00
更新时间: 2023-11-28 23:12:58+00:00
在 Hugging Face 上查看文件 (9)
.gitattributes
README.md
config.json
model_optimized.onnx
ONNX
ort_config.json
sentencepiece.bpe.model
special_tokens_map.json
tokenizer.json
tokenizer_config.json