说明文档

FRIDA 转换为 ONNX 格式

此模型原始仓库的链接。此 ONNX 版本支持批处理

这是一个包含 ONNX 格式（TensorRT 即将推出）的 FRIDA 模型的仓库。此处也包含该模型的 Python 转换脚本。onnx_to_trt.py 目前尚未测试

FRIDA 是一个基于 T5 去噪架构启发的全规模微调通用文本嵌入模型。该模型基于 FRED-T5 模型的编码器部分，延续了文本嵌入模型的研究（ruMTEB、ru-en-RoSBERTa）。它在俄英数据集上进行了预训练，并针对目标任务进行了微调以提升性能。

有关模型的更多详细信息，请参阅这篇文章（俄文）。

该模型可以直接使用前缀。建议使用 CLS 池化。前缀和池化的选择取决于任务。

我们使用以下基本规则来选择前缀：

为了更好地根据您的需求定制模型，您可以使用相关的高质量俄语和英语数据集对其进行微调。

以下是使用 Transformers 和 SentenceTransformers 库进行文本编码的示例。

@misc{TODO
}

该模型设计用于处理俄语文本，英语文本的质量未知。最大输入文本长度限制为 512 个标记。

作者 geologist387

feature-extraction sentence-transformers

↓ 0 ♥ 1

创建时间: 2026-01-10 16:37:34+00:00

更新时间: 2026-02-17 21:11:36+00:00

.gitattributes

.gitignore

README.md

check_input_dims.py

check_inputs.py

img.jpg

onnx/frida-onnx/FRIDA.onnx ONNX

onnx/frida-onnx/FRIDA.onnx.data

onnx/frida-onnx/merges.txt

onnx/frida-onnx/special_tokens_map.json

onnx/frida-onnx/tokenizer.json

onnx/frida-onnx/tokenizer_config.json

onnx/frida-onnx/vocab.json

pyproject.toml

safetensors_to_onnx.ipynb

safetensors_to_onnx.py