ONNX 模型库
返回模型

说明文档

FRIDA 转换为 ONNX 格式

此模型原始仓库的链接。 此 ONNX 版本支持批处理

将 FRIDA 转换为 ONNX 和 TensorRT

这是一个包含 ONNX 格式(TensorRT 即将推出)的 FRIDA 模型的仓库。 此处也包含该模型的 Python 转换脚本。onnx_to_trt.py 目前尚未测试

FRIDA ONNX/TRT 模型卡片

<figure> <img src="img.jpg"> </figure>

FRIDA 是一个基于 T5 去噪架构启发的全规模微调通用文本嵌入模型。该模型基于 FRED-T5 模型的编码器部分,延续了文本嵌入模型的研究(ruMTEBru-en-RoSBERTa)。它在俄英数据集上进行了预训练,并针对目标任务进行了微调以提升性能。

有关模型的更多详细信息,请参阅这篇文章(俄文)。

使用方法

该模型可以直接使用前缀。建议使用 CLS 池化。前缀和池化的选择取决于任务。

我们使用以下基本规则来选择前缀:

  • "search_query: ""search_document: " 前缀用于答案或相关段落检索
  • "paraphrase: " 前缀用于对称性改写相关任务(STS、改写挖掘、去重)
  • "categorize: " 前缀用于文档标题和正文的非对称匹配(例如新闻、科学论文、社交媒体帖子)
  • "categorize_sentiment: " 前缀用于任何依赖情感特征的任务(例如仇恨、有毒、情绪)
  • "categorize_topic: " 前缀用于需要按主题对文本进行分组的任务
  • "categorize_entailment: " 前缀用于文本蕴含任务(NLI)

为了更好地根据您的需求定制模型,您可以使用相关的高质量俄语和英语数据集对其进行微调。

以下是使用 Transformers 和 SentenceTransformers 库进行文本编码的示例。

作者

引用

@misc{TODO
}

限制

该模型设计用于处理俄语文本,英语文本的质量未知。最大输入文本长度限制为 512 个标记。

geologist387/FRIDA-transformed

作者 geologist387

feature-extraction sentence-transformers
↓ 0 ♥ 1

创建时间: 2026-01-10 16:37:34+00:00

更新时间: 2026-02-17 21:11:36+00:00

在 Hugging Face 上查看

文件 (16)

.gitattributes
.gitignore
README.md
check_input_dims.py
check_inputs.py
img.jpg
onnx/frida-onnx/FRIDA.onnx ONNX
onnx/frida-onnx/FRIDA.onnx.data
onnx/frida-onnx/merges.txt
onnx/frida-onnx/special_tokens_map.json
onnx/frida-onnx/tokenizer.json
onnx/frida-onnx/tokenizer_config.json
onnx/frida-onnx/vocab.json
pyproject.toml
safetensors_to_onnx.ipynb
safetensors_to_onnx.py