返回模型
说明文档
FRIDA 转换为 ONNX 格式
此模型原始仓库的链接。 此 ONNX 版本支持批处理
将 FRIDA 转换为 ONNX 和 TensorRT
这是一个包含 ONNX 格式(TensorRT 即将推出)的 FRIDA 模型的仓库。 此处也包含该模型的 Python 转换脚本。onnx_to_trt.py 目前尚未测试
FRIDA ONNX/TRT 模型卡片
<figure> <img src="img.jpg"> </figure>
FRIDA 是一个基于 T5 去噪架构启发的全规模微调通用文本嵌入模型。该模型基于 FRED-T5 模型的编码器部分,延续了文本嵌入模型的研究(ruMTEB、ru-en-RoSBERTa)。它在俄英数据集上进行了预训练,并针对目标任务进行了微调以提升性能。
有关模型的更多详细信息,请参阅这篇文章(俄文)。
使用方法
该模型可以直接使用前缀。建议使用 CLS 池化。前缀和池化的选择取决于任务。
我们使用以下基本规则来选择前缀:
"search_query: "和"search_document: "前缀用于答案或相关段落检索"paraphrase: "前缀用于对称性改写相关任务(STS、改写挖掘、去重)"categorize: "前缀用于文档标题和正文的非对称匹配(例如新闻、科学论文、社交媒体帖子)"categorize_sentiment: "前缀用于任何依赖情感特征的任务(例如仇恨、有毒、情绪)"categorize_topic: "前缀用于需要按主题对文本进行分组的任务"categorize_entailment: "前缀用于文本蕴含任务(NLI)
为了更好地根据您的需求定制模型,您可以使用相关的高质量俄语和英语数据集对其进行微调。
以下是使用 Transformers 和 SentenceTransformers 库进行文本编码的示例。
作者
- SaluteDevices AI for B2C 研发团队。
- Artem Snegirev:HF 主页、Github;
- Anna Maksimova HF 主页;
- Aleksandr Abramov:HF 主页、Github、Kaggle 竞赛大师
引用
@misc{TODO
}
限制
该模型设计用于处理俄语文本,英语文本的质量未知。最大输入文本长度限制为 512 个标记。
geologist387/FRIDA-transformed
作者 geologist387
feature-extraction
sentence-transformers
↓ 0
♥ 1
创建时间: 2026-01-10 16:37:34+00:00
更新时间: 2026-02-17 21:11:36+00:00
在 Hugging Face 上查看文件 (16)
.gitattributes
.gitignore
README.md
check_input_dims.py
check_inputs.py
img.jpg
onnx/frida-onnx/FRIDA.onnx
ONNX
onnx/frida-onnx/FRIDA.onnx.data
onnx/frida-onnx/merges.txt
onnx/frida-onnx/special_tokens_map.json
onnx/frida-onnx/tokenizer.json
onnx/frida-onnx/tokenizer_config.json
onnx/frida-onnx/vocab.json
pyproject.toml
safetensors_to_onnx.ipynb
safetensors_to_onnx.py