返回模型
说明文档
EmbeddingGemma-300M 圣经文本搜索微调版 (ONNX)
这是我们专门为圣经文本搜索和检索微调的 EmbeddingGemma-300M 模型的 ONNX 版本。该版本针对使用 transformers.js 进行 Web 部署进行了优化。
模型性能
- 准确率@1: 12.00% (相比基础模型提升13倍)
- 准确率@3: 15.00%
- 准确率@10: 31.00%
- 训练步数: 25 (最佳停止点)
- 基础模型准确率@1: 0.91%
使用 Transformers.js
import { AutoTokenizer, AutoModel } from '@huggingface/transformers';
// Load the model
const model = await AutoModel.from_pretrained('dpshade22/embeddinggemma-scripture-v1-onnx');
const tokenizer = await AutoTokenizer.from_pretrained('dpshade22/embeddinggemma-scripture-v1-onnx');
// Encode queries (use search_query: prefix)
const query = \"search_query: What is love?\";
const query_embedding = await model.encode([query]);
// Encode documents (use search_document: prefix)
const document = \"search_document: Love is patient and kind\";
const doc_embedding = await model.encode([document]);
前缀
为了获得最佳性能,请使用以下前缀:
- 查询:
\"search_query: 你的问题\" - 文档:
\"search_document: 经文文本\"
模型详情
- 基础模型:
google/embeddinggemma-300m - 训练数据: 26,276 对圣经文本
- 训练步数: 25步 (最佳停止点)
- 学习率: 2.0e-04
- 批次大小: 8
- 输出维度: 768D (支持 Matryoshka 384D, 128D)
- ONNX 转换: 使用 nixiesearch/onnx-convert 专用工具
训练详情
- 训练数据: 26,276 对圣经文本
- 学习率: 2.0e-04
- 批次大小: 8
- 训练策略: 在25步时早停以防止过拟合
- 输出维度: 768D (支持 Matryoshka 384D, 128D)
预期用途
该模型专为以下用途设计:
- Web 应用中的圣经文本搜索和检索
- 查找相关经文段落
- 宗教文本的语义相似度计算
- 圣经主题的问答系统
- 使用 transformers.js 的离线 PWA 应用
转换详情
- 转换工具: nixiesearch/onnx-convert 专用工具
- ONNX Opset: 17
- 优化级别: 1
- 与原始模型的最大差异: 1.9e-05 (在可接受范围内)
相关模型
- 原始 PyTorch 版本: dpshade22/embeddinggemma-scripture-v1
- 基础模型: google/embeddinggemma-300m
- 参考 ONNX: onnx-community/embeddinggemma-300m-ONNX
dpshade22/embeddinggemma-scripture-v1-onnx
作者 dpshade22
sentence-similarity
transformers.js
↓ 0
♥ 0
创建时间: 2025-09-12 18:52:31+00:00
更新时间: 2025-09-12 18:54:09+00:00
在 Hugging Face 上查看文件 (9)
.gitattributes
README.md
config.json
model.onnx
ONNX
onnx/model.onnx
ONNX
onnx/model_opt1_Float32.onnx
ONNX
special_tokens_map.json
tokenizer.json
tokenizer_config.json