说明文档

EmbeddingGemma-300M 圣经文本搜索微调版 (ONNX)

这是我们专门为圣经文本搜索和检索微调的 EmbeddingGemma-300M 模型的 ONNX 版本。该版本针对使用 transformers.js 进行 Web 部署进行了优化。

模型性能

准确率@1: 12.00% (相比基础模型提升13倍)
准确率@3: 15.00%
准确率@10: 31.00%
训练步数: 25 (最佳停止点)
基础模型准确率@1: 0.91%

使用 Transformers.js

import { AutoTokenizer, AutoModel } from '@huggingface/transformers';

// Load the model
const model = await AutoModel.from_pretrained('dpshade22/embeddinggemma-scripture-v1-onnx');
const tokenizer = await AutoTokenizer.from_pretrained('dpshade22/embeddinggemma-scripture-v1-onnx');

// Encode queries (use search_query: prefix)
const query = \"search_query: What is love?\";
const query_embedding = await model.encode([query]);

// Encode documents (use search_document: prefix)  
const document = \"search_document: Love is patient and kind\";
const doc_embedding = await model.encode([document]);

前缀

为了获得最佳性能，请使用以下前缀：

查询: \"search_query: 你的问题\"
文档: \"search_document: 经文文本\"

模型详情

基础模型: google/embeddinggemma-300m
训练数据: 26,276 对圣经文本
训练步数: 25步 (最佳停止点)
学习率: 2.0e-04
批次大小: 8
输出维度: 768D (支持 Matryoshka 384D, 128D)
ONNX 转换: 使用 nixiesearch/onnx-convert 专用工具

训练详情

训练数据: 26,276 对圣经文本
学习率: 2.0e-04
批次大小: 8
训练策略: 在25步时早停以防止过拟合
输出维度: 768D (支持 Matryoshka 384D, 128D)

预期用途

该模型专为以下用途设计：

Web 应用中的圣经文本搜索和检索
查找相关经文段落
宗教文本的语义相似度计算
圣经主题的问答系统
使用 transformers.js 的离线 PWA 应用

转换详情

转换工具: nixiesearch/onnx-convert 专用工具
ONNX Opset: 17
优化级别: 1
与原始模型的最大差异: 1.9e-05 (在可接受范围内)

dpshade22/embeddinggemma-scripture-v1-onnx

作者 dpshade22

sentence-similarity transformers.js

↓ 0 ♥ 0

创建时间: 2025-09-12 18:52:31+00:00

更新时间: 2025-09-12 18:54:09+00:00

在 Hugging Face 上查看

文件 (9)

.gitattributes

README.md

config.json

model.onnx ONNX

onnx/model.onnx ONNX

onnx/model_opt1_Float32.onnx ONNX

special_tokens_map.json

tokenizer.json

tokenizer_config.json