ONNX 模型库
返回模型

说明文档

EmbeddingGemma-300M 圣经文本搜索微调版 (ONNX)

这是我们专门为圣经文本搜索和检索微调的 EmbeddingGemma-300M 模型的 ONNX 版本。该版本针对使用 transformers.js 进行 Web 部署进行了优化。

模型性能

  • 准确率@1: 12.00% (相比基础模型提升13倍)
  • 准确率@3: 15.00%
  • 准确率@10: 31.00%
  • 训练步数: 25 (最佳停止点)
  • 基础模型准确率@1: 0.91%

使用 Transformers.js

import { AutoTokenizer, AutoModel } from '@huggingface/transformers';

// Load the model
const model = await AutoModel.from_pretrained('dpshade22/embeddinggemma-scripture-v1-onnx');
const tokenizer = await AutoTokenizer.from_pretrained('dpshade22/embeddinggemma-scripture-v1-onnx');

// Encode queries (use search_query: prefix)
const query = \"search_query: What is love?\";
const query_embedding = await model.encode([query]);

// Encode documents (use search_document: prefix)  
const document = \"search_document: Love is patient and kind\";
const doc_embedding = await model.encode([document]);

前缀

为了获得最佳性能,请使用以下前缀:

  • 查询: \"search_query: 你的问题\"
  • 文档: \"search_document: 经文文本\"

模型详情

  • 基础模型: google/embeddinggemma-300m
  • 训练数据: 26,276 对圣经文本
  • 训练步数: 25步 (最佳停止点)
  • 学习率: 2.0e-04
  • 批次大小: 8
  • 输出维度: 768D (支持 Matryoshka 384D, 128D)
  • ONNX 转换: 使用 nixiesearch/onnx-convert 专用工具

训练详情

  • 训练数据: 26,276 对圣经文本
  • 学习率: 2.0e-04
  • 批次大小: 8
  • 训练策略: 在25步时早停以防止过拟合
  • 输出维度: 768D (支持 Matryoshka 384D, 128D)

预期用途

该模型专为以下用途设计:

  • Web 应用中的圣经文本搜索和检索
  • 查找相关经文段落
  • 宗教文本的语义相似度计算
  • 圣经主题的问答系统
  • 使用 transformers.js 的离线 PWA 应用

转换详情

  • 转换工具: nixiesearch/onnx-convert 专用工具
  • ONNX Opset: 17
  • 优化级别: 1
  • 与原始模型的最大差异: 1.9e-05 (在可接受范围内)

相关模型

  • 原始 PyTorch 版本: dpshade22/embeddinggemma-scripture-v1
  • 基础模型: google/embeddinggemma-300m
  • 参考 ONNX: onnx-community/embeddinggemma-300m-ONNX

dpshade22/embeddinggemma-scripture-v1-onnx

作者 dpshade22

sentence-similarity transformers.js
↓ 0 ♥ 0

创建时间: 2025-09-12 18:52:31+00:00

更新时间: 2025-09-12 18:54:09+00:00

在 Hugging Face 上查看

文件 (9)

.gitattributes
README.md
config.json
model.onnx ONNX
onnx/model.onnx ONNX
onnx/model_opt1_Float32.onnx ONNX
special_tokens_map.json
tokenizer.json
tokenizer_config.json