ONNX 模型库
返回模型

说明文档

模型卡片

<!-- 简要说明该模型是什么/做什么。 -->

(2025年8月更新 - CC-BY 模型即将推出。)

概述

这是一系列低延迟流式模型,专为边缘设备使用而设计。 目标:相比同等规模的 Whisper 和其他模型,提供更快或更高质量的语音识别性能。

  • 语言:英语、法语、德语(另有7种语言即将推出)。

演示

许可证

许可证仍在商讨中(可能是 Coqui 许可证)。该模型计划采用双重许可

  • 非商业用途免费
  • 商业用途提供实惠的许可证

训练

  • 使用修改后的 k2/Icefall 流水线进行训练。
  • 可以使用标准的 Sherpa 项目进行推理。
  • 静音填充和音量归一化可能有助于产生更好的结果。

致谢

特别感谢 LhotseSherpak2Icefall 团队的支持与工具。

sheldonrobinson/Kroko-ASR

作者 sheldonrobinson

automatic-speech-recognition
↓ 0 ♥ 0

创建时间: 2025-08-23 00:04:12+00:00

更新时间: 2025-08-23 00:04:25+00:00

在 Hugging Face 上查看

文件 (20)

.gitattributes
LICENSE
README.md
de/de_decoder.onnx ONNX
de/de_encoder.onnx ONNX
de/de_joiner.onnx ONNX
de/de_tokens.txt
decode_file.py
en/en_decoder.onnx ONNX
en/en_encoder.onnx ONNX
en/en_joiner.onnx ONNX
en/en_tokens.txt
es/es_decoder.onnx ONNX
es/es_encoder.onnx ONNX
es/es_joiner.onnx ONNX
es/es_tokens.txt
fr/fr_decoder.onnx ONNX
fr/fr_encoder.onnx ONNX
fr/fr_joiner.onnx ONNX
fr/fr_tokens.txt