返回模型
说明文档
模型卡片
<!-- 简要说明该模型是什么/做什么。 -->
(2025年8月更新 - CC-BY 模型即将推出。)
概述
这是一系列低延迟流式模型,专为边缘设备使用而设计。 目标:相比同等规模的 Whisper 和其他模型,提供更快或更高质量的语音识别性能。
- 语言:英语、法语、德语(另有7种语言即将推出)。
演示
- 浏览器演示 (CPU)
(完全在浏览器中使用 CPU 运行。) - Gradio / Python 演示
许可证
许可证仍在商讨中(可能是 Coqui 许可证)。该模型计划采用双重许可:
- 非商业用途免费。
- 商业用途提供实惠的许可证。
训练
- 使用修改后的 k2/Icefall 流水线进行训练。
- 可以使用标准的 Sherpa 项目进行推理。
- 静音填充和音量归一化可能有助于产生更好的结果。
致谢
sheldonrobinson/Kroko-ASR
作者 sheldonrobinson
automatic-speech-recognition
↓ 0
♥ 0
创建时间: 2025-08-23 00:04:12+00:00
更新时间: 2025-08-23 00:04:25+00:00
在 Hugging Face 上查看文件 (20)
.gitattributes
LICENSE
README.md
de/de_decoder.onnx
ONNX
de/de_encoder.onnx
ONNX
de/de_joiner.onnx
ONNX
de/de_tokens.txt
decode_file.py
en/en_decoder.onnx
ONNX
en/en_encoder.onnx
ONNX
en/en_joiner.onnx
ONNX
en/en_tokens.txt
es/es_decoder.onnx
ONNX
es/es_encoder.onnx
ONNX
es/es_joiner.onnx
ONNX
es/es_tokens.txt
fr/fr_decoder.onnx
ONNX
fr/fr_encoder.onnx
ONNX
fr/fr_joiner.onnx
ONNX
fr/fr_tokens.txt