说明文档

FlashSR

FlashSR 是一个基于 HierSpeech++ 上采样器架构的 2MB 音频超分辨率模型。它以 200 倍到 400 倍实时的速度将 16kHz 音频上采样至 48kHz。

FlashSR 专为高速频率重建而设计。与 Resemble-Enhance 和 ClearerVoice 等替代方案相比，它的计算开销显著更低，同时保持相似的输出质量。

ONNX/PyTorch 使用说明和源代码可在 GitHub 上获取： https://github.com/ysharma3501/FlashSR

感谢 HierSpeech++ 的作者，本模型基于其 48kHz 上采样器；同时感谢 Xenova 提供的 ONNX 代码。

作者 YatharthS

audio-to-audio

↓ 0 ♥ 60

创建时间: 2025-11-16 15:26:30+00:00

更新时间: 2025-12-26 20:24:13+00:00

.gitattributes

README.md

onnx/model.onnx ONNX

upsampler.pth