ONNX 模型库
返回模型

说明文档

Stable Diffusion 3.5 Medium ONNX

该 ONNX 版本的 Stable Diffusion 3.5 Medium 是从 PyTorch 源模型制作的,使用 optimum-cli将 Stable Diffusion 3.5 Medium 从 PyTorch 转换为 ONNX

3.5 Medium 演示图片

使用方法

Python Gradio:ONNX 版 Stable Diffusion 3.5 内补绘制

模型

MMDiT-X

Stable Diffusion 3.5 Medium 是一个多模态扩散 Transformer 改进版(MMDiT-X)文本生成图像模型,在图像质量、排版、复杂提示词理解和资源效率方面表现更优。

请注意:本模型根据 Stability 社区许可协议发布。访问 Stability AI 了解更多信息,或联系我们获取商业许可详情。

模型描述

  • 开发者: Stability AI
  • 模型类型: MMDiT-X 文本生成图像生成模型
  • 模型描述: 该模型根据文本提示词生成图像。它是一个多模态扩散 Transformer (https://arxiv.org/abs/2403.03206) 改进版,使用三个固定的预训练文本编码器,采用 QK 归一化来提高训练稳定性,并在前 12 个 Transformer 层中使用双重注意力块。

许可协议

  • 社区许可: 对于年收入低于 100 万美元的组织或个人,可免费用于研究、非商业和商业用途。更多详情请参阅社区许可协议。更多信息请访问 https://stability.ai/license。
  • 对于年收入超过 100 万美元的个人和组织:请联系我们获取企业许可。

armwaheed/stable-diffusion-3.5-medium-onnx

作者 armwaheed

text-to-image diffusers
↓ 0 ♥ 0

创建时间: 2025-04-24 15:54:05+00:00

更新时间: 2025-05-20 00:06:01+00:00

在 Hugging Face 上查看

文件 (34)

.gitattributes
.huggingfaceignore
README.md
mmdit-x.png
model_index.json
scheduler/scheduler_config.json
sd3.5_medium_demo.jpg
text_encoder/config.json
text_encoder/model.onnx ONNX
text_encoder_2/config.json
text_encoder_2/model.onnx ONNX
text_encoder_2/model.onnx_data
text_encoder_3/config.json
text_encoder_3/model.onnx ONNX
text_encoder_3/model.onnx_data
tokenizer/merges.txt
tokenizer/special_tokens_map.json
tokenizer/tokenizer_config.json
tokenizer/vocab.json
tokenizer_2/merges.txt
tokenizer_2/special_tokens_map.json
tokenizer_2/tokenizer_config.json
tokenizer_2/vocab.json
tokenizer_3/special_tokens_map.json
tokenizer_3/spiece.model
tokenizer_3/tokenizer.json
tokenizer_3/tokenizer_config.json
transformer/config.json
transformer/model.onnx ONNX
transformer/model.onnx_data
vae_decoder/config.json
vae_decoder/model.onnx ONNX
vae_encoder/config.json
vae_encoder/model.onnx ONNX