说明文档

Stable Diffusion 3.5 Medium ONNX

该 ONNX 版本的 Stable Diffusion 3.5 Medium 是从 PyTorch 源模型制作的，使用 optimum-cli：将 Stable Diffusion 3.5 Medium 从 PyTorch 转换为 ONNX。

3.5 Medium 演示图片

使用方法

Python Gradio：ONNX 版 Stable Diffusion 3.5 内补绘制

模型

MMDiT-X

Stable Diffusion 3.5 Medium 是一个多模态扩散 Transformer 改进版（MMDiT-X）文本生成图像模型，在图像质量、排版、复杂提示词理解和资源效率方面表现更优。

请注意：本模型根据 Stability 社区许可协议发布。访问 Stability AI 了解更多信息，或联系我们获取商业许可详情。

模型描述

开发者： Stability AI
模型类型： MMDiT-X 文本生成图像生成模型
模型描述： 该模型根据文本提示词生成图像。它是一个多模态扩散 Transformer (https://arxiv.org/abs/2403.03206) 改进版，使用三个固定的预训练文本编码器，采用 QK 归一化来提高训练稳定性，并在前 12 个 Transformer 层中使用双重注意力块。

许可协议

社区许可： 对于年收入低于 100 万美元的组织或个人，可免费用于研究、非商业和商业用途。更多详情请参阅社区许可协议。更多信息请访问 https://stability.ai/license。
对于年收入超过 100 万美元的个人和组织：请联系我们获取企业许可。

armwaheed/stable-diffusion-3.5-medium-onnx

作者 armwaheed

text-to-image diffusers

↓ 0 ♥ 0

创建时间: 2025-04-24 15:54:05+00:00

更新时间: 2025-05-20 00:06:01+00:00

在 Hugging Face 上查看

文件 (34)

.gitattributes

.huggingfaceignore

README.md

mmdit-x.png

model_index.json

scheduler/scheduler_config.json

sd3.5_medium_demo.jpg

text_encoder/config.json

text_encoder/model.onnx ONNX

text_encoder_2/config.json

text_encoder_2/model.onnx ONNX

text_encoder_2/model.onnx_data

text_encoder_3/config.json

text_encoder_3/model.onnx ONNX

text_encoder_3/model.onnx_data

tokenizer/merges.txt

tokenizer/special_tokens_map.json

tokenizer/tokenizer_config.json

tokenizer/vocab.json

tokenizer_2/merges.txt

tokenizer_2/special_tokens_map.json

tokenizer_2/tokenizer_config.json

tokenizer_2/vocab.json

tokenizer_3/special_tokens_map.json

tokenizer_3/spiece.model

tokenizer_3/tokenizer.json

tokenizer_3/tokenizer_config.json

transformer/config.json

transformer/model.onnx ONNX

transformer/model.onnx_data

vae_decoder/config.json

vae_decoder/model.onnx ONNX

vae_encoder/config.json

vae_encoder/model.onnx ONNX