ONNX 模型库
返回模型

说明文档

由 TinyLlama/TinyLlama-1.1B-Chat-v1.0 转换并进行了4位量化。

需要 onnxruntime>=0.17.0

BricksDisplay/TinyLlama-1.1B-Chat-v1.0-q4

作者 BricksDisplay

text-generation transformers.js
↓ 1 ♥ 1

创建时间: 2024-03-12 16:42:37+00:00

更新时间: 2025-03-11 04:53:28+00:00

在 Hugging Face 上查看

文件 (20)

.gitattributes
Constant_1959_attr__value
Constant_1963_attr__value
README.md
config.json
generation_config.json
onnx/decoder_model.onnx ONNX
onnx/decoder_model.onnx_data
onnx/decoder_model_merged.onnx ONNX
onnx/decoder_model_merged.onnx_data
onnx/decoder_model_merged_quantized.onnx ONNX
onnx/decoder_model_quantized.onnx ONNX
onnx/decoder_with_past_model.onnx ONNX
onnx/decoder_with_past_model.onnx_data
onnx/decoder_with_past_model_quantized.onnx ONNX
quantize_config.json
special_tokens_map.json
tokenizer.json
tokenizer.model
tokenizer_config.json