ONNX 模型库
返回模型

说明文档

amai-gsu/SmolLM2-135M-Instruct-Q4_K_S-GGUF

此模型是通过 ggml.ai 的 GGUF-my-repo 空间,使用 llama.cpp 从 HuggingFaceTB/SmolLM2-135M-Instruct 转换为 GGUF 格式的。 有关该模型的更多详细信息,请参阅 原始模型卡片

使用 llama.cpp

通过 brew 安装 llama.cpp(适用于 Mac 和 Linux)

brew install llama.cpp

启动 llama.cpp 服务器或命令行界面(CLI)。

命令行界面(CLI):

llama-cli --hf-repo amai-gsu/SmolLM2-135M-Instruct-Q4_K_S-GGUF --hf-file smollm2-135m-instruct-q4_k_s.gguf -p \"The meaning to life and the universe is\"

服务器:

llama-server --hf-repo amai-gsu/SmolLM2-135M-Instruct-Q4_K_S-GGUF --hf-file smollm2-135m-instruct-q4_k_s.gguf -c 2048

注意:您也可以直接按照 Llama.cpp 仓库中列出的 使用步骤 使用此检查点。

第一步:从 GitHub 克隆 llama.cpp。

git clone https://github.com/ggerganov/llama.cpp

第二步:进入 llama.cpp 文件夹,并使用 LLAMA_CURL=1 标志以及其他硬件相关标志(例如:Linux 上 Nvidia GPU 使用 LLAMA_CUDA=1)进行构建。

cd llama.cpp && LLAMA_CURL=1 make

第三步:通过主程序运行推理。

./llama-cli --hf-repo amai-gsu/SmolLM2-135M-Instruct-Q4_K_S-GGUF --hf-file smollm2-135m-instruct-q4_k_s.gguf -p \"The meaning to life and the universe is\"

./llama-server --hf-repo amai-gsu/SmolLM2-135M-Instruct-Q4_K_S-GGUF --hf-file smollm2-135m-instruct-q4_k_s.gguf -c 2048

amai-gsu/SmolLM2-135M-Instruct-Q4_K_S-GGUF

作者 amai-gsu

text-generation transformers
↓ 1 ♥ 0

创建时间: 2025-06-26 14:22:12+00:00

更新时间: 2025-06-26 14:22:15+00:00

在 Hugging Face 上查看

文件 (3)

.gitattributes
README.md
smollm2-135m-instruct-q4_k_s.gguf