ONNX 模型库
返回模型

说明文档

🌞 SolaraV2 — summerstars/SolaraV2

✨ 由高中生创建 | 基于 Google Colab(T4 GPU)构建

SolaraV2 是原版 Solara 的升级版本 —— 一个基于 HuggingFaceTB/SmolLM2-360M-Instruct 的轻量级指令微调语言模型。
本版本在更大且更多样化的数据集上进行训练,包括基础数学相关样本,提升了其处理日常对话和教育任务的能力。
所有开发工作均由一名高中生使用 Google ColabT4 GPU 完成。


📌 模型详情

特征 说明
基础模型 HuggingFaceTB/SmolLM2-360M-Instruct
参数量 360M
架构 Decoder-only Transformer
语言 英语
许可证 Apache 2.0
训练新增内容 基础数学、事实问答数据

🚀 主要用途

  • 🤖 轻量级聊天机器人
  • 📱 在 CPU 或移动设备上进行推理
  • 📚 教育或爱好者项目
  • 🧾 指令跟随任务
  • ➗ 基础数学问题解答

🛠️ 使用方法

from transformers import AutoTokenizer, AutoModelForCausalLM

model_name = "summerstars/SolaraV2-coder"

tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

prompt = "What is 15 * 4?"
inputs = tokenizer(prompt, return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=64)

# 打印结果
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

summerstars/SolaraV2-coder

作者 summerstars

text-generation transformers
↓ 1 ♥ 0

创建时间: 2025-04-23 12:22:17+00:00

更新时间: 2025-04-30 06:23:57+00:00

在 Hugging Face 上查看

文件 (11)

.gitattributes
README.md
added_tokens.json
config.json
generation_config.json
merges.txt
model.safetensors
special_tokens_map.json
tokenizer.json
tokenizer_config.json
vocab.json