返回模型
说明文档
AICE-v1 模型卡片
概述
AICE-v1 是一个基于 RWKV 架构的紧凑型对话模型,以合并权重的形式发布,用于文本生成。 AICE-v1 是一个衍生模型,从外部预训练的基础权重初始化,然后通过 LoRA 进行创新并合并以用于推理。
技术规格
- 架构:RWKV 因果语言模型
- 层数:24
- 隐藏层大小:2048
- 上下文长度:1024
- 词表大小:50277
- 有效规模:约 15 亿参数
- 主要格式:
model.safetensors(FP16/F32 混合张量,对运行时友好)
训练策略
- 从预训练的基础检查点权重初始化(第三方来源)。
- 使用 LoRA 适配器进行指令微调。
- 蒸馏监督流程源自更大的教师模型家族(700 亿参数级别)。
- LoRA 适配器已合并为单一整合模型以用于推理。
发布意图
- 本仓库包含用于推理的合并模型产物。
- 适配器产物是可选的内部训练产物,运行时不需要。
建议用途
- 助手/聊天推理
- 轻量级部署场景(桌面端和移动端,可使用量化版本)
- 基于提示词的推理任务
局限性
- 行为质量取决于提示词设计和解码配置。
- 模型仍可能产生幻觉和错误的事实性输出。
- 生产环境中需要进行安全过滤和评估。
运行时文件
config.jsongeneration_config.jsontokenizer.jsontokenizer_config.jsonspecial_tokens_map.jsonmodel.safetensors
移动端量化
关于 INT8/INT4 导出和打包,请参阅 MOBILE_Q4_PIPELINE.md。
格式说明
- 当前包含:
safetensors、ONNX(INT8、INT4)和 GGUF。 - GGUF 产物:
aicemobile/AICE_v1_rwkv4_custom.gguf(自定义 RWKV4 GGUF 布局)。
合规文档
- 欧盟 AI 法案公开训练内容摘要:
EU_TRAINING_SUMMARY.md
RthItalia/AICE-v1
作者 RthItalia
text-generation
↓ 254
♥ 0
创建时间: 2026-03-02 13:46:39+00:00
更新时间: 2026-03-02 23:15:47+00:00
在 Hugging Face 上查看文件 (18)
.gitattributes
EU_TRAINING_SUMMARY.md
HF_RELEASE_CHECKLIST.md
MOBILE_Q4_PIPELINE.md
README.md
RELEASE_MANIFEST_SHA256.txt
config.json
generation_config.json
mobile/AICE_v1_int8.onnx
ONNX
mobile/AICE_v1_int8.onnx.data
mobile/AICE_v1_q4.onnx
ONNX
mobile/AICE_v1_q4.onnx.data
mobile/AICE_v1_rwkv4_custom.gguf
model.safetensors
resoconto.txt
special_tokens_map.json
tokenizer.json
tokenizer_config.json