ONNX 模型库
返回模型

说明文档

AICE-v1 模型卡片

概述

AICE-v1 是一个基于 RWKV 架构的紧凑型对话模型,以合并权重的形式发布,用于文本生成。 AICE-v1 是一个衍生模型,从外部预训练的基础权重初始化,然后通过 LoRA 进行创新并合并以用于推理。

技术规格

  • 架构:RWKV 因果语言模型
  • 层数:24
  • 隐藏层大小:2048
  • 上下文长度:1024
  • 词表大小:50277
  • 有效规模:约 15 亿参数
  • 主要格式:model.safetensors(FP16/F32 混合张量,对运行时友好)

训练策略

  • 从预训练的基础检查点权重初始化(第三方来源)。
  • 使用 LoRA 适配器进行指令微调。
  • 蒸馏监督流程源自更大的教师模型家族(700 亿参数级别)。
  • LoRA 适配器已合并为单一整合模型以用于推理。

发布意图

  • 本仓库包含用于推理的合并模型产物。
  • 适配器产物是可选的内部训练产物,运行时不需要。

建议用途

  • 助手/聊天推理
  • 轻量级部署场景(桌面端和移动端,可使用量化版本)
  • 基于提示词的推理任务

局限性

  • 行为质量取决于提示词设计和解码配置。
  • 模型仍可能产生幻觉和错误的事实性输出。
  • 生产环境中需要进行安全过滤和评估。

运行时文件

  • config.json
  • generation_config.json
  • tokenizer.json
  • tokenizer_config.json
  • special_tokens_map.json
  • model.safetensors

移动端量化

关于 INT8/INT4 导出和打包,请参阅 MOBILE_Q4_PIPELINE.md

格式说明

  • 当前包含:safetensors、ONNX(INT8INT4)和 GGUF。
  • GGUF 产物:aicemobile/AICE_v1_rwkv4_custom.gguf(自定义 RWKV4 GGUF 布局)。

合规文档

  • 欧盟 AI 法案公开训练内容摘要:EU_TRAINING_SUMMARY.md

RthItalia/AICE-v1

作者 RthItalia

text-generation
↓ 254 ♥ 0

创建时间: 2026-03-02 13:46:39+00:00

更新时间: 2026-03-02 23:15:47+00:00

在 Hugging Face 上查看

文件 (18)

.gitattributes
EU_TRAINING_SUMMARY.md
HF_RELEASE_CHECKLIST.md
MOBILE_Q4_PIPELINE.md
README.md
RELEASE_MANIFEST_SHA256.txt
config.json
generation_config.json
mobile/AICE_v1_int8.onnx ONNX
mobile/AICE_v1_int8.onnx.data
mobile/AICE_v1_q4.onnx ONNX
mobile/AICE_v1_q4.onnx.data
mobile/AICE_v1_rwkv4_custom.gguf
model.safetensors
resoconto.txt
special_tokens_map.json
tokenizer.json
tokenizer_config.json