ONNX 模型库

说明文档

AICE-v1 模型卡片

概述

AICE-v1 是一个基于 RWKV 架构的紧凑型对话模型，以合并权重的形式发布，用于文本生成。 AICE-v1 是一个衍生模型，从外部预训练的基础权重初始化，然后通过 LoRA 进行创新并合并以用于推理。

技术规格

架构：RWKV 因果语言模型
层数：24
隐藏层大小：2048
上下文长度：1024
词表大小：50277
有效规模：约 15 亿参数
主要格式：model.safetensors（FP16/F32 混合张量，对运行时友好）

训练策略

从预训练的基础检查点权重初始化（第三方来源）。
使用 LoRA 适配器进行指令微调。
蒸馏监督流程源自更大的教师模型家族（700 亿参数级别）。
LoRA 适配器已合并为单一整合模型以用于推理。

发布意图

本仓库包含用于推理的合并模型产物。
适配器产物是可选的内部训练产物，运行时不需要。

建议用途

助手/聊天推理
轻量级部署场景（桌面端和移动端，可使用量化版本）
基于提示词的推理任务

局限性

行为质量取决于提示词设计和解码配置。
模型仍可能产生幻觉和错误的事实性输出。
生产环境中需要进行安全过滤和评估。

运行时文件

config.json
generation_config.json
tokenizer.json
tokenizer_config.json
special_tokens_map.json
model.safetensors

移动端量化

关于 INT8/INT4 导出和打包，请参阅 MOBILE_Q4_PIPELINE.md。

格式说明

当前包含：safetensors、ONNX（INT8、INT4）和 GGUF。
GGUF 产物：aicemobile/AICE_v1_rwkv4_custom.gguf（自定义 RWKV4 GGUF 布局）。

合规文档

欧盟 AI 法案公开训练内容摘要：EU_TRAINING_SUMMARY.md

RthItalia/AICE-v1

作者 RthItalia

text-generation

↓ 254 ♥ 0

创建时间: 2026-03-02 13:46:39+00:00

更新时间: 2026-03-02 23:15:47+00:00

在 Hugging Face 上查看

文件 (18)

.gitattributes

EU_TRAINING_SUMMARY.md

HF_RELEASE_CHECKLIST.md

MOBILE_Q4_PIPELINE.md

README.md

RELEASE_MANIFEST_SHA256.txt

config.json

generation_config.json

mobile/AICE_v1_int8.onnx ONNX

mobile/AICE_v1_int8.onnx.data

mobile/AICE_v1_q4.onnx ONNX

mobile/AICE_v1_q4.onnx.data

mobile/AICE_v1_rwkv4_custom.gguf

model.safetensors

resoconto.txt

special_tokens_map.json

tokenizer.json

tokenizer_config.json