说明文档
模型卡片
<!-- 提供模型是什么/做什么的快速摘要。 -->
模型详情
模型描述
<!-- 提供模型的更详细摘要。 -->
本模型是 ModernBERT-base 的微调版本,用于文本分类自定义任务
测试结果:{test_results}
- 开发者: [需要更多信息]
- 资金支持 [可选]: [需要更多信息]
- 共享者 [可选]: [需要更多信息]
- 模型类型: [需要更多信息]
- 语言(s) (NLP): en
- 许可证: mit
- 微调自模型 [可选]: [需要更多信息]
模型来源 [可选]
<!-- 提供模型的基本链接。 -->
- 代码库: [需要更多信息]
- 论文 [可选]: [需要更多信息]
- 演示 [可选]: [需要更多信息]
用途
<!-- 说明模型的预期使用方式,包括模型的可预见用户和受模型影响的人群。 -->
直接使用
<!-- 本节适用于未经微调或未插入更大生态系统/应用程序的模型使用。 -->
[需要更多信息]
下游使用 [可选]
<!-- 本节适用于经过微调后用于特定任务,或插入更大生态系统/应用程序的模型使用 -->
[需要更多信息]
超出范围的使用
<!-- 本节说明误用、恶意使用以及模型不适合的使用场景。 -->
[需要更多信息]
偏见、风险和局限性
<!-- 本节旨在传达技术和社会技术方面的局限性。 -->
[需要更多信息]
建议
<!-- 本节旨在传达关于偏见、风险和技术局限性的建议。 -->
用户(包括直接用户和下游用户)应当了解模型的风险、偏见和局限性。需要更多信息以提供进一步建议。
如何开始使用该模型
使用以下代码开始使用该模型。
[需要更多信息]
训练详情
训练数据
<!-- 这里应该链接到数据集卡片,可能还需要简要介绍训练数据的内容,以及与数据预处理或额外过滤相关的文档。 -->
在自定义数据集上训练
训练过程
<!-- 这与技术规格密切相关。当与训练过程相关时,此处的应链接到该部分。 -->
预处理 [可选]
[需要更多信息]
训练超参数
- 训练方式: [需要更多信息] <!--fp32, fp16 mixed precision, bf16 mixed precision, bf16 non-mixed precision, fp16 non-mixed precision, fp8 mixed precision -->
速度、大小、时间 [可选]
<!-- 本节提供关于吞吐量、开始/结束时间、检查点大小(如相关)等信息。 -->
[需要更多信息]
评估
<!-- 本节描述评估协议并提供结果。 -->
测试数据、因素和指标
测试数据
<!-- 如果可能,这里应该链接到数据集卡片。 -->
[需要更多信息]
因素
<!-- 这些是评估所细分的因素,例如子群体或领域。 -->
[需要更多信息]
指标
<!-- 这些是使用的评估指标,最好说明使用原因。 -->
[需要更多信息]
结果
[需要更多信息]
总结
模型检查 [可选]
<!-- 模型的相关可解释性工作放在这里 -->
[需要更多信息]
环境影响
<!-- 总排放量(以 CO2eq 克为单位)和其他考虑因素,如电力使用,放在这里。相应地编辑下面的建议文本 -->
碳排放可以使用 Lacoste et al. (2019) 中提出的 机器学习影响计算器 进行估算。
- 硬件类型: [需要更多信息]
- 使用小时数: [需要更多信息]
- 云服务提供商: [需要更多信息]
- 计算区域: [需要更多信息]
- 碳排放量: [需要更多信息]
技术规格 [可选]
模型架构和目标
[需要更多信息]
计算基础设施
[需要更多信息]
硬件
[需要更多信息]
软件
[需要更多信息]
引用 [可选]
<!-- 如果有介绍该模型的论文或博客文章,APA 和 Bibtex 信息应放在本节。 -->
BibTeX:
[需要更多信息]
APA:
[需要更多信息]
术语表 [可选]
<!-- 如相关,在本节中包含可帮助读者理解模型或模型卡片的术语和计算方法。 -->
[需要更多信息]
更多信息 [可选]
[需要更多信息]
模型卡片作者 [可选]
[需要更多信息]
模型卡片联系方式
[需要更多信息]
Frenz/modernbert-llm-router
作者 Frenz
创建时间: 2024-12-25 22:06:34+00:00
更新时间: 2025-03-12 19:33:57+00:00
在 Hugging Face 上查看