说明文档
模型卡片
<!-- 简要概述该模型是什么/做什么。 -->
模型详情
模型描述
<!-- 提供该模型的详细概述。 -->
这是一个已推送到 Hub 的 🤗 transformers 模型的模型卡片。此模型卡片已自动生成。
- 开发者: [需要更多信息]
- 资助方 [可选]: [需要更多信息]
- 共享者 [可选]: [需要更多信息]
- 模型类型: [需要更多信息]
- 语言 (NLP): [需要更多信息]
- 许可证: [需要更多信息]
- 微调自模型 [可选]: [需要更多信息]
模型来源 [可选]
<!-- 提供模型的基本链接。 -->
- 代码库: [需要更多信息]
- 论文 [可选]: [需要更多信息]
- 演示 [可选]: [需要更多信息]
用途
<!-- 说明该模型的预期使用方式,包括模型的可预见用户以及受模型影响的人群。 -->
直接使用
<!-- 本节适用于未经微调或未集成到更大生态系统/应用中的模型使用。 -->
[需要更多信息]
下游使用 [可选]
<!-- 本节适用于经过任务微调或集成到更大生态系统/应用中的模型使用 -->
[需要更多信息]
超出范围的使用
<!-- 本节涉及误用、恶意使用以及模型不擅长处理的使用场景。 -->
[需要更多信息]
偏见、风险和局限性
<!-- 本节旨在传达技术和社技术方面的局限性。 -->
[需要更多信息]
建议
<!-- 本节旨在就偏见、风险和技术局限性方面提供建议。 -->
用户(无论是直接使用还是下游使用)应当了解模型的风险、偏见和局限性。需要更多信息以提供进一步建议。
如何开始使用该模型
使用以下代码开始使用该模型。
[需要更多信息]
训练详情
训练数据
<!-- 这里应链接到数据集卡片,可能还需要简要介绍训练数据的内容,以及与数据预处理或额外过滤相关的文档。 -->
[需要更多信息]
训练流程
<!-- 这与技术规格密切相关。当与技术规格相关时,此处内容应链接到该部分。 -->
预处理 [可选]
[需要更多信息]
训练超参数
- 训练机制: [需要更多信息] <!--fp32, fp16 混合精度, bf16 混合精度, bf16 非混合精度, fp16 非混合精度, fp8 混合精度 -->
速度、大小、时间 [可选]
<!-- 本节提供有关吞吐量、开始/结束时间、检查点大小(如相关)等信息。 -->
[需要更多信息]
评估
<!-- 本节描述评估协议并提供结果。 -->
测试数据、因素和指标
测试数据
<!-- 如可能,这里应链接到数据集卡片。 -->
[需要更多信息]
因素
<!-- 这些是评估所分解的维度,例如子群体或领域。 -->
[需要更多信息]
指标
<!-- 这些是所使用的评估指标,最好附上选择原因的说明。 -->
[需要更多信息]
结果
[需要更多信息]
总结
模型审查 [可选]
<!-- 此处放置与模型相关的可解释性工作 -->
[需要更多信息]
环境影响
<!-- 总排放量(以 CO2eq 克为单位)和其他考虑因素(如电力使用)放在这里。请相应编辑以下建议文本 -->
碳排放可以使用 Lacoste et al. (2019) 中提出的 机器学习影响计算器 进行估算。
- 硬件类型: [需要更多信息]
- 使用时长: [需要更多信息]
- 云服务商: [需要更多信息]
- 计算区域: [需要更多信息]
- 碳排放量: [需要更多信息]
技术规格 [可选]
模型架构和目标
[需要更多信息]
计算基础设施
[需要更多信息]
硬件
[需要更多信息]
软件
[需要更多信息]
引用 [可选]
<!-- 如果有介绍该模型的论文或博客文章,APA 和 Bibtex 信息应放在本节中。 -->
BibTeX:
[需要更多信息]
APA:
[需要更多信息]
术语表 [可选]
<!-- 如相关,请在此节中包含可帮助读者理解模型或模型卡片的术语和计算方法。 -->
[需要更多信息]
更多信息 [可选]
[需要更多信息]
模型卡片作者 [可选]
[需要更多信息]
模型卡片联系方式
[需要更多信息]
sauravpanda/smollm2-135m-qna
作者 sauravpanda
创建时间: 2025-01-07 08:39:36+00:00
更新时间: 2025-01-08 08:43:08+00:00
在 Hugging Face 上查看