返回模型
说明文档
Phi 3 模型:扩展词表并针对日语进行微调
概述
本项目是一个概念验证,展示了如何扩展 Phi 3 模型的基础词表,然后应用监督微调来教它一门新语言(日语)。尽管使用了非常小的自定义数据集,但在日语理解方面的提升是显著的。
模型详情
- 基础模型:Phi 3
- 目标:扩展基础词表并针对日语理解进行微调。
- 数据集:使用 ChatGPT-4 生成的 1,000 条自定义数据。
- 语言:日语
数据集
本项目使用的数据集是在 ChatGPT-4 的辅助下生成的。它包含 1,000 条数据,经过精心筛选,涵盖了广泛的主题和语言结构。
训练
词表扩展
Phi 3 模型的基础词表被扩展以包含新的日语 token。这是使模型能够更有效地理解和生成日语文本的关键步骤。
微调
使用自定义数据集对扩展后的模型进行了监督微调。尽管数据集规模较小,但模型在理解和生成日语文本方面表现出了显著的提升。
结果
即使数据集和词表规模有限,经过微调的模型在日语理解和生成方面仍比基础模型有显著改进。
未来工作
- 数据集扩展:增加数据集的规模和多样性,以进一步提升模型性能。
- 评估:针对标准日语任务进行全面的评估和基准测试。
- 优化:优化模型以获得更好的性能和效率。
Frinkles/JapaneseModelV1-ONNX
作者 Frinkles
text-generation
transformers
↓ 0
♥ 1
创建时间: 2024-07-17 10:12:45+00:00
更新时间: 2024-07-17 17:33:29+00:00
在 Hugging Face 上查看文件 (10)
.gitattributes
README.md
added_tokens.json
genai_config.json
model.onnx
ONNX
model.onnx.data
special_tokens_map.json
tokenizer.json
tokenizer.model
tokenizer_config.json