说明文档
Granite-3.3-8B-Instruct
模型概述:
Granite-3.3-8B-Instruct 是一个拥有 80 亿参数、128K 上下文长度的语言模型,经过微调以提升推理和指令遵循能力。该模型基于 Granite-3.3-8B-Base 构建,在衡量通用性能的基准测试(包括 AlpacaEval-2.0 和 Arena-Hard)上取得了显著提升,并在数学、编程和指令遵循方面也有所改进。它通过 <think ></think > 和 <response></response> 标签支持结构化推理,在内部思考与最终输出之间提供清晰的分离。该模型在经过精心平衡的宽松许可数据与精选合成任务组合上进行了训练。
- 开发者: Granite 团队,IBM
- 网站: Granite 文档
- 发布日期: 2025年4月16日
- 许可证: Apache 2.0
支持的语言: 英语、德语、西班牙语、法语、日语、葡萄牙语、阿拉伯语、捷克语、意大利语、韩语、荷兰语和中文。然而,用户可以针对这 12 种语言以外的语言对此 Granite 模型进行微调。
预期用途: 该模型旨在处理通用指令遵循任务,并可集成到各种领域的 AI 助手中,包括商业应用。
能力
- 思考(Thinking)
- 摘要
- 文本分类
- 文本提取
- 问答
- 检索增强生成(RAG)
- 代码相关任务
- 函数调用任务
- 多语言对话用例 <!-- * Fill-in-the-middle -->
- 长上下文任务,包括长文档/会议摘要、长文档问答等
生成示例: 这是一个如何使用 Granite-3.3-8B-Instruct 模型的简单示例。
安装以下库:
pip install torch torchvision torchaudio
pip install accelerate
pip install transformers
然后,复制与您的用例相关的代码片段。
from transformers import AutoModelForCausalLM, AutoTokenizer, set_seed
import torch
model_path="ibm-granite/granite-3.3-8b-instruct"
device="cuda"
model = AutoModelForCausalLM.from_pretrained(
model_path,
device_map=device,
torch_dtype=torch.bfloat16,
)
tokenizer = AutoTokenizer.from_pretrained(
model_path
)
conv = [{"role": "user", "content":"重新设计一个常见的家居用品,使其更加可持续和用户友好。解释这些变化及其好处。"}]
input_ids = tokenizer.apply_chat_template(conv, return_tensors="pt", thinking=True, return_dict=True, add_generation_prompt=True).to(device)
set_seed(42)
output = model.generate(
**input_ids,
max_new_tokens=8192,
)
prediction = tokenizer.decode(output[0, input_ids["input_ids"].shape[1]:], skip_special_tokens=True)
print(prediction)
示例输出
- thinking=True
<0x1F>
为了回答这个提示,我将专注于重新设计一个常见的家居用品:塑料水瓶。目标是使其更加可持续和用户友好。以下是建议的更改及其好处:
1. **材料**:用可生物降解或可回收材料(如玻璃或植物基塑料 PLA)替代塑料。
2. **设计**:引入模块化设计,便于重新填充和清洁。
3. **功能性**:集成内置水过滤器以进行净化。
4. **耐用性**:通过坚固的结构增强瓶子的使用寿命。
5. **用户友好性**:简化瓶盖机制,便于开合。
这些更改将显著减少塑料废物,促进回收,确保获得清洁饮用水,并提升整体用户体验。
现在,我将以结构化格式详细说明每个更改及其好处。
</0x1F>
<response>### 塑料水瓶的可持续性和用户友好性重新设计
#### 1. 材料:可生物降解或可回收替代品
**更改**:从传统的 PET 塑料过渡到玻璃或植物基塑料(聚乳酸 - PLA)。
**好处**:
- **可持续性**:玻璃和 PLA 是可生物降解或高度可回收的,可大幅减少塑料污染。
- **健康**:与 PET 不同,这些材料不会向水中渗出化学物质,确保更安全的饮用。
#### 2. 易于重新填充和清洁的模块化设计
**更改**:在可重复使用的外壳内实施可拆卸、可更换的内胆。
**好处**:
- **用户友好性**:用户可以轻松取出内胆进行彻底清洁,降低细菌滋生的风险。
- **可持续性**:外壳保持完好,鼓励重复使用,而内胆在磨损时可以更换或回收。
#### 3. 内置水过滤器
**更改**:在瓶盖中集成一个可拆卸、可更换的水过滤器。
**好处**:
- **可及性**:直接从任何水源(自来水、河水等)提供清洁饮用水,无需额外的过滤设备。
- **健康**:去除污染物、细菌和杂质,确保安全的补水。
- **可持续性**:通过在可重复使用的容器中提供净化解决方案,减少一次性塑料水瓶的使用。
#### 4. 增强耐用性
**更改**:对外壳和内胆都使用高质量、耐用的材料和坚固的施工技术。
**好处**:
- **使用寿命**:更坚固的设计延长了瓶子的使用寿命,减少了更换频率。
- **成本效益**:虽然初始成本可能较高,但从减少更换中节省的长期成本使其具有经济性。
- **可持续性**:减少处置频率意味着更低的环境影响。
#### 5. 简化的瓶盖机制
**更改**:采用一键式、易于开合的瓶盖设计,可能受到运动水瓶盖的启发。
**好处**:
- **用户友好性**:特别有利于儿童、老年人或手部灵活性有限的人群。
- **便利性**:快速取水鼓励更频繁的补水,促进更健康的习惯。
### 结论
这款重新设计的水瓶通过最大限度地减少塑料使用和废物来解决关键的可持续性问题,同时通过改进功能性、耐用性和可及性增强用户友好性。通过集成可生物降解材料、模块化设计、内置过滤器、坚固的结构和简单的瓶盖机制,该水瓶不仅减少了环境足迹,还提供了卓越的用户体验。</response>
- thinking=False
重新设计物品:塑料瓶(例如水瓶或饮料瓶)
重新设计概念:环保、模块化和多功能可重复使用水瓶
更改:
1. 材料:用食品级、不含 BPA 且可回收的材料(如不锈钢或玻璃)替代传统塑料。这些材料耐用、无毒且使用寿命更长,可减少废物。
2. 模块化设计:引入模块化设计,允许用户根据需要定制水瓶。这可以包括可互换的瓶盖、吸嘴尺寸和携带环。用户可以根据需要购买额外的模块,通过减少为不同目的购买全新水瓶的需求,促进更可持续的方式。
3. 集成过滤器:加入内置的、可清洗和可重复使用的过滤器,可以去除杂质并改善水的味道。这消除了对一次性过滤器或瓶装水的需求,进一步减少塑料废物。
4. 智能瓶盖:开发带有内置数字显示屏和温度传感器的智能瓶盖。此功能允许用户跟踪每日饮水量、设定补水目标并监测饮料温度。智能瓶盖可以与移动应用程序同步以获得额外功能,例如提醒和进度跟踪。
5. 易于清洁的设计:确保瓶子具有宽口和光滑的内表面以便于清洁。包括用于难以触及区域的刷子,使维护变得简单并鼓励定期使用。
6. 可折叠结构:实施可折叠设计,在不使用时减少瓶子的体积,使其更加便携且便于存储。
好处:
1. 可持续性:通过使用可回收材料和减少塑料废物,这款重新设计的水瓶显著有助于更可持续的生活方式。模块化设计和可重复使用的过滤器也最大限度地减少了一次性塑料消耗。
2. 用户友好:智能瓶盖、易于清洁的设计和可折叠结构使瓶子方便且用户友好。用户可以根据需要定制水瓶,确保更好的整体体验。
3. 更健康的选择:使用食品级、不含 BPA 的材料和集成过滤器确保所饮用的饮料不含有害化学物质和杂质,促进更健康的生活方式。
4. 具有成本效益:虽然初始投资可能较高,但从减少一次性塑料瓶和一次性过滤器的购买中节省的长期成本使这款可重复使用水瓶成为具有成本效益的选择。
5. 鼓励补水:智能瓶盖的功能,如补水跟踪和温度监测,可以激励用户保持水分充足并养成更健康的习惯。
通过重新设计塑料瓶这样的常见家居用品,我们可以创造一个更可持续、用户友好和健康意识强的替代品,使个人和环境都受益。
评估结果: <table> <thead> <caption style="text-align:center"><b>不同模型在各种基准测试上的比较<sup id="fnref1"><a href="#fn1">1</a></sup>。AlpacaEval-2.0 和 Arena-Hard 的分数是在 thinking=True 下计算的</b></caption> <tr> <th style="text-align:left; background-color: #001d6c; color: white;">模型</th> <th style="text-align:center; background-color: #001d6c; color: white;">Arena-Hard</th> <th style="text-align:center; background-color: #001d6c; color: white;">AlpacaEval-2.0</th> <th style="text-align:center; background-color: #001d6c; color: white;">MMLU</th> <th style="text-align:center; background-color: #001d6c; color: white;">PopQA</th> <th style="text-align:center; background-color: #001d6c; color: white;">TruthfulQA</th> <th style="text-align:center; background-color: #001d6c; color: white;">BigBenchHard<sup id="fnref2"><a href="#fn2">2</a></sup></th> <th style="text-align:center; background-color: #001d6c; color: white;">DROP<sup id="fnref3"><a href="#fn3">3</a></sup></th> <th style="text-align:center; background-color: #001d6c; color: white;">GSM8K</th> <th style="text-align:center; background-color: #001d6c; color: white;">HumanEval</th> <th style="text-align:center; background-color: #001d6c; color: white;">HumanEval+</th> <th style="text-align:center; background-color: #001d6c; color: white;">IFEval</th> <th style="text-align:center; background-color: #001d6c; color: white;">AttaQ</th> </tr></thead> <tbody> <tr> <td style="text-align:left; background-color: #FFFFFF; color: #2D2D2D;">Granite-3.1-2B-Instruct</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">23.3</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">27.17</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">57.11</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">20.55</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">59.79</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">61.82</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">20.99</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">67.55</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">79.45</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">75.26</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">63.59</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">84.7</td> </tr> <tr> <td style="text-align:left; background-color: #FFFFFF; color: #2D2D2D;">Granite-3.2-2B-Instruct</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">24.86</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">34.51</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">57.18</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">20.56</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">59.8</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">61.39</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">23.84</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">67.02</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">80.13</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">73.39</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">61.55</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">83.23</td> </tr> <tr> <td style="text-align:left; background-color: #DAE8FF; color: black;"><b>Granite-3.3-2B-Instruct</b></td> <td style="text-align:center; background-color: #DAE8FF; color: black;"> 28.86 </td> <td style="text-align:center; background-color: #DAE8FF; color: black;"> 43.45 </td> <td style="text-align:center; background-color: #DAE8FF; color: black;"> 55.88 </td> <td style="text-align:center; background-color: #DAE8FF; color: black;"> 18.4 </td> <td style="text-align:center; background-color: #DAE8FF; color: black;"> 58.97 </td> <td style="text-align:center; background-color: #DAE8FF; color: black;"> 63.91 </td> <td style="text-align:center; background-color: #DAE8FF; color: black;"> 44.33 </td> <td style="text-align:center; background-color: #DAE8FF; color: black;"> 72.48 </td> <td style="text-align:center; background-color: #DAE8FF; color: black;"> 80.51 </td> <td style="text-align:center; background-color: #DAE8FF; color: black;"> 75.68 </td> <td style="text-align:center; background-color: #DAE8FF; color: black;"> 65.8 </td> <td style="text-align:center; background-color: #DAE8FF; color: black;">87.47</td> </tr>
<tr> <td style="text-align:left; background-color: #FFFFFF; color: #2D2D2D;">Llama-3.1-8B-Instruct</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">36.43</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">27.22</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">69.15</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">28.79</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">52.79</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">73.43</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">71.23</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">83.24</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">85.32</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">80.15</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">79.10</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">83.43</td> </tr>
<tr> <td style="text-align:left; background-color: #FFFFFF; color: #2D2D2D;">DeepSeek-R1-Distill-Llama-8B</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">17.17</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">21.85</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">45.80</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">13.25</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">47.43</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">67.39</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">49.73</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">72.18</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">67.54</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">62.91</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">66.50</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">42.87</td> </tr>
<tr> <td style="text-align:left; background-color: #FFFFFF; color: #2D2D2D;">Qwen-2.5-7B-Instruct</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">25.44</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">30.34</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">74.30</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">18.12</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">63.06</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">69.19</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">64.06</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">84.46</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">93.35</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">89.91</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">74.90</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">81.90</td> </tr>
<tr> <td style="text-align:left; background-color: #FFFFFF; color: #2D2D2D;">DeepSeek-R1-Distill-Qwen-7B</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">10.36</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">15.35</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">50.72</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">9.94</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">47.14</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">67.38</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">51.78</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">78.47</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">79.89</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">78.43</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">59.10</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">42.45</td> </tr> <tr> <td style="text-align:left; background-color: #FFFFFF; color: #2D2D2D;">Granite-3.1-8B-Instruct</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">37.58</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">30.34</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">66.77</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">28.7</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">65.84</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">69.87</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">58.57</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">79.15</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">89.63</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">85.79</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">73.20</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">85.73</td> </tr>
<tr>
<td style="text-align:left; background-color: #FFFFFF; color: #2D2D2D;">Granite-3.2-8B-Instruct</td>
<td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">55.25</td>
<td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">61.19</td>
<td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">66.79</td>
<td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">28.04</td>
<td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">66.92</td>
<td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">71.86</td>
<td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">58.29</td>
<td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">81.65</td>
<td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">89.35</td>
<td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">85.72</td>
<td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">74.31</td>
<td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;">84.7</td>
</tr>
<tr>
<td style="text-align:left; background-color: #DAE8FF; color: black;"><b>Granite-3.3-8B-Instruct</b></td>
<td style="text-align:center; background-color: #DAE8FF; color: black;"> 57.56 </td>
<td style="text-align:center; background-color: #DAE8FF; color: black;"> 62.68 </td>
<td style="text-align:center; background-color: #DAE8FF; color: black;"> 65.54 </td>
<td style="text-align:center; background-color: #DAE8FF; color: black;"> 26.17 </td>
<td style="text-align:center; background-color: #DAE8FF; color: black;"> 66.86 </td>
<td style="text-align:center; background-color: #DAE8FF; color: black;"> 69.13 </td>
<td style="text-align:center; background-color: #DAE8FF; color: black;"> 59.36 </td>
<td style="text-align:center; background-color: #DAE8FF; color: black;"> 80.89 </td>
<td style="text-align:center; background-color: #DAE8FF; color: black;"> 89.73 </td>
<td style="text-align:center; background-color: #DAE8FF; color: black;"> 86.09 </td>
<td style="text-align:center; background-color: #DAE8FF; color: black;"> 74.82 </td>
<td style="text-align:center; background-color: #DAE8FF; color: black;">88.5</td>
</tr>
</tbody></table>
<table> <caption style="text-align:center"><b>数学基准测试</b></caption> <thead> <tr> <th style="text-align:left; background-color: #001d6c; color: white;">模型</th> <th style="text-align:center; background-color: #001d6c; color: white;">AIME24</th> <th style="text-align:center; background-color: #001d6c; color: white;">MATH-500</th> </tr></thead> <tbody> <tr> <td style="text-align:left; background-color: #FFFFFF; color: #2D2D2D;">Granite-3.1-2B-Instruct</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;"> 0.89 </td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;"> 35.07 </td> </tr> <tr> <td style="text-align:left; background-color: #FFFFFF; color: #2D2D2D;">Granite-3.2-2B-Instruct</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;"> 0.89 </td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;"> 35.54 </td> </tr> <tr> <td style="text-align:left; background-color: #DAE8FF; color: black;"><b>Granite-3.3-2B-Instruct</b></td> <td style="text-align:center; background-color: #DAE8FF; color: black;"> 3.28 </td> <td style="text-align:center; background-color: #DAE8FF; color: black;"> 58.09 </td> </tr> <tr> <td style="text-align:left; background-color: #FFFFFF; color: #2D2D2D;">Granite-3.1-8B-Instruct</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;"> 1.97 </td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;"> 48.73 </td> </tr> <tr> <td style="text-align:left; background-color: #FFFFFF; color: #2D2D2D;">Granite-3.2-8B-Instruct</td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;"> 2.43 </td> <td style="text-align:center; background-color: #FFFFFF; color: #2D2D2D;"> 52.8 </td> </tr> <tr> <td style="text-align:left; background-color: #DAE8FF; color: black;"><b>Granite-3.3-8B-Instruct</b></td> <td style="text-align:center; background-color: #DAE8FF; color: black;"> 8.12 </td> <td style="text-align:center; background-color: #DAE8FF; color: black;"> 69.02 </td> </tr> </tbody></table>
训练数据: 总体而言,我们的训练数据主要由两个关键来源组成:(1)具有宽松许可的公开可用数据集,(2)旨在增强推理能力的内部合成生成数据。 <!-- 详细的数据集归属可在 Granite 3.2 技术报告(即将发布) 和 accompanying 作者列表 中找到。 -->
基础设施: 我们使用 IBM 的超级计算集群 Blue Vela 训练 Granite-3.3-8B-Instruct,该集群配备了 NVIDIA H100 GPU。该集群为在数千个 GPU 上训练我们的模型提供了可扩展且高效的基础设施。
伦理考量和局限性: Granite-3.3-8B-Instruct 基于 Granite-3.3-8B-Base 构建,利用宽松许可的开源数据和精选专有数据来增强性能。由于它继承了先前模型的基础,因此适用于 Granite-3.3-8B-Base 的所有伦理考量和局限性仍然相关。
资源
- ⭐️ 了解 Granite 的最新更新:https://www.ibm.com/granite
- 📄 通过教程、最佳实践和提示工程建议开始使用:https://www.ibm.com/granite/docs/
- 💡 了解最新的 Granite 学习资源:https://github.com/ibm-granite-community/
<p><a href="#fnref1" title="返回引用">[1]</a> 使用 <a href="https://github.com/allenai/olmes">OLMES</a> 评估(AttaQ 和 Arena-Hard 分数除外)</p> <p><a href="#fnref2" title="返回引用">[2]</a> 添加了正则表达式以更有效地提取答案。</a></p> <p><a href="#fnref3" title="返回引用">[3]</a> 修改了实现以处理<a href="https://huggingface.co/blog/open-llm-leaderboard-drop">此处</a>提到的一些问题</p> <!-- ## 引用 <!-- ## 引用
@misc{granite-models,
author = {作者 1, 作者 2, ...},
title = {},
journal = {},
volume = {},
year = {2024},
url = {https://arxiv.org/abs/0000.00000},
}
``` -->
Prince-1/Granite-3.3-8B-Instruct-Onnx
作者 Prince-1
创建时间: 2025-06-22 17:06:52+00:00
更新时间: 2025-06-22 17:08:25+00:00
在 Hugging Face 上查看