数据格式说明
我们非常荣幸能为您详细解读我们的数据格式要求。为了让您能更轻松地准备和上传符合规格的数据,在我们的平台上训练出专属于您的大模型。
关于数据的准备技巧,您可以在:数据准备指南 中进行查看;
Instruction Data
格式说明
在上传的数据集中,必须包含三个主要部分: "Instruction"、“Input" 和 "Output"。("Input" 字段是可以为空)
- Instruction(指令):就像一份详细的菜谱或是一份复杂设备的使用说明书,它会告诉用户或模型如何处理给定的输入以达到期望的结果。通常情况下,指令会提供一些规则、限制或者示例来帮助模型正确理解并处理输入。
- Input(输入):"Input" 是指传递给模型进行处理分析的文本或数据。它可以是一个句子,一段话,甚至是长篇文章等各种形式都可以。
- Output(输出):"Output" 则是根据给定的 "Input" 所期待得到的结果。
我们和大模型交互的所有信息("Instruction"、"Input"、"Output"),都是文本格式,如果您期望大模型输出符合您需求的格式(如文本、列表、代码、Json格式等),则需要在大模型输出后,对输出内容进行转码和解析。
数据示例
instruction | input | output |
---|---|---|
下面这段文字代表着什么意思? | 包括平衡饮食以确保摄入足够的水果和蔬菜。定期锻炼以保持身体活跃和强壮。保持足够的睡眠和稳定的睡眠时间。 | 描述了三种维持健康生活方式 |
下面这段文字代表着什么意思? | 尽管世界上有许多颜色,但红、蓝、黄是基本颜色 | 基本颜色由红、蓝、黄组成 |