TensorFusion Docs

训练任务

提交和管理 SFT 微调与 GRPO 强化学习训练任务。

训练任务

训练任务模块提供模型微调和强化学习任务的提交、监控和管理能力。

任务类型

Tensor OS 支持两种训练任务类型:

SFT 微调

Supervised Fine-Tuning(有监督微调),使用标注数据对预训练模型进行领域适配。适用于:

  • 将通用大模型适配到特定业务领域
  • 指令跟随能力增强
  • 风格和格式控制

GRPO 强化学习

Group Relative Policy Optimization(分组相对策略优化),通过奖励信号进一步优化模型行为。适用于:

  • 对齐人类偏好
  • 提升推理和规划能力
  • 安全性和合规性约束

创建训练任务

创建新任务时需要指定:

  • 任务名称: 训练任务的标识
  • 项目 ID: 所属项目
  • 任务类型: SFT 微调或 GRPO 强化学习
  • 基础模型版本: 用于微调的基础模型版本 ID(可选)
  • 数据集版本: 训练使用的数据集版本 ID(可选)

任务状态

训练任务有以下状态流转:

状态说明
草稿任务已创建但未提交
排队中任务已提交,等待资源分配
运行中任务正在执行训练
已完成训练成功完成
失败训练执行失败
已取消任务被手动取消

任务管理

训练任务列表支持:

  • 按名称和类型搜索
  • 创建新任务
  • 编辑任务名称和状态
  • 删除任务

任务详情页(指标可视化、日志查看、TensorBoard 内嵌展示)即将推出。训练过程中的指标将通过 GreptimeDB 存储,并支持 TensorBoard 反向代理展示。

目录