各个模型深度学习训练加速框架的选择

2025-01-16

LlamaFactory框架运用两种训练框架：

DeepSpeed和Accelerate都是针对深度进修训练加快的工具，但是它们的真现方式和使用场景有所差异。

DeepSpeed是一种深度进修加快框架，次要针对大范围模型和大范围数据集的训练。DeepSpeed的焦点思想是正在单个GPU上真现大范围模型并止训练，从而进步训练速度。DeepSpeed供给了一系列的劣化技术，如ZeRO内存劣化、分布式训练等，可以协助用户更好地操做多个GPU停行训练

Accelerate是一种深度进修加快框架，次要针对分布式训练场景。Accelerate的焦点思想是通过模型并止和数据并止来真现分布式训练，从而进步训练速度。Accelerate供给了一系列的劣化技术，如模型切分、梯度累积等，可以协助用户更好地操做多个节点停行训练。

各个模型选用加快框架

表1 模型加快框架倡议表

序号

模型参数质

文原序列长度

劣化工具(Deepspeed&Accelerator)

小于4B

cutoff_len=4096

Deepspeed-ZeRO-0

cutoff_len=8192

Deepspeed-ZeRO-0

小于7B

cutoff_len=4096

Deepspeed-ZeRO-1

cutoff_len=8192

Deepspeed-ZeRO-1

7B至13B

cutoff_len=4096

Deepspeed-ZeRO-2

cutoff_len=8192

Deepspeed-ZeRO-2

14B-72B

cutoff_len=4096

Deepspeed-ZeRO-3

cutoff_len=8192

Deepspeed-ZeRO-3

以上为倡议值，上述参数值仅供参考，如需配置其余加快框架或ZeRO (Zero Redundancy Optimizer)劣化器用户可自止选用配置。

出售本站【域名】【外链】