如遇报错:
AssertionError: no_sync context manager is incompatible with gradient partitioning logic of ZeRO stage 3
ZeRO Stage 3
(DeepSpeed 的梯度优化阶段 3)中,使用了 no_sync
上下文管理器,而 no_sync
与 ZeRO Stage 3
的梯度分区逻辑不兼容。具体来说, ZeRO Stage 3
在进行梯度优化时,默认会对梯度进行分区,这与 no_sync
deepspeed 模块版本为 0.15.4
pip install deepspeed==0.15.4
没有回复内容