如遇报错:
AssertionError: no_sync context manager is incompatible with gradient partitioning logic of ZeRO stage 3
ZeRO Stage 3(DeepSpeed 的梯度优化阶段 3)中,使用了 no_sync 上下文管理器,而 no_sync 与 ZeRO Stage 3 的梯度分区逻辑不兼容。具体来说, ZeRO Stage 3 在进行梯度优化时,默认会对梯度进行分区,这与 no_sync
deepspeed 模块版本为 0.15.4
pip install deepspeed==0.15.4




没有回复内容