LR scheduler called before optimizer step when using DDP sharded plugin

I am using a learning rate scheduler called every step:

```python

    def configure_optimizers(self):
        optimizer = Adam(...)
        scheduler = LambdaLR(optimizer, ...)
        return {
            "optimizer": optimizer,
            "lr_scheduler": {"scheduler": scheduler, "interval": "step"},
        }
```

When using DDPPlugin, there is no issue, but when using DDPShardedPlugin, I get the following warning:

```
lib/python3.8/site-packages/torch/optim/lr_scheduler.py:129: UserWarning: Detected call of `lr_scheduler.step()` before `optimizer.step()`. In PyTorch 1.1.0 and later, you should call them in the opposite order: `optimizer.step()` before `lr_scheduler.step()`.  Failure to do this will result in PyTorch skipping the first value of the learning rate schedule. See more details at https://pytorch.org/docs/stable/optim.html#how-to-adjust-learning-rate
  warnings.warn("Detected call of `lr_scheduler.step()` before `optimizer.step()`. "
```

pytorch 1.8.1
lighting 1.2.9

cc @tchaton @rohitgr7 @akihironitta @SeanNaren @awaelchli

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

LR scheduler called before optimizer step when using DDP sharded plugin #7217

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

LR scheduler called before optimizer step when using DDP sharded plugin #7217

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions