remove redundant accumulation normalization in manual optimization (#9769)

awaelchli · web-flow · commit 6a0c47a01482 · 2021-10-11T15:26:12.000Z
diff --git a/pytorch_lightning/loops/optimization/manual_loop.py b/pytorch_lightning/loops/optimization/manual_loop.py
@@ -40,9 +40,7 @@ def __post_init__(self) -> None:
         self.extra = self._check_extra_detach_deprecation(self.extra)
 
     @classmethod
-    def from_training_step_output(
-        cls, training_step_output: Optional[STEP_OUTPUT], normalize: int = 1
-    ) -> "ManualResult":
+    def from_training_step_output(cls, training_step_output: Optional[STEP_OUTPUT]) -> "ManualResult":
         extra = {}
         if isinstance(training_step_output, dict):
             extra = {k: v for k, v in training_step_output.items() if k != "hiddens"}
@@ -55,9 +53,8 @@ def from_training_step_output(
             )
 
         if "loss" in extra:
-            # accumulate the loss. If `accumulate_grad_batches == 1`, no effect.
             # we detach manually as it's expected that it will have a `grad_fn`
-            extra["loss"] = extra["loss"].detach().div(normalize)
+            extra["loss"] = extra["loss"].detach()
 
         return cls(extra=extra)
 
@@ -118,7 +115,7 @@ def advance(self, batch: Any, batch_idx: int) -> None:  # type: ignore[override]
 
             self._hiddens = _extract_hiddens(training_step_output, lightning_module.truncated_bptt_steps)
 
-            result = ManualResult.from_training_step_output(training_step_output, self.trainer.accumulate_grad_batches)
+            result = ManualResult.from_training_step_output(training_step_output)
 
             if self.trainer.move_metrics_to_cpu:
                 # hiddens and the training step output are not moved as they are not considered "metrics"
diff --git a/tests/loops/optimization/test_manual_loop.py b/tests/loops/optimization/test_manual_loop.py
@@ -22,10 +22,10 @@
 
 def test_manual_result():
     training_step_output = {"loss": torch.tensor(25.0, requires_grad=True), "something": "jiraffe"}
-    result = ManualResult.from_training_step_output(training_step_output, normalize=5)
+    result = ManualResult.from_training_step_output(training_step_output)
     asdict = result.asdict()
     assert not asdict["loss"].requires_grad
-    assert asdict["loss"] == 5
+    assert asdict["loss"] == 25
     assert result.extra == asdict