fix ipus and cli tests

four4fish · four4fish · commit c2c3ab0745e5 · 2022-02-02T17:37:14.000-08:00
diff --git a/pytorch_lightning/strategies/ipu.py b/pytorch_lightning/strategies/ipu.py
@@ -62,7 +62,7 @@ def _move_float_tensors_to_half(self, batch: Any) -> Any:
 class IPUStrategy(ParallelStrategy):
     """Plugin for training on IPU devices."""
 
-    distributed_backend = "ipu"
+    distributed_backend = "ipu_strategy"
 
     def __init__(
         self,
diff --git a/pytorch_lightning/trainer/connectors/accelerator_connector.py b/pytorch_lightning/trainer/connectors/accelerator_connector.py
@@ -140,7 +140,6 @@ def __init__(
         # --Parsing_flags------------------------------------------------------
         # Get registered strategies, existing accelerators and precision plugins
         self._existing_strategies_str = StrategyRegistry.available_strategies()
-        # print(self._existing_strategies_str)
         self._existing_accelerator_type = ["tpu", "ipu", "gpu", "cpu"]
         self._supported_precision = PrecisionType.supported_types()
 
@@ -156,7 +155,7 @@ def __init__(
         # --Accelerator-------------------------------------------------------------
         # handle `auto` and `None`
         if self._accelerator_flag == "auto" or self._accelerator_flag is None:
-            self._choose_accelerator()
+            self._accelerator_flag = self._choose_accelerator()
         # else:
         #     # [RFC] move to XAccelerator class init?
         #     self._check_device_availibility()
@@ -388,20 +387,20 @@ def _mapping_deprecated_devices_specfic_info_to_accelerator_and_device_flag(
                 self._accelerator_flag = "cpu"
 
     def _choose_accelerator(self):
+        if _TPU_AVAILABLE:
+            return "tpu"
+        if _IPU_AVAILABLE:
+            return "ipu"
         if self._accelerator_flag == "auto":
-            if _TPU_AVAILABLE:
-                self._accelerator_flag = "tpu"
-            elif _IPU_AVAILABLE:
-                self._accelerator_flag = "ipu"
-            elif torch.cuda.is_available() and torch.cuda.device_count() > 0:
-                self._accelerator_flag = "gpu"
+            if torch.cuda.is_available() and torch.cuda.device_count() > 0:
+                return "gpu"
             else:
-                self._accelerator_flag = "cpu"
                 if self._device_flag == "auto":
                     self._device_flag = 1
+                return "cpu"
         # [RFC] this is current logic, if accelerator not set, default cpu?
         else:
-            self._accelerator_flag = "cpu"
+            return "cpu"
 
     # TODO move this to xAccelerator
     # def _check_device_availibility(self):
@@ -485,8 +484,8 @@ def _is_slurm_managing_tasks(self):
         return num_slurm_tasks == total_requested_devices
 
     def _choose_strategy(self):
-        if self._accelerator_flag == "ipu":
-            self._strategy_flag = "ipu"
+        if self._accelerator_flag == "ipu_strategy":
+            self._strategy_flag = "ipu_strategy"
         elif self._accelerator_flag == "tpu":
             if self._parallel_devices and len(self._parallel_devices) > 1:
                 self._strategy_flag = "tpu_spawn"
@@ -755,29 +754,31 @@ def devices(self):
             return 1
         elif isinstance(self.strategy, ParallelStrategy):
             return len(self.strategy.parallel_devices)
-        else:
-            return 0
+        return 0
 
     @property
     def tpu_cores(self) -> int:
         if isinstance(self.accelerator, TPUAccelerator):
             return self.devices
-        else:
-            return 0
+        return 0
+
+    @property
+    def tpu_id(self) -> Optional[int]:
+        if isinstance(self.accelerator, TPUAccelerator):
+            return self.parallel_devices[0]
+        return None
 
     @property
     def num_ipus(self) -> int:
         if isinstance(self.accelerator, IPUAccelerator):
             return self.devices
-        else:
-            return 0
+        return 0
 
     @property
     def num_gpus(self) -> int:
         if isinstance(self.accelerator, GPUAccelerator):
             return self.devices
-        else:
-            return 0
+        return 0
 
     # def parallel_device_ids():
     @property
diff --git a/tests/utilities/test_cli.py b/tests/utilities/test_cli.py
@@ -577,7 +577,10 @@ def on_fit_start(self):
 @pytest.mark.parametrize(
     "trainer_kwargs",
     (
-        dict(strategy="ddp_spawn"),
+        # dict(strategy="ddp_spawn")
+        # !! old accl_conn will choose singleDeviceStrategy for both strategy=ddp/ddp_spawn
+        # this test never worked with DDPSpawnStrategy
+        dict(strategy="single_device"),
         dict(strategy="ddp"),
         pytest.param({"tpu_cores": 1}, marks=RunIf(tpu=True)),
     ),