pytorch
diff --git a/‎torchvision/csrc/DeformConv.h‎
Lines changed: 25 additions & 11 deletions b/‎torchvision/csrc/DeformConv.h‎
Lines changed: 25 additions & 11 deletions
diff --git a/‎torchvision/csrc/cpu/DeformConv_cpu.cpp‎
Lines changed: 19 additions & 17 deletions b/‎torchvision/csrc/cpu/DeformConv_cpu.cpp‎
Lines changed: 19 additions & 17 deletions
diff --git a/‎torchvision/csrc/cpu/vision_cpu.h‎
Lines changed: 4 additions & 2 deletions b/‎torchvision/csrc/cpu/vision_cpu.h‎
Lines changed: 4 additions & 2 deletions
@@ -19,7 +19,8 @@ at::Tensor DeformConv2d_forward(
     const std::pair<int, int>& padding,
     const std::pair<int, int>& dilation,
     const int groups,
-    const int offset_groups) {
+    const int offset_groups,
+    const bool use_mask) {
   if (input.is_cuda()) {
 #if defined(WITH_CUDA) || defined(WITH_HIP)
     return DeformConv2d_forward_cuda(
@@ -32,7 +33,8 @@ at::Tensor DeformConv2d_forward(
         padding,
         dilation,
         groups,
-        offset_groups);
+        offset_groups,
+        use_mask);
 #else
     AT_ERROR("Not compiled with GPU support");
 #endif
@@ -47,7 +49,8 @@ at::Tensor DeformConv2d_forward(
       padding,
       dilation,
       groups,
-      offset_groups);
+      offset_groups,
+      use_mask);
 }
 
 std::tuple<at::Tensor, at::Tensor, at::Tensor, at::Tensor, at::Tensor>
@@ -62,7 +65,8 @@ DeformConv2d_backward(
     const std::pair<int, int>& padding,
     const std::pair<int, int>& dilation,
     const int groups,
-    const int offset_groups) {
+    const int offset_groups,
+    const bool use_mask) {
   if (grad.is_cuda()) {
 #if defined(WITH_CUDA) || defined(WITH_HIP)
     return DeformConv2d_backward_cuda(
@@ -76,7 +80,8 @@ DeformConv2d_backward(
         padding,
         dilation,
         groups,
-        offset_groups);
+        offset_groups,
+        use_mask);
 #else
     AT_ERROR("Not compiled with GPU support");
 #endif
@@ -92,7 +97,8 @@ DeformConv2d_backward(
       padding,
       dilation,
       groups,
-      offset_groups);
+      offset_groups,
+      use_mask);
 }
 
 class DeformConv2dFunction
@@ -112,7 +118,8 @@ class DeformConv2dFunction
       int64_t dilation_h,
       int64_t dilation_w,
       int64_t groups,
-      int64_t offset_groups) {
+      int64_t offset_groups,
+      bool use_mask) {
     auto output = DeformConv2d_forward(
         input,
         weight,
@@ -123,7 +130,8 @@ class DeformConv2dFunction
         {pad_h, pad_w},
         {dilation_h, dilation_w},
         groups,
-        offset_groups);
+        offset_groups,
+        use_mask);
 
     ctx->save_for_backward({input, weight, offset, mask, bias});
     ctx->saved_data["stride_h"] = stride_h;
@@ -134,6 +142,7 @@ class DeformConv2dFunction
     ctx->saved_data["dilation_w"] = dilation_w;
     ctx->saved_data["groups"] = groups;
     ctx->saved_data["offset_groups"] = offset_groups;
+    ctx->saved_data["use_mask"] = use_mask;
 
     return {
         output,
@@ -158,6 +167,7 @@ class DeformConv2dFunction
     auto dilation_w = ctx->saved_data["dilation_w"].toInt();
     auto groups = ctx->saved_data["groups"].toInt();
     auto offset_groups = ctx->saved_data["offset_groups"].toInt();
+    auto use_mask = ctx->saved_data["use_mask"].toBool();
 
     auto grads = DeformConv2d_backward(
         grad_output[0],
@@ -170,7 +180,8 @@ class DeformConv2dFunction
         {pad_h, pad_w},
         {dilation_h, dilation_w},
         groups,
-        offset_groups);
+        offset_groups,
+        use_mask);
     auto grad_input = std::get<0>(grads);
     auto grad_weight = std::get<1>(grads);
     auto grad_offset = std::get<2>(grads);
@@ -191,6 +202,7 @@ class DeformConv2dFunction
         torch::autograd::Variable(),
         torch::autograd::Variable(),
         torch::autograd::Variable(),
+        torch::autograd::Variable(),
     };
   }
 };
@@ -208,7 +220,8 @@ at::Tensor deform_conv2d(
     int64_t dilation_h,
     int64_t dilation_w,
     int64_t groups,
-    int64_t offset_groups) {
+    int64_t offset_groups,
+    bool use_mask) {
   auto result = DeformConv2dFunction::apply(
       input,
       weight,
@@ -222,6 +235,7 @@ at::Tensor deform_conv2d(
       dilation_h,
       dilation_w,
       groups,
-      offset_groups);
+      offset_groups,
+      use_mask);
   return result[0];
 }
@@ -211,8 +211,8 @@ static void deformable_im2col(
     int out_w,
     int parallel_imgs,
     int deformable_group,
+    bool use_mask,
     at::Tensor data_col) {
-  bool use_mask = data_mask.numel() != 0;
   int num_kernels = n_in_channels * out_h * out_w * parallel_imgs;
 
   AT_DISPATCH_FLOATING_TYPES_AND_HALF(
@@ -261,14 +261,13 @@ at::Tensor DeformConv2d_forward_cpu(
     std::pair<int, int> pad,
     std::pair<int, int> dilation,
     int n_weight_grps,
-    int n_offset_grps) {
+    int n_offset_grps,
+    bool use_mask) {
   at::Tensor input = input_param;
   at::Tensor offset = offset_param;
   at::Tensor mask = mask_param;
   at::Tensor weight = weight_param;
 
-  bool use_mask = mask.numel() != 0;
-
   TORCH_CHECK(input.ndimension() == 4);
   TORCH_CHECK(offset.ndimension() == 4);
   TORCH_CHECK(!use_mask || mask.ndimension() == 4);
@@ -442,6 +441,7 @@ at::Tensor DeformConv2d_forward_cpu(
         out_w,
         n_parallel_imgs,
         n_offset_grps,
+        use_mask,
         columns);
 
     columns = columns.view(
@@ -561,9 +561,8 @@ static void compute_grad_input(
     const int dilation_w,
     const int parallel_imgs,
     const int n_offset_grps,
+    const bool use_mask,
     at::Tensor grad_im) {
-  bool use_mask = mask.numel() != 0;
-
   int out_h =
       (height + 2 * pad_h - (dilation_h * (weight_h - 1) + 1)) / stride_h + 1;
   int out_w =
@@ -762,10 +761,9 @@ static void compute_grad_offset_and_mask(
     const int dilation_w,
     const int parallel_imgs,
     const int n_offset_grps,
+    const bool use_mask,
     at::Tensor grad_offset,
     at::Tensor grad_mask) {
-  bool use_mask = mask.numel() != 0;
-
   int out_h =
       (height + 2 * pad_h - (dilation_h * (weight_h - 1) + 1)) / stride_h + 1;
   int out_w =
@@ -815,9 +813,8 @@ deform_conv2d_backward_input_cpu(
     std::pair<int, int> dilation,
     int n_weight_grps,
     int n_offset_grps,
-    int n_parallel_imgs) {
-  bool use_mask = mask.numel() != 0;
-
+    int n_parallel_imgs,
+    bool use_mask) {
   int batch_sz = input.size(0);
   int n_in_channels = input.size(1);
   int in_h = input.size(2);
@@ -927,6 +924,7 @@ deform_conv2d_backward_input_cpu(
         dil_w,
         n_parallel_imgs,
         n_offset_grps,
+        use_mask,
         grad_offset[elt],
         grad_mask[elt]);
 
@@ -947,6 +945,7 @@ deform_conv2d_backward_input_cpu(
         dil_w,
         n_parallel_imgs,
         n_offset_grps,
+        use_mask,
         grad_input[elt]);
   }
 
@@ -973,9 +972,8 @@ static at::Tensor deform_conv2d_backward_parameters_cpu(
     std::pair<int, int> dilation,
     int n_weight_grps,
     int n_offset_grps,
-    int n_parallel_imgs) {
-  bool use_mask = mask.numel() != 0;
-
+    int n_parallel_imgs,
+    bool use_mask) {
   int batch_sz = input.size(0);
   int n_in_channels = input.size(1);
   int in_h = input.size(2);
@@ -1063,6 +1061,7 @@ static at::Tensor deform_conv2d_backward_parameters_cpu(
         out_w,
         n_parallel_imgs,
         n_offset_grps,
+        use_mask,
         columns);
 
     for (int g = 0; g < n_weight_grps; g++) {
@@ -1094,7 +1093,8 @@ DeformConv2d_backward_cpu(
     std::pair<int, int> pad,
     std::pair<int, int> dilation,
     int n_weight_grps,
-    int n_offset_grps) {
+    int n_offset_grps,
+    bool use_mask) {
   const int batch_sz = input.size(0);
   const int n_parallel_imgs =
       get_greatest_divisor_below_bound(batch_sz, kMaxParallelImgs);
@@ -1110,7 +1110,8 @@ DeformConv2d_backward_cpu(
       dilation,
       n_weight_grps,
       n_offset_grps,
-      n_parallel_imgs);
+      n_parallel_imgs,
+      use_mask);
 
   auto grad_input = std::get<0>(grad_input_and_offset_and_mask);
   auto grad_offset = std::get<1>(grad_input_and_offset_and_mask);
@@ -1127,7 +1128,8 @@ DeformConv2d_backward_cpu(
       dilation,
       n_weight_grps,
       n_offset_grps,
-      n_parallel_imgs);
+      n_parallel_imgs,
+      use_mask);
 
   auto grad_bias = at::ones_like(bias) * grad_out.sum({0, 2, 3});
 
 
@@ -107,7 +107,8 @@ VISION_API at::Tensor DeformConv2d_forward_cpu(
     std::pair<int, int> pad,
     std::pair<int, int> dilation,
     int groups,
-    int deformable_groups);
+    int deformable_groups,
+    bool use_mask);
 
 VISION_API std::
     tuple<at::Tensor, at::Tensor, at::Tensor, at::Tensor, at::Tensor>
@@ -122,4 +123,5 @@ VISION_API std::
         std::pair<int, int> pad,
         std::pair<int, int> dilation,
         int groups,
-        int deformable_groups);
+        int deformable_groups,
+        bool use_mask);