address review comments

madhur13490 · madhur13490 · commit 35ea738df05f · 2025-07-21T21:00:16.000-07:00
diff --git a/llvm/lib/Transforms/Scalar/LoopFuse.cpp b/llvm/lib/Transforms/Scalar/LoopFuse.cpp
@@ -1176,19 +1176,18 @@ struct LoopFuser {
     return true;
   }
 
+  // This function fixes sunk PHI nodes after fusion.
   void fixPHINodes(SmallVector<Instruction *, 4> &SafeToSink,
                    const FusionCandidate &FC0,
                    const FusionCandidate &FC1) const {
     // Iterate over SafeToSink instructions and update PHI nodes
     // to take values from the latch block of FC0 if they are taking
     // from the latch block of FC1.
     for (Instruction *Inst : SafeToSink) {
-      LLVM_DEBUG(dbgs() << "UPDATING: Instruction: " << *Inst << "\n");
       // Continue if the instruction is not a PHI node.
       if (!isa<PHINode>(Inst))
         continue;
       PHINode *Phi = dyn_cast<PHINode>(Inst);
-      LLVM_DEBUG(dbgs() << "UPDATING: PHI node: " << *Phi << "\n");
       for (unsigned I = 0; I < Phi->getNumIncomingValues(); I++) {
         if (Phi->getIncomingBlock(I) != FC0.Latch)
           continue;
@@ -1248,7 +1247,6 @@ struct LoopFuser {
     }
     LLVM_DEBUG(
         dbgs() << "All preheader instructions could be sunk or hoisted!\n");
-
     return true;
   }
 
diff --git a/llvm/test/Transforms/LoopFusion/sunk-phi-nodes.ll b/llvm/test/Transforms/LoopFusion/sunk-phi-nodes.ll
@@ -1,115 +1,65 @@
 ; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --version 5
-; RUN: opt -S -passes=loop-fusion < %s 2>&1 | FileCheck %s
-define i32 @foo() {
-; CHECK-LABEL: define i32 @foo() {
-; CHECK-NEXT:  [[ENTRY:.*:]]
-; CHECK-NEXT:    [[RETVAL:%.*]] = alloca i32, align 4
-; CHECK-NEXT:    [[SUM1:%.*]] = alloca i32, align 4
-; CHECK-NEXT:    [[SUM2:%.*]] = alloca i32, align 4
-; CHECK-NEXT:    [[I:%.*]] = alloca i32, align 4
-; CHECK-NEXT:    [[I1:%.*]] = alloca i32, align 4
-; CHECK-NEXT:    store i32 0, ptr [[RETVAL]], align 4
-; CHECK-NEXT:    store i32 0, ptr [[SUM1]], align 4
-; CHECK-NEXT:    store i32 0, ptr [[SUM2]], align 4
-; CHECK-NEXT:    store i32 0, ptr [[I]], align 4
-; CHECK-NEXT:    br label %[[FOR_COND:.*]]
-; CHECK:       [[FOR_COND]]:
-; CHECK-NEXT:    [[TMP0:%.*]] = load i32, ptr [[I]], align 4
-; CHECK-NEXT:    [[CMP:%.*]] = icmp slt i32 [[TMP0]], 10
-; CHECK-NEXT:    br i1 [[CMP]], label %[[FOR_BODY:.*]], label %[[FOR_END:.*]]
+; RUN: opt -passes=loop-fusion -S < %s 2>&1 | FileCheck %s
+define dso_local i32 @check_sunk_phi_nodes() {
+; CHECK-LABEL: define dso_local i32 @check_sunk_phi_nodes() {
+; CHECK-NEXT:  [[ENTRY:.*]]:
+; CHECK-NEXT:    br label %[[FOR_BODY:.*]]
 ; CHECK:       [[FOR_BODY]]:
-; CHECK-NEXT:    [[TMP1:%.*]] = load i32, ptr [[I]], align 4
-; CHECK-NEXT:    [[TMP2:%.*]] = load i32, ptr [[SUM1]], align 4
-; CHECK-NEXT:    [[ADD:%.*]] = add nsw i32 [[TMP2]], [[TMP1]]
-; CHECK-NEXT:    store i32 [[ADD]], ptr [[SUM1]], align 4
+; CHECK-NEXT:    [[SUM1_02:%.*]] = phi i32 [ 0, %[[ENTRY]] ], [ [[ADD:%.*]], %[[FOR_INC6:.*]] ]
+; CHECK-NEXT:    [[I_01:%.*]] = phi i32 [ 0, %[[ENTRY]] ], [ [[INC:%.*]], %[[FOR_INC6]] ]
+; CHECK-NEXT:    [[I1_04:%.*]] = phi i32 [ 0, %[[ENTRY]] ], [ [[INC7:%.*]], %[[FOR_INC6]] ]
+; CHECK-NEXT:    [[SUM2_03:%.*]] = phi i32 [ 0, %[[ENTRY]] ], [ [[ADD5:%.*]], %[[FOR_INC6]] ]
+; CHECK-NEXT:    [[ADD]] = add nsw i32 [[SUM1_02]], [[I_01]]
 ; CHECK-NEXT:    br label %[[FOR_INC:.*]]
 ; CHECK:       [[FOR_INC]]:
-; CHECK-NEXT:    [[TMP3:%.*]] = load i32, ptr [[I]], align 4
-; CHECK-NEXT:    [[INC:%.*]] = add nsw i32 [[TMP3]], 1
-; CHECK-NEXT:    store i32 [[INC]], ptr [[I]], align 4
-; CHECK-NEXT:    br label %[[FOR_COND]]
-; CHECK:       [[FOR_END]]:
-; CHECK-NEXT:    store i32 0, ptr [[I1]], align 4
-; CHECK-NEXT:    br label %[[FOR_COND2:.*]]
-; CHECK:       [[FOR_COND2]]:
-; CHECK-NEXT:    [[TMP4:%.*]] = load i32, ptr [[I1]], align 4
-; CHECK-NEXT:    [[CMP3:%.*]] = icmp slt i32 [[TMP4]], 10
-; CHECK-NEXT:    br i1 [[CMP3]], label %[[FOR_BODY4:.*]], label %[[FOR_END8:.*]]
-; CHECK:       [[FOR_BODY4]]:
-; CHECK-NEXT:    [[TMP5:%.*]] = load i32, ptr [[I1]], align 4
-; CHECK-NEXT:    [[TMP6:%.*]] = load i32, ptr [[I1]], align 4
-; CHECK-NEXT:    [[MUL:%.*]] = mul nsw i32 [[TMP5]], [[TMP6]]
-; CHECK-NEXT:    [[TMP7:%.*]] = load i32, ptr [[SUM2]], align 4
-; CHECK-NEXT:    [[ADD5:%.*]] = add nsw i32 [[TMP7]], [[MUL]]
-; CHECK-NEXT:    store i32 [[ADD5]], ptr [[SUM2]], align 4
-; CHECK-NEXT:    br label %[[FOR_INC6:.*]]
+; CHECK-NEXT:    [[MUL:%.*]] = mul nsw i32 [[I1_04]], [[I1_04]]
+; CHECK-NEXT:    [[ADD5]] = add nsw i32 [[SUM2_03]], [[MUL]]
+; CHECK-NEXT:    br label %[[FOR_INC6]]
 ; CHECK:       [[FOR_INC6]]:
-; CHECK-NEXT:    [[TMP8:%.*]] = load i32, ptr [[I1]], align 4
-; CHECK-NEXT:    [[INC7:%.*]] = add nsw i32 [[TMP8]], 1
-; CHECK-NEXT:    store i32 [[INC7]], ptr [[I1]], align 4
-; CHECK-NEXT:    br label %[[FOR_COND2]]
+; CHECK-NEXT:    [[INC]] = add nsw i32 [[I_01]], 1
+; CHECK-NEXT:    [[CMP:%.*]] = icmp slt i32 [[INC]], 10
+; CHECK-NEXT:    [[INC7]] = add nsw i32 [[I1_04]], 1
+; CHECK-NEXT:    [[CMP3:%.*]] = icmp slt i32 [[INC7]], 10
+; CHECK-NEXT:    br i1 [[CMP3]], label %[[FOR_BODY]], label %[[FOR_END8:.*]]
 ; CHECK:       [[FOR_END8]]:
-; CHECK-NEXT:    [[TMP9:%.*]] = load i32, ptr [[SUM1]], align 4
-; CHECK-NEXT:    [[TMP10:%.*]] = load i32, ptr [[SUM2]], align 4
-; CHECK-NEXT:    ret i32 0
+; CHECK-NEXT:    [[SUM2_0_LCSSA:%.*]] = phi i32 [ [[ADD5]], %[[FOR_INC6]] ]
+; CHECK-NEXT:    [[SUM1_0_LCSSA:%.*]] = phi i32 [ [[ADD]], %[[FOR_INC6]] ]
+; CHECK-NEXT:    [[TMP0:%.*]] = add i32 [[SUM1_0_LCSSA]], [[SUM2_0_LCSSA]]
+; CHECK-NEXT:    ret i32 [[TMP0]]
 ;
 entry:
-  %retval = alloca i32, align 4
-  %sum1 = alloca i32, align 4
-  %sum2 = alloca i32, align 4
-  %i = alloca i32, align 4
-  %i1 = alloca i32, align 4
-  store i32 0, ptr %retval, align 4
-  store i32 0, ptr %sum1, align 4
-  store i32 0, ptr %sum2, align 4
-  store i32 0, ptr %i, align 4
-  br label %for.cond
+  br label %for.body
 
-for.cond:
-  %0 = load i32, ptr %i, align 4
-  %cmp = icmp slt i32 %0, 10
-  br i1 %cmp, label %for.body, label %for.end
-
-for.body:
-  %1 = load i32, ptr %i, align 4
-  %2 = load i32, ptr %sum1, align 4
-  %add = add nsw i32 %2, %1
-  store i32 %add, ptr %sum1, align 4
+for.body:                                         ; preds = %entry, %for.inc
+  %sum1.02 = phi i32 [ 0, %entry ], [ %add, %for.inc ]
+  %i.01 = phi i32 [ 0, %entry ], [ %inc, %for.inc ]
+  %add = add nsw i32 %sum1.02, %i.01
   br label %for.inc
 
-for.inc:
-  %3 = load i32, ptr %i, align 4
-  %inc = add nsw i32 %3, 1
-  store i32 %inc, ptr %i, align 4
-  br label %for.cond
-
-for.end:
-  store i32 0, ptr %i1, align 4
-  br label %for.cond2
+for.inc:                                          ; preds = %for.body
+  %inc = add nsw i32 %i.01, 1
+  %cmp = icmp slt i32 %inc, 10
+  br i1 %cmp, label %for.body, label %for.end
 
-for.cond2:
-  %4 = load i32, ptr %i1, align 4
-  %cmp3 = icmp slt i32 %4, 10
-  br i1 %cmp3, label %for.body4, label %for.end8
+for.end:                                          ; preds = %for.inc
+  %sum1.0.lcssa = phi i32 [ %add, %for.inc ]
+  br label %for.body4
 
-for.body4:
-  %5 = load i32, ptr %i1, align 4
-  %6 = load i32, ptr %i1, align 4
-  %mul = mul nsw i32 %5, %6
-  %7 = load i32, ptr %sum2, align 4
-  %add5 = add nsw i32 %7, %mul
-  store i32 %add5, ptr %sum2, align 4
+for.body4:                                        ; preds = %for.end, %for.inc6
+  %i1.04 = phi i32 [ 0, %for.end ], [ %inc7, %for.inc6 ]
+  %sum2.03 = phi i32 [ 0, %for.end ], [ %add5, %for.inc6 ]
+  %mul = mul nsw i32 %i1.04, %i1.04
+  %add5 = add nsw i32 %sum2.03, %mul
   br label %for.inc6
 
-for.inc6:
-  %8 = load i32, ptr %i1, align 4
-  %inc7 = add nsw i32 %8, 1
-  store i32 %inc7, ptr %i1, align 4
-  br label %for.cond2
+for.inc6:                                         ; preds = %for.body4
+  %inc7 = add nsw i32 %i1.04, 1
+  %cmp3 = icmp slt i32 %inc7, 10
+  br i1 %cmp3, label %for.body4, label %for.end8
 
-for.end8:
-  %9 = load i32, ptr %sum1, align 4
-  %10 = load i32, ptr %sum2, align 4
-  ret i32 0
+for.end8:                                         ; preds = %for.inc6
+  %sum2.0.lcssa = phi i32 [ %add5, %for.inc6 ]
+  %0 = add i32 %sum1.0.lcssa, %sum2.0.lcssa
+  ret i32 %0
 }