Skip to content

Instantly share code, notes, and snippets.

@maekawatoshiki
Last active June 17, 2021 15:48
Show Gist options
  • Save maekawatoshiki/3018a4cafea55aba9498932f4c83c623 to your computer and use it in GitHub Desktop.
Save maekawatoshiki/3018a4cafea55aba9498932f4c83c623 to your computer and use it in GitHub Desktop.
Difference
  • test.ll
; void test(int arr[10][10][10], int x) {
;   for (int k = 0; k < 10; k++) 
;     for (int j = 0; j < 10; j++) 
;       for (int i = 0; i < 10; i++) 
;         arr[i][k][j] += x * 2;
; }

define dso_local void @test([10 x [10 x i32]]* %0, i32 %1) {
  br label %.preheader3

.preheader3:                                      ; preds = %2, %18
  %.026 = phi i32 [ 0, %2 ], [ %19, %18 ]
  br label %.preheader

.preheader:                                       ; preds = %.preheader3, %15
  %.015 = phi i32 [ 0, %.preheader3 ], [ %16, %15 ]
  br label %3

3:                                                ; preds = %.preheader, %3
  %.04 = phi i32 [ 0, %.preheader ], [ %13, %3 ]
  %4 = mul nsw i32 %1, 2
  %5 = sext i32 %.04 to i64
  %6 = getelementptr inbounds [10 x [10 x i32]], [10 x [10 x i32]]* %0, i64 %5
  %7 = sext i32 %.026 to i64
  %8 = getelementptr inbounds [10 x [10 x i32]], [10 x [10 x i32]]* %6, i64 0, i64 %7
  %9 = sext i32 %.015 to i64
  %10 = getelementptr inbounds [10 x i32], [10 x i32]* %8, i64 0, i64 %9
  %11 = load i32, i32* %10, align 4
  %12 = add nsw i32 %11, %4
  store i32 %12, i32* %10, align 4
  %13 = add nsw i32 %.04, 1
  %14 = icmp slt i32 %13, 10
  br i1 %14, label %3, label %15

15:                                               ; preds = %3
  %16 = add nsw i32 %.015, 1
  %17 = icmp slt i32 %16, 10
  br i1 %17, label %.preheader, label %18

18:                                               ; preds = %15
  %19 = add nsw i32 %.026, 1
  %20 = icmp slt i32 %19, 10
  br i1 %20, label %.preheader3, label %21

21:                                               ; preds = %18
  ret void
}
  • ./bin/opt -aa-pipeline=basic-aa -passes='loop(loop-interchange,licm)' test.ll -S
define dso_local void @test([10 x [10 x i32]]* %0, i32 %1) {
  br label %.preheader2

.preheader3.preheader:                            ; preds = %6
  %3 = mul nsw i32 %1, 2
  br label %.preheader3

.preheader3:                                      ; preds = %.preheader3.preheader, %20
  %.026 = phi i32 [ %21, %20 ], [ 0, %.preheader3.preheader ]
  %4 = sext i32 %.026 to i64
  br label %.preheader.preheader

.preheader.preheader:                             ; preds = %.preheader3
  br label %.preheader

.preheader:                                       ; preds = %.preheader.preheader, %17
  %.015 = phi i32 [ %18, %17 ], [ 0, %.preheader.preheader ]
  %5 = sext i32 %.015 to i64
  br label %.split1

.preheader2:                                      ; preds = %2
  br label %6

6:                                                ; preds = %.preheader2, %.split
  %.04 = phi i32 [ %15, %.split ], [ 0, %.preheader2 ]
  br label %.preheader3.preheader

.split1:                                          ; preds = %.preheader
  %7 = sext i32 %.04 to i64
  %8 = getelementptr inbounds [10 x [10 x i32]], [10 x [10 x i32]]* %0, i64 %7
  %9 = getelementptr inbounds [10 x [10 x i32]], [10 x [10 x i32]]* %8, i64 0, i64 %4
  %10 = getelementptr inbounds [10 x i32], [10 x i32]* %9, i64 0, i64 %5
  %11 = load i32, i32* %10, align 4
  %12 = add nsw i32 %11, %3
  store i32 %12, i32* %10, align 4
  %13 = add nsw i32 %.04, 1
  %14 = icmp slt i32 %13, 10
  br label %17

.split:                                           ; preds = %20
  %15 = add nsw i32 %.04, 1
  %16 = icmp slt i32 %15, 10
  br i1 %16, label %6, label %23

17:                                               ; preds = %.split1
  %18 = add nsw i32 %.015, 1
  %19 = icmp slt i32 %18, 10
  br i1 %19, label %.preheader, label %20

20:                                               ; preds = %17
  %21 = add nsw i32 %.026, 1
  %22 = icmp slt i32 %21, 10
  br i1 %22, label %.preheader3, label %.split

23:                                               ; preds = %.split
  ret void
  • ./bin/opt -aa-pipeline=basic-aa -passes='loop(loop-interchange,lnicm)' test.ll -S
  • slightly fewer instructions than that of LICM
define dso_local void @test([10 x [10 x i32]]* %0, i32 %1) {
  br label %.preheader2

.preheader3.preheader:                            ; preds = %8
  %3 = mul nsw i32 %1, 2
  %4 = sext i32 %.04 to i64
  %5 = getelementptr inbounds [10 x [10 x i32]], [10 x [10 x i32]]* %0, i64 %4
  br label %.preheader3

.preheader3:                                      ; preds = %.preheader3.preheader, %18
  %.026 = phi i32 [ %19, %18 ], [ 0, %.preheader3.preheader ]
  br label %.preheader.preheader

.preheader.preheader:                             ; preds = %.preheader3
  %6 = sext i32 %.026 to i64
  %7 = getelementptr inbounds [10 x [10 x i32]], [10 x [10 x i32]]* %5, i64 0, i64 %6
  br label %.preheader

.preheader:                                       ; preds = %.preheader.preheader, %15
  %.015 = phi i32 [ %16, %15 ], [ 0, %.preheader.preheader ]
  br label %.split1

.preheader2:                                      ; preds = %2
  br label %8

8:                                                ; preds = %.preheader2, %.split
  %.04 = phi i32 [ %13, %.split ], [ 0, %.preheader2 ]
  br label %.preheader3.preheader

.split1:                                          ; preds = %.preheader
  %9 = sext i32 %.015 to i64
  %10 = getelementptr inbounds [10 x i32], [10 x i32]* %7, i64 0, i64 %9
  %11 = load i32, i32* %10, align 4
  %12 = add nsw i32 %11, %3
  store i32 %12, i32* %10, align 4
  br label %15

.split:                                           ; preds = %18
  %13 = add nsw i32 %.04, 1
  %14 = icmp slt i32 %13, 10
  br i1 %14, label %8, label %21

15:                                               ; preds = %.split1
  %16 = add nsw i32 %.015, 1
  %17 = icmp slt i32 %16, 10
  br i1 %17, label %.preheader, label %18

18:                                               ; preds = %15
  %19 = add nsw i32 %.026, 1
  %20 = icmp slt i32 %19, 10
  br i1 %20, label %.preheader3, label %.split

21:                                               ; preds = %.split
  ret void
}
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment