llvm-for-llvmta/test/CodeGen/Hexagon/reg_seq.ll

; RUN: llc -march=hexagon -O2 < %s | FileCheck %s

; Generate REG_SEQUENCE instead of combine
; CHECK-NOT: combine(#0

; Function Attrs: nounwind
define void @f0(i16* nocapture readonly %a0, i16* nocapture readonly %a1, i16* nocapture %a2, i16* nocapture readonly %a3, i32 %a4) #0 {
b0:
  %v0 = lshr i32 %a4, 1
  %v1 = icmp eq i32 %v0, 0
  br i1 %v1, label %b3, label %b1

b1:                                               ; preds = %b0
  %v2 = bitcast i16* %a2 to i64*
  %v3 = bitcast i16* %a1 to i64*
  %v4 = bitcast i16* %a0 to i64*
  br label %b2

b2:                                               ; preds = %b2, %b1
  %v5 = phi i32 [ 0, %b1 ], [ %v71, %b2 ]
  %v6 = phi i64* [ %v4, %b1 ], [ %v9, %b2 ]
  %v7 = phi i64* [ %v3, %b1 ], [ %v11, %b2 ]
  %v8 = phi i64* [ %v2, %b1 ], [ %v70, %b2 ]
  %v9 = getelementptr inbounds i64, i64* %v6, i32 1
  %v10 = load i64, i64* %v6, align 8, !tbaa !0
  %v11 = getelementptr inbounds i64, i64* %v7, i32 1
  %v12 = load i64, i64* %v7, align 8, !tbaa !0
  %v13 = trunc i64 %v10 to i32
  %v14 = lshr i64 %v10, 32
  %v15 = tail call i64 @llvm.hexagon.S2.vzxthw(i32 %v13)
  %v16 = trunc i64 %v12 to i32
  %v17 = lshr i64 %v12, 32
  %v18 = tail call i64 @llvm.hexagon.S2.vzxthw(i32 %v16)
  %v19 = trunc i64 %v15 to i32
  %v20 = lshr i64 %v15, 32
  %v21 = getelementptr inbounds i16, i16* %a3, i32 %v19
  %v22 = load i16, i16* %v21, align 2, !tbaa !3
  %v23 = trunc i64 %v20 to i32
  %v24 = getelementptr inbounds i16, i16* %a3, i32 %v23
  %v25 = load i16, i16* %v24, align 2, !tbaa !3
  %v26 = trunc i64 %v18 to i32
  %v27 = lshr i64 %v18, 32
  %v28 = getelementptr inbounds i16, i16* %a3, i32 %v26
  %v29 = load i16, i16* %v28, align 2, !tbaa !3
  %v30 = trunc i64 %v27 to i32
  %v31 = getelementptr inbounds i16, i16* %a3, i32 %v30
  %v32 = load i16, i16* %v31, align 2, !tbaa !3
  %v33 = zext i16 %v32 to i64
  %v34 = shl nuw nsw i64 %v33, 32
  %v35 = zext i16 %v29 to i64
  %v36 = or i64 %v35, %v34
  %v37 = zext i16 %v25 to i64
  %v38 = shl nuw nsw i64 %v37, 32
  %v39 = zext i16 %v22 to i64
  %v40 = or i64 %v39, %v38
  %v41 = tail call i64 @llvm.hexagon.S2.vtrunewh(i64 %v36, i64 %v40)
  %v42 = getelementptr inbounds i64, i64* %v8, i32 1
  store i64 %v41, i64* %v8, align 8, !tbaa !0
  %v43 = trunc i64 %v14 to i32
  %v44 = tail call i64 @llvm.hexagon.S2.vzxthw(i32 %v43)
  %v45 = trunc i64 %v17 to i32
  %v46 = tail call i64 @llvm.hexagon.S2.vzxthw(i32 %v45)
  %v47 = trunc i64 %v44 to i32
  %v48 = lshr i64 %v44, 32
  %v49 = getelementptr inbounds i16, i16* %a3, i32 %v47
  %v50 = load i16, i16* %v49, align 2, !tbaa !3
  %v51 = trunc i64 %v48 to i32
  %v52 = getelementptr inbounds i16, i16* %a3, i32 %v51
  %v53 = load i16, i16* %v52, align 2, !tbaa !3
  %v54 = trunc i64 %v46 to i32
  %v55 = lshr i64 %v46, 32
  %v56 = getelementptr inbounds i16, i16* %a3, i32 %v54
  %v57 = load i16, i16* %v56, align 2, !tbaa !3
  %v58 = trunc i64 %v55 to i32
  %v59 = getelementptr inbounds i16, i16* %a3, i32 %v58
  %v60 = load i16, i16* %v59, align 2, !tbaa !3
  %v61 = zext i16 %v60 to i64
  %v62 = shl nuw nsw i64 %v61, 32
  %v63 = zext i16 %v57 to i64
  %v64 = or i64 %v63, %v62
  %v65 = zext i16 %v53 to i64
  %v66 = shl nuw nsw i64 %v65, 32
  %v67 = zext i16 %v50 to i64
  %v68 = or i64 %v67, %v66
  %v69 = tail call i64 @llvm.hexagon.S2.vtrunewh(i64 %v64, i64 %v68)
  %v70 = getelementptr inbounds i64, i64* %v8, i32 2
  store i64 %v69, i64* %v42, align 8, !tbaa !0
  %v71 = add nsw i32 %v5, 1
  %v72 = icmp ult i32 %v71, %v0
  br i1 %v72, label %b2, label %b3

b3:                                               ; preds = %b2, %b0
  ret void
}

; Function Attrs: nounwind readnone
declare i64 @llvm.hexagon.S2.vzxthw(i32) #1

; Function Attrs: nounwind readnone
declare i64 @llvm.hexagon.S2.vtrunewh(i64, i64) #1

attributes #0 = { nounwind "target-cpu"="hexagonv60" }
attributes #1 = { nounwind readnone }

!0 = !{!1, !1, i64 0}
!1 = !{!"omnipotent char", !2, i64 0}
!2 = !{!"Simple C/C++ TBAA"}
!3 = !{!4, !4, i64 0}
!4 = !{!"short", !1, i64 0}
first commit 2022-04-25 10:02:23 +02:00			`; RUN: llc -march=hexagon -O2 < %s \| FileCheck %s`

			`; Generate REG_SEQUENCE instead of combine`
			`; CHECK-NOT: combine(#0`

			`; Function Attrs: nounwind`
			`define void @f0(i16* nocapture readonly %a0, i16* nocapture readonly %a1, i16* nocapture %a2, i16* nocapture readonly %a3, i32 %a4) #0 {`
			`b0:`
			`%v0 = lshr i32 %a4, 1`
			`%v1 = icmp eq i32 %v0, 0`
			`br i1 %v1, label %b3, label %b1`

			`b1: ; preds = %b0`
			`%v2 = bitcast i16* %a2 to i64*`
			`%v3 = bitcast i16* %a1 to i64*`
			`%v4 = bitcast i16* %a0 to i64*`
			`br label %b2`

			`b2: ; preds = %b2, %b1`
			`%v5 = phi i32 [ 0, %b1 ], [ %v71, %b2 ]`
			`%v6 = phi i64* [ %v4, %b1 ], [ %v9, %b2 ]`
			`%v7 = phi i64* [ %v3, %b1 ], [ %v11, %b2 ]`
			`%v8 = phi i64* [ %v2, %b1 ], [ %v70, %b2 ]`
			`%v9 = getelementptr inbounds i64, i64* %v6, i32 1`
			`%v10 = load i64, i64* %v6, align 8, !tbaa !0`
			`%v11 = getelementptr inbounds i64, i64* %v7, i32 1`
			`%v12 = load i64, i64* %v7, align 8, !tbaa !0`
			`%v13 = trunc i64 %v10 to i32`
			`%v14 = lshr i64 %v10, 32`
			`%v15 = tail call i64 @llvm.hexagon.S2.vzxthw(i32 %v13)`
			`%v16 = trunc i64 %v12 to i32`
			`%v17 = lshr i64 %v12, 32`
			`%v18 = tail call i64 @llvm.hexagon.S2.vzxthw(i32 %v16)`
			`%v19 = trunc i64 %v15 to i32`
			`%v20 = lshr i64 %v15, 32`
			`%v21 = getelementptr inbounds i16, i16* %a3, i32 %v19`
			`%v22 = load i16, i16* %v21, align 2, !tbaa !3`
			`%v23 = trunc i64 %v20 to i32`
			`%v24 = getelementptr inbounds i16, i16* %a3, i32 %v23`
			`%v25 = load i16, i16* %v24, align 2, !tbaa !3`
			`%v26 = trunc i64 %v18 to i32`
			`%v27 = lshr i64 %v18, 32`
			`%v28 = getelementptr inbounds i16, i16* %a3, i32 %v26`
			`%v29 = load i16, i16* %v28, align 2, !tbaa !3`
			`%v30 = trunc i64 %v27 to i32`
			`%v31 = getelementptr inbounds i16, i16* %a3, i32 %v30`
			`%v32 = load i16, i16* %v31, align 2, !tbaa !3`
			`%v33 = zext i16 %v32 to i64`
			`%v34 = shl nuw nsw i64 %v33, 32`
			`%v35 = zext i16 %v29 to i64`
			`%v36 = or i64 %v35, %v34`
			`%v37 = zext i16 %v25 to i64`
			`%v38 = shl nuw nsw i64 %v37, 32`
			`%v39 = zext i16 %v22 to i64`
			`%v40 = or i64 %v39, %v38`
			`%v41 = tail call i64 @llvm.hexagon.S2.vtrunewh(i64 %v36, i64 %v40)`
			`%v42 = getelementptr inbounds i64, i64* %v8, i32 1`
			`store i64 %v41, i64* %v8, align 8, !tbaa !0`
			`%v43 = trunc i64 %v14 to i32`
			`%v44 = tail call i64 @llvm.hexagon.S2.vzxthw(i32 %v43)`
			`%v45 = trunc i64 %v17 to i32`
			`%v46 = tail call i64 @llvm.hexagon.S2.vzxthw(i32 %v45)`
			`%v47 = trunc i64 %v44 to i32`
			`%v48 = lshr i64 %v44, 32`
			`%v49 = getelementptr inbounds i16, i16* %a3, i32 %v47`
			`%v50 = load i16, i16* %v49, align 2, !tbaa !3`
			`%v51 = trunc i64 %v48 to i32`
			`%v52 = getelementptr inbounds i16, i16* %a3, i32 %v51`
			`%v53 = load i16, i16* %v52, align 2, !tbaa !3`
			`%v54 = trunc i64 %v46 to i32`
			`%v55 = lshr i64 %v46, 32`
			`%v56 = getelementptr inbounds i16, i16* %a3, i32 %v54`
			`%v57 = load i16, i16* %v56, align 2, !tbaa !3`
			`%v58 = trunc i64 %v55 to i32`
			`%v59 = getelementptr inbounds i16, i16* %a3, i32 %v58`
			`%v60 = load i16, i16* %v59, align 2, !tbaa !3`
			`%v61 = zext i16 %v60 to i64`
			`%v62 = shl nuw nsw i64 %v61, 32`
			`%v63 = zext i16 %v57 to i64`
			`%v64 = or i64 %v63, %v62`
			`%v65 = zext i16 %v53 to i64`
			`%v66 = shl nuw nsw i64 %v65, 32`
			`%v67 = zext i16 %v50 to i64`
			`%v68 = or i64 %v67, %v66`
			`%v69 = tail call i64 @llvm.hexagon.S2.vtrunewh(i64 %v64, i64 %v68)`
			`%v70 = getelementptr inbounds i64, i64* %v8, i32 2`
			`store i64 %v69, i64* %v42, align 8, !tbaa !0`
			`%v71 = add nsw i32 %v5, 1`
			`%v72 = icmp ult i32 %v71, %v0`
			`br i1 %v72, label %b2, label %b3`

			`b3: ; preds = %b2, %b0`
			`ret void`
			`}`

			`; Function Attrs: nounwind readnone`
			`declare i64 @llvm.hexagon.S2.vzxthw(i32) #1`

			`; Function Attrs: nounwind readnone`
			`declare i64 @llvm.hexagon.S2.vtrunewh(i64, i64) #1`

			`attributes #0 = { nounwind "target-cpu"="hexagonv60" }`
			`attributes #1 = { nounwind readnone }`

			`!0 = !{!1, !1, i64 0}`
			`!1 = !{!"omnipotent char", !2, i64 0}`
			`!2 = !{!"Simple C/C++ TBAA"}`
			`!3 = !{!4, !4, i64 0}`
			`!4 = !{!"short", !1, i64 0}`