llvm-6502/test/CodeGen/ARM/vget_lane.ll

; RUN: llc < %s -mattr=+neon | FileCheck %s
target datalayout = "e-p:32:32:32-i1:8:32-i8:8:32-i16:16:32-i32:32:32-i64:32:32-f32:32:32-f64:32:32-v64:64:64-v128:128:128-a0:0:32"
target triple = "thumbv7-elf"

define i32 @vget_lanes8(<8 x i8>* %A) nounwind {
;CHECK: vget_lanes8:
;CHECK: vmov.s8
	%tmp1 = load <8 x i8>* %A
	%tmp2 = extractelement <8 x i8> %tmp1, i32 1
	%tmp3 = sext i8 %tmp2 to i32
	ret i32 %tmp3
}

define i32 @vget_lanes16(<4 x i16>* %A) nounwind {
;CHECK: vget_lanes16:
;CHECK: vmov.s16
	%tmp1 = load <4 x i16>* %A
	%tmp2 = extractelement <4 x i16> %tmp1, i32 1
	%tmp3 = sext i16 %tmp2 to i32
	ret i32 %tmp3
}

define i32 @vget_laneu8(<8 x i8>* %A) nounwind {
;CHECK: vget_laneu8:
;CHECK: vmov.u8
	%tmp1 = load <8 x i8>* %A
	%tmp2 = extractelement <8 x i8> %tmp1, i32 1
	%tmp3 = zext i8 %tmp2 to i32
	ret i32 %tmp3
}

define i32 @vget_laneu16(<4 x i16>* %A) nounwind {
;CHECK: vget_laneu16:
;CHECK: vmov.u16
	%tmp1 = load <4 x i16>* %A
	%tmp2 = extractelement <4 x i16> %tmp1, i32 1
	%tmp3 = zext i16 %tmp2 to i32
	ret i32 %tmp3
}

; Do a vector add to keep the extraction from being done directly from memory.
define i32 @vget_lanei32(<2 x i32>* %A) nounwind {
;CHECK: vget_lanei32:
;CHECK: vmov.32
	%tmp1 = load <2 x i32>* %A
	%tmp2 = add <2 x i32> %tmp1, %tmp1
	%tmp3 = extractelement <2 x i32> %tmp2, i32 1
	ret i32 %tmp3
}

define i32 @vgetQ_lanes8(<16 x i8>* %A) nounwind {
;CHECK: vgetQ_lanes8:
;CHECK: vmov.s8
	%tmp1 = load <16 x i8>* %A
	%tmp2 = extractelement <16 x i8> %tmp1, i32 1
	%tmp3 = sext i8 %tmp2 to i32
	ret i32 %tmp3
}

define i32 @vgetQ_lanes16(<8 x i16>* %A) nounwind {
;CHECK: vgetQ_lanes16:
;CHECK: vmov.s16
	%tmp1 = load <8 x i16>* %A
	%tmp2 = extractelement <8 x i16> %tmp1, i32 1
	%tmp3 = sext i16 %tmp2 to i32
	ret i32 %tmp3
}

define i32 @vgetQ_laneu8(<16 x i8>* %A) nounwind {
;CHECK: vgetQ_laneu8:
;CHECK: vmov.u8
	%tmp1 = load <16 x i8>* %A
	%tmp2 = extractelement <16 x i8> %tmp1, i32 1
	%tmp3 = zext i8 %tmp2 to i32
	ret i32 %tmp3
}

define i32 @vgetQ_laneu16(<8 x i16>* %A) nounwind {
;CHECK: vgetQ_laneu16:
;CHECK: vmov.u16
	%tmp1 = load <8 x i16>* %A
	%tmp2 = extractelement <8 x i16> %tmp1, i32 1
	%tmp3 = zext i16 %tmp2 to i32
	ret i32 %tmp3
}

; Do a vector add to keep the extraction from being done directly from memory.
define i32 @vgetQ_lanei32(<4 x i32>* %A) nounwind {
;CHECK: vgetQ_lanei32:
;CHECK: vmov.32
	%tmp1 = load <4 x i32>* %A
	%tmp2 = add <4 x i32> %tmp1, %tmp1
	%tmp3 = extractelement <4 x i32> %tmp2, i32 1
	ret i32 %tmp3
}

define arm_aapcs_vfpcc void @test_vget_laneu16() nounwind {
entry:
; CHECK: vmov.u16 r0, d{{.*}}[1]
  %arg0_uint16x4_t = alloca <4 x i16>             ; <<4 x i16>*> [#uses=1]
  %out_uint16_t = alloca i16                      ; <i16*> [#uses=1]
  %"alloca point" = bitcast i32 0 to i32          ; <i32> [#uses=0]
  %0 = load <4 x i16>* %arg0_uint16x4_t, align 8  ; <<4 x i16>> [#uses=1]
  %1 = extractelement <4 x i16> %0, i32 1         ; <i16> [#uses=1]
  %2 = add i16 %1, %1
  store i16 %2, i16* %out_uint16_t, align 2
  br label %return

return:                                           ; preds = %entry
  ret void
}

define arm_aapcs_vfpcc void @test_vget_laneu8() nounwind {
entry:
; CHECK: vmov.u8 r0, d{{.*}}[1]
  %arg0_uint8x8_t = alloca <8 x i8>               ; <<8 x i8>*> [#uses=1]
  %out_uint8_t = alloca i8                        ; <i8*> [#uses=1]
  %"alloca point" = bitcast i32 0 to i32          ; <i32> [#uses=0]
  %0 = load <8 x i8>* %arg0_uint8x8_t, align 8    ; <<8 x i8>> [#uses=1]
  %1 = extractelement <8 x i8> %0, i32 1          ; <i8> [#uses=1]
  %2 = add i8 %1, %1
  store i8 %2, i8* %out_uint8_t, align 1
  br label %return

return:                                           ; preds = %entry
  ret void
}

define arm_aapcs_vfpcc void @test_vgetQ_laneu16() nounwind {
entry:
; CHECK: vmov.u16 r0, d{{.*}}[1]
  %arg0_uint16x8_t = alloca <8 x i16>             ; <<8 x i16>*> [#uses=1]
  %out_uint16_t = alloca i16                      ; <i16*> [#uses=1]
  %"alloca point" = bitcast i32 0 to i32          ; <i32> [#uses=0]
  %0 = load <8 x i16>* %arg0_uint16x8_t, align 16 ; <<8 x i16>> [#uses=1]
  %1 = extractelement <8 x i16> %0, i32 1         ; <i16> [#uses=1]
  %2 = add i16 %1, %1
  store i16 %2, i16* %out_uint16_t, align 2
  br label %return

return:                                           ; preds = %entry
  ret void
}

define arm_aapcs_vfpcc void @test_vgetQ_laneu8() nounwind {
entry:
; CHECK: vmov.u8 r0, d{{.*}}[1]
  %arg0_uint8x16_t = alloca <16 x i8>             ; <<16 x i8>*> [#uses=1]
  %out_uint8_t = alloca i8                        ; <i8*> [#uses=1]
  %"alloca point" = bitcast i32 0 to i32          ; <i32> [#uses=0]
  %0 = load <16 x i8>* %arg0_uint8x16_t, align 16 ; <<16 x i8>> [#uses=1]
  %1 = extractelement <16 x i8> %0, i32 1         ; <i8> [#uses=1]
  %2 = add i8 %1, %1
  store i8 %2, i8* %out_uint8_t, align 1
  br label %return

return:                                           ; preds = %entry
  ret void
}

define <8 x i8> @vset_lane8(<8 x i8>* %A, i8 %B) nounwind {
;CHECK: vset_lane8:
;CHECK: vmov.8
	%tmp1 = load <8 x i8>* %A
	%tmp2 = insertelement <8 x i8> %tmp1, i8 %B, i32 1
	ret <8 x i8> %tmp2
}

define <4 x i16> @vset_lane16(<4 x i16>* %A, i16 %B) nounwind {
;CHECK: vset_lane16:
;CHECK: vmov.16
	%tmp1 = load <4 x i16>* %A
	%tmp2 = insertelement <4 x i16> %tmp1, i16 %B, i32 1
	ret <4 x i16> %tmp2
}

define <2 x i32> @vset_lane32(<2 x i32>* %A, i32 %B) nounwind {
;CHECK: vset_lane32:
;CHECK: vmov.32
	%tmp1 = load <2 x i32>* %A
	%tmp2 = insertelement <2 x i32> %tmp1, i32 %B, i32 1
	ret <2 x i32> %tmp2
}

define <16 x i8> @vsetQ_lane8(<16 x i8>* %A, i8 %B) nounwind {
;CHECK: vsetQ_lane8:
;CHECK: vmov.8
	%tmp1 = load <16 x i8>* %A
	%tmp2 = insertelement <16 x i8> %tmp1, i8 %B, i32 1
	ret <16 x i8> %tmp2
}

define <8 x i16> @vsetQ_lane16(<8 x i16>* %A, i16 %B) nounwind {
;CHECK: vsetQ_lane16:
;CHECK: vmov.16
	%tmp1 = load <8 x i16>* %A
	%tmp2 = insertelement <8 x i16> %tmp1, i16 %B, i32 1
	ret <8 x i16> %tmp2
}

define <4 x i32> @vsetQ_lane32(<4 x i32>* %A, i32 %B) nounwind {
;CHECK: vsetQ_lane32:
;CHECK: vmov.32
	%tmp1 = load <4 x i32>* %A
	%tmp2 = insertelement <4 x i32> %tmp1, i32 %B, i32 1
	ret <4 x i32> %tmp2
}

define arm_aapcs_vfpcc <2 x float> @test_vset_lanef32(float %arg0_float32_t, <2 x float> %arg1_float32x2_t) nounwind {
;CHECK: test_vset_lanef32:
;CHECK: vmov.f32 s3, s0
;CHECK: vmov.f64 d0, d1
entry:
  %0 = insertelement <2 x float> %arg1_float32x2_t, float %arg0_float32_t, i32 1 ; <<2 x float>> [#uses=1]
  ret <2 x float> %0
}

; The llvm extractelement instruction does not require that the lane number
; be an immediate constant.  Make sure a variable lane number is handled.

define i32 @vget_variable_lanes8(<8 x i8>* %A, i32 %B) nounwind {
	%tmp1 = load <8 x i8>* %A
	%tmp2 = extractelement <8 x i8> %tmp1, i32 %B
	%tmp3 = sext i8 %tmp2 to i32
	ret i32 %tmp3
}

define i32 @vgetQ_variable_lanei32(<4 x i32>* %A, i32 %B) nounwind {
	%tmp1 = load <4 x i32>* %A
	%tmp2 = add <4 x i32> %tmp1, %tmp1
	%tmp3 = extractelement <4 x i32> %tmp2, i32 %B
	ret i32 %tmp3
}
Merge a bunch of NEON tests into larger files so they run faster. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@83667 91177308-0d34-0410-b5e6-96231b3b80d8 2009-10-09 20:20:54 +00:00			`; RUN: llc < %s -mattr=+neon \| FileCheck %s`
			`target datalayout = "e-p:32:32:32-i1:8:32-i8:8:32-i16:16:32-i32:32:32-i64:32:32-f32:32:32-f64:32:32-v64:64:64-v128:128:128-a0:0:32"`
			`target triple = "thumbv7-elf"`
Add support for ARM's Advanced SIMD (NEON) instruction set. This is still a work in progress but most of the NEON instruction set is supported. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@73919 91177308-0d34-0410-b5e6-96231b3b80d8 2009-06-22 23:27:02 +00:00
			`define i32 @vget_lanes8(<8 x i8>* %A) nounwind {`
Convert more tests to FileCheck. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@81915 91177308-0d34-0410-b5e6-96231b3b80d8 2009-09-15 20:58:02 +00:00			`;CHECK: vget_lanes8:`
			`;CHECK: vmov.s8`
Add support for ARM's Advanced SIMD (NEON) instruction set. This is still a work in progress but most of the NEON instruction set is supported. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@73919 91177308-0d34-0410-b5e6-96231b3b80d8 2009-06-22 23:27:02 +00:00			`%tmp1 = load <8 x i8>* %A`
			`%tmp2 = extractelement <8 x i8> %tmp1, i32 1`
			`%tmp3 = sext i8 %tmp2 to i32`
			`ret i32 %tmp3`
			`}`

			`define i32 @vget_lanes16(<4 x i16>* %A) nounwind {`
Convert more tests to FileCheck. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@81915 91177308-0d34-0410-b5e6-96231b3b80d8 2009-09-15 20:58:02 +00:00			`;CHECK: vget_lanes16:`
			`;CHECK: vmov.s16`
Add support for ARM's Advanced SIMD (NEON) instruction set. This is still a work in progress but most of the NEON instruction set is supported. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@73919 91177308-0d34-0410-b5e6-96231b3b80d8 2009-06-22 23:27:02 +00:00			`%tmp1 = load <4 x i16>* %A`
			`%tmp2 = extractelement <4 x i16> %tmp1, i32 1`
			`%tmp3 = sext i16 %tmp2 to i32`
			`ret i32 %tmp3`
			`}`

			`define i32 @vget_laneu8(<8 x i8>* %A) nounwind {`
Convert more tests to FileCheck. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@81915 91177308-0d34-0410-b5e6-96231b3b80d8 2009-09-15 20:58:02 +00:00			`;CHECK: vget_laneu8:`
			`;CHECK: vmov.u8`
Add support for ARM's Advanced SIMD (NEON) instruction set. This is still a work in progress but most of the NEON instruction set is supported. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@73919 91177308-0d34-0410-b5e6-96231b3b80d8 2009-06-22 23:27:02 +00:00			`%tmp1 = load <8 x i8>* %A`
			`%tmp2 = extractelement <8 x i8> %tmp1, i32 1`
			`%tmp3 = zext i8 %tmp2 to i32`
			`ret i32 %tmp3`
			`}`

			`define i32 @vget_laneu16(<4 x i16>* %A) nounwind {`
Convert more tests to FileCheck. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@81915 91177308-0d34-0410-b5e6-96231b3b80d8 2009-09-15 20:58:02 +00:00			`;CHECK: vget_laneu16:`
			`;CHECK: vmov.u16`
Add support for ARM's Advanced SIMD (NEON) instruction set. This is still a work in progress but most of the NEON instruction set is supported. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@73919 91177308-0d34-0410-b5e6-96231b3b80d8 2009-06-22 23:27:02 +00:00			`%tmp1 = load <4 x i16>* %A`
			`%tmp2 = extractelement <4 x i16> %tmp1, i32 1`
			`%tmp3 = zext i16 %tmp2 to i32`
			`ret i32 %tmp3`
			`}`

			`; Do a vector add to keep the extraction from being done directly from memory.`
			`define i32 @vget_lanei32(<2 x i32>* %A) nounwind {`
Convert more tests to FileCheck. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@81915 91177308-0d34-0410-b5e6-96231b3b80d8 2009-09-15 20:58:02 +00:00			`;CHECK: vget_lanei32:`
			`;CHECK: vmov.32`
Add support for ARM's Advanced SIMD (NEON) instruction set. This is still a work in progress but most of the NEON instruction set is supported. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@73919 91177308-0d34-0410-b5e6-96231b3b80d8 2009-06-22 23:27:02 +00:00			`%tmp1 = load <2 x i32>* %A`
			`%tmp2 = add <2 x i32> %tmp1, %tmp1`
			`%tmp3 = extractelement <2 x i32> %tmp2, i32 1`
			`ret i32 %tmp3`
			`}`

			`define i32 @vgetQ_lanes8(<16 x i8>* %A) nounwind {`
Convert more tests to FileCheck. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@81915 91177308-0d34-0410-b5e6-96231b3b80d8 2009-09-15 20:58:02 +00:00			`;CHECK: vgetQ_lanes8:`
			`;CHECK: vmov.s8`
Add support for ARM's Advanced SIMD (NEON) instruction set. This is still a work in progress but most of the NEON instruction set is supported. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@73919 91177308-0d34-0410-b5e6-96231b3b80d8 2009-06-22 23:27:02 +00:00			`%tmp1 = load <16 x i8>* %A`
			`%tmp2 = extractelement <16 x i8> %tmp1, i32 1`
			`%tmp3 = sext i8 %tmp2 to i32`
			`ret i32 %tmp3`
			`}`

			`define i32 @vgetQ_lanes16(<8 x i16>* %A) nounwind {`
Convert more tests to FileCheck. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@81915 91177308-0d34-0410-b5e6-96231b3b80d8 2009-09-15 20:58:02 +00:00			`;CHECK: vgetQ_lanes16:`
			`;CHECK: vmov.s16`
Add support for ARM's Advanced SIMD (NEON) instruction set. This is still a work in progress but most of the NEON instruction set is supported. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@73919 91177308-0d34-0410-b5e6-96231b3b80d8 2009-06-22 23:27:02 +00:00			`%tmp1 = load <8 x i16>* %A`
			`%tmp2 = extractelement <8 x i16> %tmp1, i32 1`
			`%tmp3 = sext i16 %tmp2 to i32`
			`ret i32 %tmp3`
			`}`

			`define i32 @vgetQ_laneu8(<16 x i8>* %A) nounwind {`
Convert more tests to FileCheck. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@81915 91177308-0d34-0410-b5e6-96231b3b80d8 2009-09-15 20:58:02 +00:00			`;CHECK: vgetQ_laneu8:`
			`;CHECK: vmov.u8`
Add support for ARM's Advanced SIMD (NEON) instruction set. This is still a work in progress but most of the NEON instruction set is supported. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@73919 91177308-0d34-0410-b5e6-96231b3b80d8 2009-06-22 23:27:02 +00:00			`%tmp1 = load <16 x i8>* %A`
			`%tmp2 = extractelement <16 x i8> %tmp1, i32 1`
			`%tmp3 = zext i8 %tmp2 to i32`
			`ret i32 %tmp3`
			`}`

			`define i32 @vgetQ_laneu16(<8 x i16>* %A) nounwind {`
Convert more tests to FileCheck. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@81915 91177308-0d34-0410-b5e6-96231b3b80d8 2009-09-15 20:58:02 +00:00			`;CHECK: vgetQ_laneu16:`
			`;CHECK: vmov.u16`
Add support for ARM's Advanced SIMD (NEON) instruction set. This is still a work in progress but most of the NEON instruction set is supported. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@73919 91177308-0d34-0410-b5e6-96231b3b80d8 2009-06-22 23:27:02 +00:00			`%tmp1 = load <8 x i16>* %A`
			`%tmp2 = extractelement <8 x i16> %tmp1, i32 1`
			`%tmp3 = zext i16 %tmp2 to i32`
			`ret i32 %tmp3`
			`}`

			`; Do a vector add to keep the extraction from being done directly from memory.`
			`define i32 @vgetQ_lanei32(<4 x i32>* %A) nounwind {`
Convert more tests to FileCheck. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@81915 91177308-0d34-0410-b5e6-96231b3b80d8 2009-09-15 20:58:02 +00:00			`;CHECK: vgetQ_lanei32:`
			`;CHECK: vmov.32`
Add support for ARM's Advanced SIMD (NEON) instruction set. This is still a work in progress but most of the NEON instruction set is supported. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@73919 91177308-0d34-0410-b5e6-96231b3b80d8 2009-06-22 23:27:02 +00:00			`%tmp1 = load <4 x i32>* %A`
			`%tmp2 = add <4 x i32> %tmp1, %tmp1`
			`%tmp3 = extractelement <4 x i32> %tmp2, i32 1`
			`ret i32 %tmp3`
			`}`
Merge a bunch of NEON tests into larger files so they run faster. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@83667 91177308-0d34-0410-b5e6-96231b3b80d8 2009-10-09 20:20:54 +00:00
			`define arm_aapcs_vfpcc void @test_vget_laneu16() nounwind {`
			`entry:`
Change register allocation order for ARM VFP and NEON registers to put the callee-saved registers at the end of the lists. Also prefer to avoid using the low registers that are in register subclasses required by certain instructions, so that those registers will more likely be available when needed. This change makes a huge improvement in spilling in some cases. Thanks to Jakob for helping me realize the problem. Most of this patch is fixing the testsuite. There are quite a few places where we're checking for specific registers. I changed those to wildcards in places where that doesn't weaken the tests. The spill-q.ll and thumb2-spill-q.ll tests stopped spilling with this change, so I added a bunch of live values to force spills on those tests. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@116055 91177308-0d34-0410-b5e6-96231b3b80d8 2010-10-08 06:15:13 +00:00			`; CHECK: vmov.u16 r0, d{{.*}}[1]`
Merge a bunch of NEON tests into larger files so they run faster. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@83667 91177308-0d34-0410-b5e6-96231b3b80d8 2009-10-09 20:20:54 +00:00			`%arg0_uint16x4_t = alloca <4 x i16> ; <<4 x i16>*> [#uses=1]`
			`%out_uint16_t = alloca i16 ; <i16*> [#uses=1]`
			`%"alloca point" = bitcast i32 0 to i32 ; <i32> [#uses=0]`
			`%0 = load <4 x i16>* %arg0_uint16x4_t, align 8 ; <<4 x i16>> [#uses=1]`
			`%1 = extractelement <4 x i16> %0, i32 1 ; <i16> [#uses=1]`
Add codegen patterns for VST1-lane instructions. Radar 8599955. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@118176 91177308-0d34-0410-b5e6-96231b3b80d8 2010-11-03 16:24:53 +00:00			`%2 = add i16 %1, %1`
			`store i16 %2, i16* %out_uint16_t, align 2`
Merge a bunch of NEON tests into larger files so they run faster. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@83667 91177308-0d34-0410-b5e6-96231b3b80d8 2009-10-09 20:20:54 +00:00			`br label %return`

			`return: ; preds = %entry`
			`ret void`
			`}`

			`define arm_aapcs_vfpcc void @test_vget_laneu8() nounwind {`
			`entry:`
Change register allocation order for ARM VFP and NEON registers to put the callee-saved registers at the end of the lists. Also prefer to avoid using the low registers that are in register subclasses required by certain instructions, so that those registers will more likely be available when needed. This change makes a huge improvement in spilling in some cases. Thanks to Jakob for helping me realize the problem. Most of this patch is fixing the testsuite. There are quite a few places where we're checking for specific registers. I changed those to wildcards in places where that doesn't weaken the tests. The spill-q.ll and thumb2-spill-q.ll tests stopped spilling with this change, so I added a bunch of live values to force spills on those tests. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@116055 91177308-0d34-0410-b5e6-96231b3b80d8 2010-10-08 06:15:13 +00:00			`; CHECK: vmov.u8 r0, d{{.*}}[1]`
Merge a bunch of NEON tests into larger files so they run faster. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@83667 91177308-0d34-0410-b5e6-96231b3b80d8 2009-10-09 20:20:54 +00:00			`%arg0_uint8x8_t = alloca <8 x i8> ; <<8 x i8>*> [#uses=1]`
			`%out_uint8_t = alloca i8 ; <i8*> [#uses=1]`
			`%"alloca point" = bitcast i32 0 to i32 ; <i32> [#uses=0]`
			`%0 = load <8 x i8>* %arg0_uint8x8_t, align 8 ; <<8 x i8>> [#uses=1]`
			`%1 = extractelement <8 x i8> %0, i32 1 ; <i8> [#uses=1]`
Add codegen patterns for VST1-lane instructions. Radar 8599955. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@118176 91177308-0d34-0410-b5e6-96231b3b80d8 2010-11-03 16:24:53 +00:00			`%2 = add i8 %1, %1`
			`store i8 %2, i8* %out_uint8_t, align 1`
Merge a bunch of NEON tests into larger files so they run faster. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@83667 91177308-0d34-0410-b5e6-96231b3b80d8 2009-10-09 20:20:54 +00:00			`br label %return`

			`return: ; preds = %entry`
			`ret void`
			`}`

			`define arm_aapcs_vfpcc void @test_vgetQ_laneu16() nounwind {`
			`entry:`
Change register allocation order for ARM VFP and NEON registers to put the callee-saved registers at the end of the lists. Also prefer to avoid using the low registers that are in register subclasses required by certain instructions, so that those registers will more likely be available when needed. This change makes a huge improvement in spilling in some cases. Thanks to Jakob for helping me realize the problem. Most of this patch is fixing the testsuite. There are quite a few places where we're checking for specific registers. I changed those to wildcards in places where that doesn't weaken the tests. The spill-q.ll and thumb2-spill-q.ll tests stopped spilling with this change, so I added a bunch of live values to force spills on those tests. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@116055 91177308-0d34-0410-b5e6-96231b3b80d8 2010-10-08 06:15:13 +00:00			`; CHECK: vmov.u16 r0, d{{.*}}[1]`
Merge a bunch of NEON tests into larger files so they run faster. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@83667 91177308-0d34-0410-b5e6-96231b3b80d8 2009-10-09 20:20:54 +00:00			`%arg0_uint16x8_t = alloca <8 x i16> ; <<8 x i16>*> [#uses=1]`
			`%out_uint16_t = alloca i16 ; <i16*> [#uses=1]`
			`%"alloca point" = bitcast i32 0 to i32 ; <i32> [#uses=0]`
			`%0 = load <8 x i16>* %arg0_uint16x8_t, align 16 ; <<8 x i16>> [#uses=1]`
			`%1 = extractelement <8 x i16> %0, i32 1 ; <i16> [#uses=1]`
Add codegen patterns for VST1-lane instructions. Radar 8599955. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@118176 91177308-0d34-0410-b5e6-96231b3b80d8 2010-11-03 16:24:53 +00:00			`%2 = add i16 %1, %1`
			`store i16 %2, i16* %out_uint16_t, align 2`
Merge a bunch of NEON tests into larger files so they run faster. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@83667 91177308-0d34-0410-b5e6-96231b3b80d8 2009-10-09 20:20:54 +00:00			`br label %return`

			`return: ; preds = %entry`
			`ret void`
			`}`

			`define arm_aapcs_vfpcc void @test_vgetQ_laneu8() nounwind {`
			`entry:`
Change register allocation order for ARM VFP and NEON registers to put the callee-saved registers at the end of the lists. Also prefer to avoid using the low registers that are in register subclasses required by certain instructions, so that those registers will more likely be available when needed. This change makes a huge improvement in spilling in some cases. Thanks to Jakob for helping me realize the problem. Most of this patch is fixing the testsuite. There are quite a few places where we're checking for specific registers. I changed those to wildcards in places where that doesn't weaken the tests. The spill-q.ll and thumb2-spill-q.ll tests stopped spilling with this change, so I added a bunch of live values to force spills on those tests. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@116055 91177308-0d34-0410-b5e6-96231b3b80d8 2010-10-08 06:15:13 +00:00			`; CHECK: vmov.u8 r0, d{{.*}}[1]`
Merge a bunch of NEON tests into larger files so they run faster. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@83667 91177308-0d34-0410-b5e6-96231b3b80d8 2009-10-09 20:20:54 +00:00			`%arg0_uint8x16_t = alloca <16 x i8> ; <<16 x i8>*> [#uses=1]`
			`%out_uint8_t = alloca i8 ; <i8*> [#uses=1]`
			`%"alloca point" = bitcast i32 0 to i32 ; <i32> [#uses=0]`
			`%0 = load <16 x i8>* %arg0_uint8x16_t, align 16 ; <<16 x i8>> [#uses=1]`
			`%1 = extractelement <16 x i8> %0, i32 1 ; <i8> [#uses=1]`
Add codegen patterns for VST1-lane instructions. Radar 8599955. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@118176 91177308-0d34-0410-b5e6-96231b3b80d8 2010-11-03 16:24:53 +00:00			`%2 = add i8 %1, %1`
			`store i8 %2, i8* %out_uint8_t, align 1`
Merge a bunch of NEON tests into larger files so they run faster. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@83667 91177308-0d34-0410-b5e6-96231b3b80d8 2009-10-09 20:20:54 +00:00			`br label %return`

			`return: ; preds = %entry`
			`ret void`
			`}`

			`define <8 x i8> @vset_lane8(<8 x i8>* %A, i8 %B) nounwind {`
			`;CHECK: vset_lane8:`
			`;CHECK: vmov.8`
			`%tmp1 = load <8 x i8>* %A`
			`%tmp2 = insertelement <8 x i8> %tmp1, i8 %B, i32 1`
			`ret <8 x i8> %tmp2`
			`}`

			`define <4 x i16> @vset_lane16(<4 x i16>* %A, i16 %B) nounwind {`
			`;CHECK: vset_lane16:`
			`;CHECK: vmov.16`
			`%tmp1 = load <4 x i16>* %A`
			`%tmp2 = insertelement <4 x i16> %tmp1, i16 %B, i32 1`
			`ret <4 x i16> %tmp2`
			`}`

			`define <2 x i32> @vset_lane32(<2 x i32>* %A, i32 %B) nounwind {`
			`;CHECK: vset_lane32:`
			`;CHECK: vmov.32`
			`%tmp1 = load <2 x i32>* %A`
			`%tmp2 = insertelement <2 x i32> %tmp1, i32 %B, i32 1`
			`ret <2 x i32> %tmp2`
			`}`

			`define <16 x i8> @vsetQ_lane8(<16 x i8>* %A, i8 %B) nounwind {`
			`;CHECK: vsetQ_lane8:`
			`;CHECK: vmov.8`
			`%tmp1 = load <16 x i8>* %A`
			`%tmp2 = insertelement <16 x i8> %tmp1, i8 %B, i32 1`
			`ret <16 x i8> %tmp2`
			`}`

			`define <8 x i16> @vsetQ_lane16(<8 x i16>* %A, i16 %B) nounwind {`
			`;CHECK: vsetQ_lane16:`
			`;CHECK: vmov.16`
			`%tmp1 = load <8 x i16>* %A`
			`%tmp2 = insertelement <8 x i16> %tmp1, i16 %B, i32 1`
			`ret <8 x i16> %tmp2`
			`}`

			`define <4 x i32> @vsetQ_lane32(<4 x i32>* %A, i32 %B) nounwind {`
			`;CHECK: vsetQ_lane32:`
			`;CHECK: vmov.32`
			`%tmp1 = load <4 x i32>* %A`
			`%tmp2 = insertelement <4 x i32> %tmp1, i32 %B, i32 1`
			`ret <4 x i32> %tmp2`
			`}`

			`define arm_aapcs_vfpcc <2 x float> @test_vset_lanef32(float %arg0_float32_t, <2 x float> %arg1_float32x2_t) nounwind {`
			`;CHECK: test_vset_lanef32:`
Replace a big gob of old coalescer logic with the new CoalescerPair class. CoalescerPair can determine if a copy can be coalesced, and which register gets merged away. The old logic in SimpleRegisterCoalescing had evolved into something a bit too convoluted. This second attempt fixes some crashes that only occurred Linux. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@106769 91177308-0d34-0410-b5e6-96231b3b80d8 2010-06-24 18:15:01 +00:00			`;CHECK: vmov.f32 s3, s0`
Don't create neon moves in CopyRegToReg. NEONMoveFixPass will do the conversion if profitable. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@107673 91177308-0d34-0410-b5e6-96231b3b80d8 2010-07-06 16:24:34 +00:00			`;CHECK: vmov.f64 d0, d1`
Merge a bunch of NEON tests into larger files so they run faster. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@83667 91177308-0d34-0410-b5e6-96231b3b80d8 2009-10-09 20:20:54 +00:00			`entry:`
			`%0 = insertelement <2 x float> %arg1_float32x2_t, float %arg0_float32_t, i32 1 ; <<2 x float>> [#uses=1]`
			`ret <2 x float> %0`
			`}`
Check for extractelement with a variable operand for the element number. For NEON we had been assuming this was always an immediate constant. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@118175 91177308-0d34-0410-b5e6-96231b3b80d8 2010-11-03 16:24:50 +00:00
			`; The llvm extractelement instruction does not require that the lane number`
			`; be an immediate constant. Make sure a variable lane number is handled.`

			`define i32 @vget_variable_lanes8(<8 x i8>* %A, i32 %B) nounwind {`
			`%tmp1 = load <8 x i8>* %A`
			`%tmp2 = extractelement <8 x i8> %tmp1, i32 %B`
			`%tmp3 = sext i8 %tmp2 to i32`
			`ret i32 %tmp3`
			`}`

			`define i32 @vgetQ_variable_lanei32(<4 x i32>* %A, i32 %B) nounwind {`
			`%tmp1 = load <4 x i32>* %A`
			`%tmp2 = add <4 x i32> %tmp1, %tmp1`
			`%tmp3 = extractelement <4 x i32> %tmp2, i32 %B`
			`ret i32 %tmp3`
			`}`