955 lines
40 KiB
ArmAsm
955 lines
40 KiB
ArmAsm
|
# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py
|
||
|
# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=atom -instruction-tables < %s | FileCheck %s
|
||
|
|
||
|
addpd %xmm0, %xmm2
|
||
|
addpd (%rax), %xmm2
|
||
|
|
||
|
addsd %xmm0, %xmm2
|
||
|
addsd (%rax), %xmm2
|
||
|
|
||
|
andnpd %xmm0, %xmm2
|
||
|
andnpd (%rax), %xmm2
|
||
|
|
||
|
andpd %xmm0, %xmm2
|
||
|
andpd (%rax), %xmm2
|
||
|
|
||
|
clflush (%rax)
|
||
|
|
||
|
cmppd $0, %xmm0, %xmm2
|
||
|
cmppd $0, (%rax), %xmm2
|
||
|
|
||
|
cmpsd $0, %xmm0, %xmm2
|
||
|
cmpsd $0, (%rax), %xmm2
|
||
|
|
||
|
comisd %xmm0, %xmm1
|
||
|
comisd (%rax), %xmm1
|
||
|
|
||
|
cvtdq2pd %xmm0, %xmm2
|
||
|
cvtdq2pd (%rax), %xmm2
|
||
|
|
||
|
cvtdq2ps %xmm0, %xmm2
|
||
|
cvtdq2ps (%rax), %xmm2
|
||
|
|
||
|
cvtpd2dq %xmm0, %xmm2
|
||
|
cvtpd2dq (%rax), %xmm2
|
||
|
|
||
|
cvtpd2pi %xmm0, %mm2
|
||
|
cvtpd2pi (%rax), %mm2
|
||
|
|
||
|
cvtpd2ps %xmm0, %xmm2
|
||
|
cvtpd2ps (%rax), %xmm2
|
||
|
|
||
|
cvtpi2pd %mm0, %xmm2
|
||
|
cvtpi2pd (%rax), %xmm2
|
||
|
|
||
|
cvtps2dq %xmm0, %xmm2
|
||
|
cvtps2dq (%rax), %xmm2
|
||
|
|
||
|
cvtps2pd %xmm0, %xmm2
|
||
|
cvtps2pd (%rax), %xmm2
|
||
|
|
||
|
cvtsd2si %xmm0, %ecx
|
||
|
cvtsd2si %xmm0, %rcx
|
||
|
cvtsd2si (%rax), %ecx
|
||
|
cvtsd2si (%rax), %rcx
|
||
|
|
||
|
cvtsd2ss %xmm0, %xmm2
|
||
|
cvtsd2ss (%rax), %xmm2
|
||
|
|
||
|
cvtsi2sd %ecx, %xmm2
|
||
|
cvtsi2sd %rcx, %xmm2
|
||
|
cvtsi2sd (%rax), %xmm2
|
||
|
cvtsi2sd (%rax), %xmm2
|
||
|
|
||
|
cvtss2sd %xmm0, %xmm2
|
||
|
cvtss2sd (%rax), %xmm2
|
||
|
|
||
|
cvttpd2dq %xmm0, %xmm2
|
||
|
cvttpd2dq (%rax), %xmm2
|
||
|
|
||
|
cvttpd2pi %xmm0, %mm2
|
||
|
cvttpd2pi (%rax), %mm2
|
||
|
|
||
|
cvttps2dq %xmm0, %xmm2
|
||
|
cvttps2dq (%rax), %xmm2
|
||
|
|
||
|
cvttsd2si %xmm0, %ecx
|
||
|
cvttsd2si %xmm0, %rcx
|
||
|
cvttsd2si (%rax), %ecx
|
||
|
cvttsd2si (%rax), %rcx
|
||
|
|
||
|
divpd %xmm0, %xmm2
|
||
|
divpd (%rax), %xmm2
|
||
|
|
||
|
divsd %xmm0, %xmm2
|
||
|
divsd (%rax), %xmm2
|
||
|
|
||
|
lfence
|
||
|
|
||
|
maskmovdqu %xmm0, %xmm1
|
||
|
|
||
|
maxpd %xmm0, %xmm2
|
||
|
maxpd (%rax), %xmm2
|
||
|
|
||
|
maxsd %xmm0, %xmm2
|
||
|
maxsd (%rax), %xmm2
|
||
|
|
||
|
mfence
|
||
|
|
||
|
minpd %xmm0, %xmm2
|
||
|
minpd (%rax), %xmm2
|
||
|
|
||
|
minsd %xmm0, %xmm2
|
||
|
minsd (%rax), %xmm2
|
||
|
|
||
|
movapd %xmm0, %xmm2
|
||
|
movapd %xmm0, (%rax)
|
||
|
movapd (%rax), %xmm2
|
||
|
|
||
|
movd %eax, %xmm2
|
||
|
movd (%rax), %xmm2
|
||
|
|
||
|
movd %xmm0, %ecx
|
||
|
movd %xmm0, (%rax)
|
||
|
|
||
|
movdqa %xmm0, %xmm2
|
||
|
movdqa %xmm0, (%rax)
|
||
|
movdqa (%rax), %xmm2
|
||
|
|
||
|
movdqu %xmm0, %xmm2
|
||
|
movdqu %xmm0, (%rax)
|
||
|
movdqu (%rax), %xmm2
|
||
|
|
||
|
movdq2q %xmm0, %mm2
|
||
|
|
||
|
movhpd %xmm0, (%rax)
|
||
|
movhpd (%rax), %xmm2
|
||
|
|
||
|
movlpd %xmm0, (%rax)
|
||
|
movlpd (%rax), %xmm2
|
||
|
|
||
|
movmskpd %xmm0, %rcx
|
||
|
|
||
|
movntil %eax, (%rax)
|
||
|
movntiq %rax, (%rax)
|
||
|
|
||
|
movntdq %xmm0, (%rax)
|
||
|
movntpd %xmm0, (%rax)
|
||
|
|
||
|
movq %xmm0, %xmm2
|
||
|
|
||
|
movq %rax, %xmm2
|
||
|
movq (%rax), %xmm2
|
||
|
|
||
|
movq %xmm0, %rcx
|
||
|
movq %xmm0, (%rax)
|
||
|
|
||
|
movq2dq %mm0, %xmm2
|
||
|
|
||
|
movsd %xmm0, %xmm2
|
||
|
movsd %xmm0, (%rax)
|
||
|
movsd (%rax), %xmm2
|
||
|
|
||
|
movupd %xmm0, %xmm2
|
||
|
movupd %xmm0, (%rax)
|
||
|
movupd (%rax), %xmm2
|
||
|
|
||
|
mulpd %xmm0, %xmm2
|
||
|
mulpd (%rax), %xmm2
|
||
|
|
||
|
mulsd %xmm0, %xmm2
|
||
|
mulsd (%rax), %xmm2
|
||
|
|
||
|
orpd %xmm0, %xmm2
|
||
|
orpd (%rax), %xmm2
|
||
|
|
||
|
packssdw %xmm0, %xmm2
|
||
|
packssdw (%rax), %xmm2
|
||
|
|
||
|
packsswb %xmm0, %xmm2
|
||
|
packsswb (%rax), %xmm2
|
||
|
|
||
|
packuswb %xmm0, %xmm2
|
||
|
packuswb (%rax), %xmm2
|
||
|
|
||
|
paddb %xmm0, %xmm2
|
||
|
paddb (%rax), %xmm2
|
||
|
|
||
|
paddd %xmm0, %xmm2
|
||
|
paddd (%rax), %xmm2
|
||
|
|
||
|
paddq %mm0, %mm2
|
||
|
paddq (%rax), %mm2
|
||
|
|
||
|
paddq %xmm0, %xmm2
|
||
|
paddq (%rax), %xmm2
|
||
|
|
||
|
paddsb %xmm0, %xmm2
|
||
|
paddsb (%rax), %xmm2
|
||
|
|
||
|
paddsw %xmm0, %xmm2
|
||
|
paddsw (%rax), %xmm2
|
||
|
|
||
|
paddusb %xmm0, %xmm2
|
||
|
paddusb (%rax), %xmm2
|
||
|
|
||
|
paddusw %xmm0, %xmm2
|
||
|
paddusw (%rax), %xmm2
|
||
|
|
||
|
paddw %xmm0, %xmm2
|
||
|
paddw (%rax), %xmm2
|
||
|
|
||
|
pand %xmm0, %xmm2
|
||
|
pand (%rax), %xmm2
|
||
|
|
||
|
pandn %xmm0, %xmm2
|
||
|
pandn (%rax), %xmm2
|
||
|
|
||
|
pavgb %xmm0, %xmm2
|
||
|
pavgb (%rax), %xmm2
|
||
|
|
||
|
pavgw %xmm0, %xmm2
|
||
|
pavgw (%rax), %xmm2
|
||
|
|
||
|
pcmpeqb %xmm0, %xmm2
|
||
|
pcmpeqb (%rax), %xmm2
|
||
|
|
||
|
pcmpeqd %xmm0, %xmm2
|
||
|
pcmpeqd (%rax), %xmm2
|
||
|
|
||
|
pcmpeqw %xmm0, %xmm2
|
||
|
pcmpeqw (%rax), %xmm2
|
||
|
|
||
|
pcmpgtb %xmm0, %xmm2
|
||
|
pcmpgtb (%rax), %xmm2
|
||
|
|
||
|
pcmpgtd %xmm0, %xmm2
|
||
|
pcmpgtd (%rax), %xmm2
|
||
|
|
||
|
pcmpgtw %xmm0, %xmm2
|
||
|
pcmpgtw (%rax), %xmm2
|
||
|
|
||
|
pextrw $1, %xmm0, %rcx
|
||
|
|
||
|
pinsrw $1, %rax, %xmm0
|
||
|
pinsrw $1, (%rax), %xmm0
|
||
|
|
||
|
pmaddwd %xmm0, %xmm2
|
||
|
pmaddwd (%rax), %xmm2
|
||
|
|
||
|
pmaxsw %xmm0, %xmm2
|
||
|
pmaxsw (%rax), %xmm2
|
||
|
|
||
|
pmaxub %xmm0, %xmm2
|
||
|
pmaxub (%rax), %xmm2
|
||
|
|
||
|
pminsw %xmm0, %xmm2
|
||
|
pminsw (%rax), %xmm2
|
||
|
|
||
|
pminub %xmm0, %xmm2
|
||
|
pminub (%rax), %xmm2
|
||
|
|
||
|
pmovmskb %xmm0, %rcx
|
||
|
|
||
|
pmulhuw %xmm0, %xmm2
|
||
|
pmulhuw (%rax), %xmm2
|
||
|
|
||
|
pmulhw %xmm0, %xmm2
|
||
|
pmulhw (%rax), %xmm2
|
||
|
|
||
|
pmullw %xmm0, %xmm2
|
||
|
pmullw (%rax), %xmm2
|
||
|
|
||
|
pmuludq %mm0, %mm2
|
||
|
pmuludq (%rax), %mm2
|
||
|
|
||
|
pmuludq %xmm0, %xmm2
|
||
|
pmuludq (%rax), %xmm2
|
||
|
|
||
|
por %xmm0, %xmm2
|
||
|
por (%rax), %xmm2
|
||
|
|
||
|
psadbw %xmm0, %xmm2
|
||
|
psadbw (%rax), %xmm2
|
||
|
|
||
|
pshufd $1, %xmm0, %xmm2
|
||
|
pshufd $1, (%rax), %xmm2
|
||
|
|
||
|
pshufhw $1, %xmm0, %xmm2
|
||
|
pshufhw $1, (%rax), %xmm2
|
||
|
|
||
|
pshuflw $1, %xmm0, %xmm2
|
||
|
pshuflw $1, (%rax), %xmm2
|
||
|
|
||
|
pslld $1, %xmm2
|
||
|
pslld %xmm0, %xmm2
|
||
|
pslld (%rax), %xmm2
|
||
|
|
||
|
pslldq $1, %xmm2
|
||
|
|
||
|
psllq $1, %xmm2
|
||
|
psllq %xmm0, %xmm2
|
||
|
psllq (%rax), %xmm2
|
||
|
|
||
|
psllw $1, %xmm2
|
||
|
psllw %xmm0, %xmm2
|
||
|
psllw (%rax), %xmm2
|
||
|
|
||
|
psrad $1, %xmm2
|
||
|
psrad %xmm0, %xmm2
|
||
|
psrad (%rax), %xmm2
|
||
|
|
||
|
psraw $1, %xmm2
|
||
|
psraw %xmm0, %xmm2
|
||
|
psraw (%rax), %xmm2
|
||
|
|
||
|
psrld $1, %xmm2
|
||
|
psrld %xmm0, %xmm2
|
||
|
psrld (%rax), %xmm2
|
||
|
|
||
|
psrldq $1, %xmm2
|
||
|
|
||
|
psrlq $1, %xmm2
|
||
|
psrlq %xmm0, %xmm2
|
||
|
psrlq (%rax), %xmm2
|
||
|
|
||
|
psrlw $1, %xmm2
|
||
|
psrlw %xmm0, %xmm2
|
||
|
psrlw (%rax), %xmm2
|
||
|
|
||
|
psubb %xmm0, %xmm2
|
||
|
psubb (%rax), %xmm2
|
||
|
|
||
|
psubd %xmm0, %xmm2
|
||
|
psubd (%rax), %xmm2
|
||
|
|
||
|
psubq %mm0, %mm2
|
||
|
psubq (%rax), %mm2
|
||
|
|
||
|
psubq %xmm0, %xmm2
|
||
|
psubq (%rax), %xmm2
|
||
|
|
||
|
psubsb %xmm0, %xmm2
|
||
|
psubsb (%rax), %xmm2
|
||
|
|
||
|
psubsw %xmm0, %xmm2
|
||
|
psubsw (%rax), %xmm2
|
||
|
|
||
|
psubusb %xmm0, %xmm2
|
||
|
psubusb (%rax), %xmm2
|
||
|
|
||
|
psubusw %xmm0, %xmm2
|
||
|
psubusw (%rax), %xmm2
|
||
|
|
||
|
psubw %xmm0, %xmm2
|
||
|
psubw (%rax), %xmm2
|
||
|
|
||
|
punpckhbw %xmm0, %xmm2
|
||
|
punpckhbw (%rax), %xmm2
|
||
|
|
||
|
punpckhdq %xmm0, %xmm2
|
||
|
punpckhdq (%rax), %xmm2
|
||
|
|
||
|
punpckhqdq %xmm0, %xmm2
|
||
|
punpckhqdq (%rax), %xmm2
|
||
|
|
||
|
punpckhwd %xmm0, %xmm2
|
||
|
punpckhwd (%rax), %xmm2
|
||
|
|
||
|
punpcklbw %xmm0, %xmm2
|
||
|
punpcklbw (%rax), %xmm2
|
||
|
|
||
|
punpckldq %xmm0, %xmm2
|
||
|
punpckldq (%rax), %xmm2
|
||
|
|
||
|
punpcklqdq %xmm0, %xmm2
|
||
|
punpcklqdq (%rax), %xmm2
|
||
|
|
||
|
punpcklwd %xmm0, %xmm2
|
||
|
punpcklwd (%rax), %xmm2
|
||
|
|
||
|
pxor %xmm0, %xmm2
|
||
|
pxor (%rax), %xmm2
|
||
|
|
||
|
shufpd $1, %xmm0, %xmm2
|
||
|
shufpd $1, (%rax), %xmm2
|
||
|
|
||
|
sqrtpd %xmm0, %xmm2
|
||
|
sqrtpd (%rax), %xmm2
|
||
|
|
||
|
sqrtsd %xmm0, %xmm2
|
||
|
sqrtsd (%rax), %xmm2
|
||
|
|
||
|
subpd %xmm0, %xmm2
|
||
|
subpd (%rax), %xmm2
|
||
|
|
||
|
subsd %xmm0, %xmm2
|
||
|
subsd (%rax), %xmm2
|
||
|
|
||
|
ucomisd %xmm0, %xmm1
|
||
|
ucomisd (%rax), %xmm1
|
||
|
|
||
|
unpckhpd %xmm0, %xmm2
|
||
|
unpckhpd (%rax), %xmm2
|
||
|
|
||
|
unpcklpd %xmm0, %xmm2
|
||
|
unpcklpd (%rax), %xmm2
|
||
|
|
||
|
xorpd %xmm0, %xmm2
|
||
|
xorpd (%rax), %xmm2
|
||
|
|
||
|
# CHECK: Instruction Info:
|
||
|
# CHECK-NEXT: [1]: #uOps
|
||
|
# CHECK-NEXT: [2]: Latency
|
||
|
# CHECK-NEXT: [3]: RThroughput
|
||
|
# CHECK-NEXT: [4]: MayLoad
|
||
|
# CHECK-NEXT: [5]: MayStore
|
||
|
# CHECK-NEXT: [6]: HasSideEffects (U)
|
||
|
|
||
|
# CHECK: [1] [2] [3] [4] [5] [6] Instructions:
|
||
|
# CHECK-NEXT: 1 6 3.00 addpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 * addpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 addsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 * addsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 andnpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * andnpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 andpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * andpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * * U clflush (%rax)
|
||
|
# CHECK-NEXT: 1 6 3.00 cmpeqpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 * cmpeqpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 cmpeqsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 * cmpeqsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 9 4.50 comisd %xmm0, %xmm1
|
||
|
# CHECK-NEXT: 1 10 5.00 * comisd (%rax), %xmm1
|
||
|
# CHECK-NEXT: 1 7 3.50 cvtdq2pd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 8 4.00 * cvtdq2pd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 6 3.00 cvtdq2ps %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 * cvtdq2ps (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 cvtpd2dq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 8 4.00 * cvtpd2dq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 cvtpd2pi %xmm0, %mm2
|
||
|
# CHECK-NEXT: 1 8 4.00 * cvtpd2pi (%rax), %mm2
|
||
|
# CHECK-NEXT: 1 7 3.50 cvtpd2ps %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 8 4.00 * cvtpd2ps (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 cvtpi2pd %mm0, %xmm2
|
||
|
# CHECK-NEXT: 1 8 4.00 * cvtpi2pd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 6 3.00 cvtps2dq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 * cvtps2dq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 cvtps2pd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 8 4.00 * cvtps2pd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 8 4.00 cvtsd2si %xmm0, %ecx
|
||
|
# CHECK-NEXT: 1 8 4.00 cvtsd2si %xmm0, %rcx
|
||
|
# CHECK-NEXT: 1 9 4.50 * cvtsd2si (%rax), %ecx
|
||
|
# CHECK-NEXT: 1 9 4.50 * cvtsd2si (%rax), %rcx
|
||
|
# CHECK-NEXT: 1 6 3.00 cvtsd2ss %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 * cvtsd2ss (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 6 3.00 cvtsi2sd %ecx, %xmm2
|
||
|
# CHECK-NEXT: 1 6 3.00 cvtsi2sd %rcx, %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 * cvtsi2sdl (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 * cvtsi2sdl (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 6 3.00 cvtss2sd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 * cvtss2sd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 cvttpd2dq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 8 4.00 * cvttpd2dq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 cvttpd2pi %xmm0, %mm2
|
||
|
# CHECK-NEXT: 1 8 4.00 * cvttpd2pi (%rax), %mm2
|
||
|
# CHECK-NEXT: 1 6 3.00 cvttps2dq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 * cvttps2dq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 8 4.00 cvttsd2si %xmm0, %ecx
|
||
|
# CHECK-NEXT: 1 8 4.00 cvttsd2si %xmm0, %rcx
|
||
|
# CHECK-NEXT: 1 9 4.50 * cvttsd2si (%rax), %ecx
|
||
|
# CHECK-NEXT: 1 9 4.50 * cvttsd2si (%rax), %rcx
|
||
|
# CHECK-NEXT: 1 125 62.50 divpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 125 62.50 * divpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 62 31.00 divsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 62 31.00 * divsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 * * U lfence
|
||
|
# CHECK-NEXT: 1 2 1.00 * * U maskmovdqu %xmm0, %xmm1
|
||
|
# CHECK-NEXT: 1 6 3.00 maxpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 * maxpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 maxsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 * maxsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * * U mfence
|
||
|
# CHECK-NEXT: 1 6 3.00 minpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 * minpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 minsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 * minsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 movapd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * movapd %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1 1 1.00 * movapd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 movd %eax, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * movd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 3 3.00 movd %xmm0, %ecx
|
||
|
# CHECK-NEXT: 1 1 1.00 * movd %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1 1 0.50 movdqa %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * movdqa %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1 1 1.00 * movdqa (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 movdqu %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 2 1.00 * movdqu %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1 3 1.50 * movdqu (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 movdq2q %xmm0, %mm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * movhpd %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1 1 1.00 * movhpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * movlpd %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1 1 1.00 * movlpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 3 3.00 movmskpd %xmm0, %ecx
|
||
|
# CHECK-NEXT: 1 1 1.00 * movntil %eax, (%rax)
|
||
|
# CHECK-NEXT: 1 1 1.00 * movntiq %rax, (%rax)
|
||
|
# CHECK-NEXT: 1 1 1.00 * movntdq %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1 1 1.00 * movntpd %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1 1 0.50 movq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 movq %rax, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * movq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 3 3.00 movq %xmm0, %rcx
|
||
|
# CHECK-NEXT: 1 1 1.00 * movq %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1 1 0.50 movq2dq %mm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 movsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * movsd %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1 1 1.00 * movsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 movupd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 2 1.00 * movupd %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1 3 1.50 * movupd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 9 4.50 mulpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 10 5.00 * mulpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 mulsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 * mulsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 orpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * orpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 packssdw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * packssdw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 packsswb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * packsswb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 packuswb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * packuswb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 paddb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * paddb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 paddd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * paddd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 2 1.00 paddq %mm0, %mm2
|
||
|
# CHECK-NEXT: 1 3 1.50 * paddq (%rax), %mm2
|
||
|
# CHECK-NEXT: 1 2 1.00 paddq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 3 1.50 * paddq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 paddsb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * paddsb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 paddsw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * paddsw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 paddusb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * paddusb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 paddusw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * paddusw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 paddw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * paddw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 pand %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pand (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 pandn %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pandn (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 pavgb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pavgb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 pavgw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pavgw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 pcmpeqb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pcmpeqb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 pcmpeqd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pcmpeqd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 pcmpeqw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pcmpeqw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 pcmpgtb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pcmpgtb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 pcmpgtd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pcmpgtd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 pcmpgtw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pcmpgtw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 4 2.00 pextrw $1, %xmm0, %ecx
|
||
|
# CHECK-NEXT: 1 1 1.00 pinsrw $1, %eax, %xmm0
|
||
|
# CHECK-NEXT: 1 1 1.00 * pinsrw $1, (%rax), %xmm0
|
||
|
# CHECK-NEXT: 1 5 5.00 pmaddwd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 * pmaddwd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 pmaxsw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pmaxsw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 pmaxub %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pmaxub (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 pminsw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pminsw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 pminub %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pminub (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 3 3.00 pmovmskb %xmm0, %ecx
|
||
|
# CHECK-NEXT: 1 5 5.00 pmulhuw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 * pmulhuw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 pmulhw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 * pmulhw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 pmullw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 * pmullw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 4 4.00 pmuludq %mm0, %mm2
|
||
|
# CHECK-NEXT: 1 4 4.00 * pmuludq (%rax), %mm2
|
||
|
# CHECK-NEXT: 1 5 5.00 pmuludq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 * pmuludq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 por %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * por (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 psadbw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 * psadbw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 pshufd $1, %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pshufd $1, (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 pshufhw $1, %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pshufhw $1, (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 pshuflw $1, %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pshuflw $1, (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 pslld $1, %xmm2
|
||
|
# CHECK-NEXT: 1 2 1.00 pslld %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 3 1.50 * pslld (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 pslldq $1, %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 psllq $1, %xmm2
|
||
|
# CHECK-NEXT: 1 2 1.00 psllq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 3 1.50 * psllq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 psllw $1, %xmm2
|
||
|
# CHECK-NEXT: 1 2 1.00 psllw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 3 1.50 * psllw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 psrad $1, %xmm2
|
||
|
# CHECK-NEXT: 1 2 1.00 psrad %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 3 1.50 * psrad (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 psraw $1, %xmm2
|
||
|
# CHECK-NEXT: 1 2 1.00 psraw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 3 1.50 * psraw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 psrld $1, %xmm2
|
||
|
# CHECK-NEXT: 1 2 1.00 psrld %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 3 1.50 * psrld (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 psrldq $1, %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 psrlq $1, %xmm2
|
||
|
# CHECK-NEXT: 1 2 1.00 psrlq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 3 1.50 * psrlq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 psrlw $1, %xmm2
|
||
|
# CHECK-NEXT: 1 2 1.00 psrlw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 3 1.50 * psrlw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 psubb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * psubb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 psubd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * psubd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 2 1.00 psubq %mm0, %mm2
|
||
|
# CHECK-NEXT: 1 3 1.50 * psubq (%rax), %mm2
|
||
|
# CHECK-NEXT: 1 2 1.00 psubq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 3 1.50 * psubq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 psubsb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * psubsb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 psubsw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * psubsw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 psubusb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * psubusb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 psubusw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * psubusw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 psubw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * psubw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 punpckhbw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * punpckhbw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 punpckhdq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * punpckhdq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 punpckhqdq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * punpckhqdq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 punpckhwd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * punpckhwd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 punpcklbw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * punpcklbw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 punpckldq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * punpckldq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 punpcklqdq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * punpcklqdq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 punpcklwd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * punpcklwd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 pxor %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * pxor (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 shufpd $1, %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * shufpd $1, (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 125 62.50 sqrtpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 125 62.50 * sqrtpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 62 31.00 sqrtsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 62 31.00 * sqrtsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 6 3.00 subpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 7 3.50 * subpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 subsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 5 5.00 * subsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 9 4.50 ucomisd %xmm0, %xmm1
|
||
|
# CHECK-NEXT: 1 10 5.00 * ucomisd (%rax), %xmm1
|
||
|
# CHECK-NEXT: 1 1 1.00 unpckhpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * unpckhpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 unpcklpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * unpcklpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1 1 0.50 xorpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1 1 1.00 * xorpd (%rax), %xmm2
|
||
|
|
||
|
# CHECK: Resources:
|
||
|
# CHECK-NEXT: [0] - AtomPort0
|
||
|
# CHECK-NEXT: [1] - AtomPort1
|
||
|
|
||
|
# CHECK: Resource pressure per iteration:
|
||
|
# CHECK-NEXT: [0] [1]
|
||
|
# CHECK-NEXT: 871.50 638.50
|
||
|
|
||
|
# CHECK: Resource pressure by instruction:
|
||
|
# CHECK-NEXT: [0] [1] Instructions:
|
||
|
# CHECK-NEXT: 3.00 3.00 addpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 addpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 5.00 - addsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 5.00 - addsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 andnpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - andnpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 andpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - andpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - clflush (%rax)
|
||
|
# CHECK-NEXT: 3.00 3.00 cmpeqpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 cmpeqpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 5.00 - cmpeqsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 5.00 - cmpeqsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 4.50 4.50 comisd %xmm0, %xmm1
|
||
|
# CHECK-NEXT: 5.00 5.00 comisd (%rax), %xmm1
|
||
|
# CHECK-NEXT: 3.50 3.50 cvtdq2pd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 4.00 4.00 cvtdq2pd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 3.00 3.00 cvtdq2ps %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 cvtdq2ps (%rax), %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 cvtpd2dq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 4.00 4.00 cvtpd2dq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 cvtpd2pi %xmm0, %mm2
|
||
|
# CHECK-NEXT: 4.00 4.00 cvtpd2pi (%rax), %mm2
|
||
|
# CHECK-NEXT: 3.50 3.50 cvtpd2ps %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 4.00 4.00 cvtpd2ps (%rax), %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 cvtpi2pd %mm0, %xmm2
|
||
|
# CHECK-NEXT: 4.00 4.00 cvtpi2pd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 3.00 3.00 cvtps2dq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 cvtps2dq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 cvtps2pd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 4.00 4.00 cvtps2pd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 4.00 4.00 cvtsd2si %xmm0, %ecx
|
||
|
# CHECK-NEXT: 4.00 4.00 cvtsd2si %xmm0, %rcx
|
||
|
# CHECK-NEXT: 4.50 4.50 cvtsd2si (%rax), %ecx
|
||
|
# CHECK-NEXT: 4.50 4.50 cvtsd2si (%rax), %rcx
|
||
|
# CHECK-NEXT: 3.00 3.00 cvtsd2ss %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 cvtsd2ss (%rax), %xmm2
|
||
|
# CHECK-NEXT: 3.00 3.00 cvtsi2sd %ecx, %xmm2
|
||
|
# CHECK-NEXT: 3.00 3.00 cvtsi2sd %rcx, %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 cvtsi2sdl (%rax), %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 cvtsi2sdl (%rax), %xmm2
|
||
|
# CHECK-NEXT: 3.00 3.00 cvtss2sd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 cvtss2sd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 cvttpd2dq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 4.00 4.00 cvttpd2dq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 cvttpd2pi %xmm0, %mm2
|
||
|
# CHECK-NEXT: 4.00 4.00 cvttpd2pi (%rax), %mm2
|
||
|
# CHECK-NEXT: 3.00 3.00 cvttps2dq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 cvttps2dq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 4.00 4.00 cvttsd2si %xmm0, %ecx
|
||
|
# CHECK-NEXT: 4.00 4.00 cvttsd2si %xmm0, %rcx
|
||
|
# CHECK-NEXT: 4.50 4.50 cvttsd2si (%rax), %ecx
|
||
|
# CHECK-NEXT: 4.50 4.50 cvttsd2si (%rax), %rcx
|
||
|
# CHECK-NEXT: 62.50 62.50 divpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 62.50 62.50 divpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 31.00 31.00 divsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 31.00 31.00 divsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 lfence
|
||
|
# CHECK-NEXT: 1.00 1.00 maskmovdqu %xmm0, %xmm1
|
||
|
# CHECK-NEXT: 3.00 3.00 maxpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 maxpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 5.00 - maxsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 5.00 - maxsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - mfence
|
||
|
# CHECK-NEXT: 3.00 3.00 minpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 minpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 5.00 - minsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 5.00 - minsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 movapd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - movapd %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1.00 - movapd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - movd %eax, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - movd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 3.00 - movd %xmm0, %ecx
|
||
|
# CHECK-NEXT: 1.00 - movd %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 0.50 0.50 movdqa %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - movdqa %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1.00 - movdqa (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 movdqu %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 1.00 movdqu %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1.50 1.50 movdqu (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 movdq2q %xmm0, %mm2
|
||
|
# CHECK-NEXT: 1.00 - movhpd %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1.00 - movhpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - movlpd %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1.00 - movlpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 3.00 - movmskpd %xmm0, %ecx
|
||
|
# CHECK-NEXT: 1.00 - movntil %eax, (%rax)
|
||
|
# CHECK-NEXT: 1.00 - movntiq %rax, (%rax)
|
||
|
# CHECK-NEXT: 1.00 - movntdq %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1.00 - movntpd %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 0.50 0.50 movq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - movq %rax, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - movq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 3.00 - movq %xmm0, %rcx
|
||
|
# CHECK-NEXT: 1.00 - movq %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 0.50 0.50 movq2dq %mm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - movsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - movsd %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1.00 - movsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 movupd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 1.00 movupd %xmm0, (%rax)
|
||
|
# CHECK-NEXT: 1.50 1.50 movupd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 4.50 4.50 mulpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 5.00 5.00 mulpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 5.00 - mulsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 5.00 - mulsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 orpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - orpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - packssdw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - packssdw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - packsswb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - packsswb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - packuswb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - packuswb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 paddb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - paddb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 paddd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - paddd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 1.00 paddq %mm0, %mm2
|
||
|
# CHECK-NEXT: 1.50 1.50 paddq (%rax), %mm2
|
||
|
# CHECK-NEXT: 1.00 1.00 paddq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.50 1.50 paddq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 paddsb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - paddsb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 paddsw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - paddsw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 paddusb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - paddusb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 paddusw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - paddusw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 paddw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - paddw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 pand %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pand (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 pandn %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pandn (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 pavgb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pavgb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 pavgw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pavgw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 pcmpeqb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pcmpeqb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 pcmpeqd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pcmpeqd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 pcmpeqw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pcmpeqw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 pcmpgtb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pcmpgtb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 pcmpgtd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pcmpgtd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 pcmpgtw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pcmpgtw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 2.00 2.00 pextrw $1, %xmm0, %ecx
|
||
|
# CHECK-NEXT: 1.00 - pinsrw $1, %eax, %xmm0
|
||
|
# CHECK-NEXT: 1.00 - pinsrw $1, (%rax), %xmm0
|
||
|
# CHECK-NEXT: 5.00 - pmaddwd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 5.00 - pmaddwd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 pmaxsw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pmaxsw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 pmaxub %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pmaxub (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 pminsw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pminsw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 pminub %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pminub (%rax), %xmm2
|
||
|
# CHECK-NEXT: 3.00 - pmovmskb %xmm0, %ecx
|
||
|
# CHECK-NEXT: 5.00 - pmulhuw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 5.00 - pmulhuw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 5.00 - pmulhw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 5.00 - pmulhw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 5.00 - pmullw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 5.00 - pmullw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 4.00 - pmuludq %mm0, %mm2
|
||
|
# CHECK-NEXT: 4.00 - pmuludq (%rax), %mm2
|
||
|
# CHECK-NEXT: 5.00 - pmuludq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 5.00 - pmuludq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 por %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - por (%rax), %xmm2
|
||
|
# CHECK-NEXT: 5.00 - psadbw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 5.00 - psadbw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pshufd $1, %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pshufd $1, (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pshufhw $1, %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pshufhw $1, (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pshuflw $1, %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pshuflw $1, (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 pslld $1, %xmm2
|
||
|
# CHECK-NEXT: 1.00 1.00 pslld %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.50 1.50 pslld (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 pslldq $1, %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 psllq $1, %xmm2
|
||
|
# CHECK-NEXT: 1.00 1.00 psllq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.50 1.50 psllq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 psllw $1, %xmm2
|
||
|
# CHECK-NEXT: 1.00 1.00 psllw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.50 1.50 psllw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 psrad $1, %xmm2
|
||
|
# CHECK-NEXT: 1.00 1.00 psrad %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.50 1.50 psrad (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 psraw $1, %xmm2
|
||
|
# CHECK-NEXT: 1.00 1.00 psraw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.50 1.50 psraw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 psrld $1, %xmm2
|
||
|
# CHECK-NEXT: 1.00 1.00 psrld %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.50 1.50 psrld (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 psrldq $1, %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 psrlq $1, %xmm2
|
||
|
# CHECK-NEXT: 1.00 1.00 psrlq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.50 1.50 psrlq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 psrlw $1, %xmm2
|
||
|
# CHECK-NEXT: 1.00 1.00 psrlw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.50 1.50 psrlw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 psubb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - psubb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 psubd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - psubd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 1.00 psubq %mm0, %mm2
|
||
|
# CHECK-NEXT: 1.50 1.50 psubq (%rax), %mm2
|
||
|
# CHECK-NEXT: 1.00 1.00 psubq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.50 1.50 psubq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 psubsb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - psubsb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 psubsw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - psubsw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 psubusb %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - psubusb (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 psubusw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - psubusw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 psubw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - psubw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - punpckhbw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - punpckhbw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - punpckhdq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - punpckhdq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - punpckhqdq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - punpckhqdq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - punpckhwd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - punpckhwd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - punpcklbw %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - punpcklbw (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - punpckldq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - punpckldq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - punpcklqdq %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - punpcklqdq (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - punpcklwd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - punpcklwd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 pxor %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - pxor (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - shufpd $1, %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - shufpd $1, (%rax), %xmm2
|
||
|
# CHECK-NEXT: 62.50 62.50 sqrtpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 62.50 62.50 sqrtpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 31.00 31.00 sqrtsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 31.00 31.00 sqrtsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 3.00 3.00 subpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 3.50 3.50 subpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 5.00 - subsd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 5.00 - subsd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 4.50 4.50 ucomisd %xmm0, %xmm1
|
||
|
# CHECK-NEXT: 5.00 5.00 ucomisd (%rax), %xmm1
|
||
|
# CHECK-NEXT: 1.00 - unpckhpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - unpckhpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 1.00 - unpcklpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - unpcklpd (%rax), %xmm2
|
||
|
# CHECK-NEXT: 0.50 0.50 xorpd %xmm0, %xmm2
|
||
|
# CHECK-NEXT: 1.00 - xorpd (%rax), %xmm2
|