target/arm: Convert ADDP to decodetree
Reviewed-by: Peter Maydell <peter.maydell@linaro.org> Signed-off-by: Richard Henderson <richard.henderson@linaro.org> Message-id: 20240524232121.284515-32-richard.henderson@linaro.org Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
This commit is contained in:
parent
c43a23e1aa
commit
a7e4eec6fb
@ -1061,6 +1061,11 @@ DEF_HELPER_FLAGS_5(gvec_fminnump_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i
|
|||||||
DEF_HELPER_FLAGS_5(gvec_fminnump_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
|
DEF_HELPER_FLAGS_5(gvec_fminnump_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
|
||||||
DEF_HELPER_FLAGS_5(gvec_fminnump_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
|
DEF_HELPER_FLAGS_5(gvec_fminnump_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
|
||||||
|
|
||||||
|
DEF_HELPER_FLAGS_4(gvec_addp_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||||
|
DEF_HELPER_FLAGS_4(gvec_addp_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||||
|
DEF_HELPER_FLAGS_4(gvec_addp_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||||
|
DEF_HELPER_FLAGS_4(gvec_addp_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||||
|
|
||||||
#ifdef TARGET_AARCH64
|
#ifdef TARGET_AARCH64
|
||||||
#include "tcg/helper-a64.h"
|
#include "tcg/helper-a64.h"
|
||||||
#include "tcg/helper-sve.h"
|
#include "tcg/helper-sve.h"
|
||||||
|
@ -38,6 +38,7 @@
|
|||||||
&qrrrr_e q rd rn rm ra esz
|
&qrrrr_e q rd rn rm ra esz
|
||||||
|
|
||||||
@rr_h ........ ... ..... ...... rn:5 rd:5 &rr_e esz=1
|
@rr_h ........ ... ..... ...... rn:5 rd:5 &rr_e esz=1
|
||||||
|
@rr_d ........ ... ..... ...... rn:5 rd:5 &rr_e esz=3
|
||||||
@rr_sd ........ ... ..... ...... rn:5 rd:5 &rr_e esz=%esz_sd
|
@rr_sd ........ ... ..... ...... rn:5 rd:5 &rr_e esz=%esz_sd
|
||||||
|
|
||||||
@rrr_h ........ ... rm:5 ...... rn:5 rd:5 &rrr_e esz=1
|
@rrr_h ........ ... rm:5 ...... rn:5 rd:5 &rrr_e esz=1
|
||||||
@ -56,6 +57,7 @@
|
|||||||
|
|
||||||
@qrrr_h . q:1 ...... ... rm:5 ...... rn:5 rd:5 &qrrr_e esz=1
|
@qrrr_h . q:1 ...... ... rm:5 ...... rn:5 rd:5 &qrrr_e esz=1
|
||||||
@qrrr_sd . q:1 ...... ... rm:5 ...... rn:5 rd:5 &qrrr_e esz=%esz_sd
|
@qrrr_sd . q:1 ...... ... rm:5 ...... rn:5 rd:5 &qrrr_e esz=%esz_sd
|
||||||
|
@qrrr_e . q:1 ...... esz:2 . rm:5 ...... rn:5 rd:5 &qrrr_e
|
||||||
|
|
||||||
@qrrx_h . q:1 .. .... .. .. rm:4 .... . . rn:5 rd:5 \
|
@qrrx_h . q:1 .. .... .. .. rm:4 .... . . rn:5 rd:5 \
|
||||||
&qrrx_e esz=1 idx=%hlm
|
&qrrx_e esz=1 idx=%hlm
|
||||||
@ -758,6 +760,8 @@ FMAXNMP_s 0111 1110 0.11 0000 1100 10 ..... ..... @rr_sd
|
|||||||
FMINNMP_s 0101 1110 1011 0000 1100 10 ..... ..... @rr_h
|
FMINNMP_s 0101 1110 1011 0000 1100 10 ..... ..... @rr_h
|
||||||
FMINNMP_s 0111 1110 1.11 0000 1100 10 ..... ..... @rr_sd
|
FMINNMP_s 0111 1110 1.11 0000 1100 10 ..... ..... @rr_sd
|
||||||
|
|
||||||
|
ADDP_s 0101 1110 1111 0001 1011 10 ..... ..... @rr_d
|
||||||
|
|
||||||
### Advanced SIMD three same
|
### Advanced SIMD three same
|
||||||
|
|
||||||
FADD_v 0.00 1110 010 ..... 00010 1 ..... ..... @qrrr_h
|
FADD_v 0.00 1110 010 ..... 00010 1 ..... ..... @qrrr_h
|
||||||
@ -832,6 +836,8 @@ FMAXNMP_v 0.10 1110 0.1 ..... 11000 1 ..... ..... @qrrr_sd
|
|||||||
FMINNMP_v 0.10 1110 110 ..... 00000 1 ..... ..... @qrrr_h
|
FMINNMP_v 0.10 1110 110 ..... 00000 1 ..... ..... @qrrr_h
|
||||||
FMINNMP_v 0.10 1110 1.1 ..... 11000 1 ..... ..... @qrrr_sd
|
FMINNMP_v 0.10 1110 1.1 ..... 11000 1 ..... ..... @qrrr_sd
|
||||||
|
|
||||||
|
ADDP_v 0.00 1110 ..1 ..... 10111 1 ..... ..... @qrrr_e
|
||||||
|
|
||||||
### Advanced SIMD scalar x indexed element
|
### Advanced SIMD scalar x indexed element
|
||||||
|
|
||||||
FMUL_si 0101 1111 00 .. .... 1001 . 0 ..... ..... @rrx_h
|
FMUL_si 0101 1111 00 .. .... 1001 . 0 ..... ..... @rrx_h
|
||||||
|
@ -1610,3 +1610,15 @@ void gen_gvec_uaba(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
|||||||
};
|
};
|
||||||
tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
|
tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
|
||||||
}
|
}
|
||||||
|
|
||||||
|
void gen_gvec_addp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
||||||
|
uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
|
||||||
|
{
|
||||||
|
static gen_helper_gvec_3 * const fns[4] = {
|
||||||
|
gen_helper_gvec_addp_b,
|
||||||
|
gen_helper_gvec_addp_h,
|
||||||
|
gen_helper_gvec_addp_s,
|
||||||
|
gen_helper_gvec_addp_d,
|
||||||
|
};
|
||||||
|
tcg_gen_gvec_3_ool(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, 0, fns[vece]);
|
||||||
|
}
|
||||||
|
@ -5245,6 +5245,8 @@ static gen_helper_gvec_3_ptr * const f_vector_fminnmp[3] = {
|
|||||||
};
|
};
|
||||||
TRANS(FMINNMP_v, do_fp3_vector, a, f_vector_fminnmp)
|
TRANS(FMINNMP_v, do_fp3_vector, a, f_vector_fminnmp)
|
||||||
|
|
||||||
|
TRANS(ADDP_v, do_gvec_fn3, a, gen_gvec_addp)
|
||||||
|
|
||||||
/*
|
/*
|
||||||
* Advanced SIMD scalar/vector x indexed element
|
* Advanced SIMD scalar/vector x indexed element
|
||||||
*/
|
*/
|
||||||
@ -5485,6 +5487,20 @@ TRANS(FMINP_s, do_fp3_scalar_pair, a, &f_scalar_fmin)
|
|||||||
TRANS(FMAXNMP_s, do_fp3_scalar_pair, a, &f_scalar_fmaxnm)
|
TRANS(FMAXNMP_s, do_fp3_scalar_pair, a, &f_scalar_fmaxnm)
|
||||||
TRANS(FMINNMP_s, do_fp3_scalar_pair, a, &f_scalar_fminnm)
|
TRANS(FMINNMP_s, do_fp3_scalar_pair, a, &f_scalar_fminnm)
|
||||||
|
|
||||||
|
static bool trans_ADDP_s(DisasContext *s, arg_rr_e *a)
|
||||||
|
{
|
||||||
|
if (fp_access_check(s)) {
|
||||||
|
TCGv_i64 t0 = tcg_temp_new_i64();
|
||||||
|
TCGv_i64 t1 = tcg_temp_new_i64();
|
||||||
|
|
||||||
|
read_vec_element(s, t0, a->rn, 0, MO_64);
|
||||||
|
read_vec_element(s, t1, a->rn, 1, MO_64);
|
||||||
|
tcg_gen_add_i64(t0, t0, t1);
|
||||||
|
write_fp_dreg(s, a->rd, t0);
|
||||||
|
}
|
||||||
|
return true;
|
||||||
|
}
|
||||||
|
|
||||||
/* Shift a TCGv src by TCGv shift_amount, put result in dst.
|
/* Shift a TCGv src by TCGv shift_amount, put result in dst.
|
||||||
* Note that it is the caller's responsibility to ensure that the
|
* Note that it is the caller's responsibility to ensure that the
|
||||||
* shift amount is in range (ie 0..31 or 0..63) and provide the ARM
|
* shift amount is in range (ie 0..31 or 0..63) and provide the ARM
|
||||||
@ -8412,73 +8428,6 @@ static void disas_simd_mod_imm(DisasContext *s, uint32_t insn)
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
/* AdvSIMD scalar pairwise
|
|
||||||
* 31 30 29 28 24 23 22 21 17 16 12 11 10 9 5 4 0
|
|
||||||
* +-----+---+-----------+------+-----------+--------+-----+------+------+
|
|
||||||
* | 0 1 | U | 1 1 1 1 0 | size | 1 1 0 0 0 | opcode | 1 0 | Rn | Rd |
|
|
||||||
* +-----+---+-----------+------+-----------+--------+-----+------+------+
|
|
||||||
*/
|
|
||||||
static void disas_simd_scalar_pairwise(DisasContext *s, uint32_t insn)
|
|
||||||
{
|
|
||||||
int u = extract32(insn, 29, 1);
|
|
||||||
int size = extract32(insn, 22, 2);
|
|
||||||
int opcode = extract32(insn, 12, 5);
|
|
||||||
int rn = extract32(insn, 5, 5);
|
|
||||||
int rd = extract32(insn, 0, 5);
|
|
||||||
|
|
||||||
/* For some ops (the FP ones), size[1] is part of the encoding.
|
|
||||||
* For ADDP strictly it is not but size[1] is always 1 for valid
|
|
||||||
* encodings.
|
|
||||||
*/
|
|
||||||
opcode |= (extract32(size, 1, 1) << 5);
|
|
||||||
|
|
||||||
switch (opcode) {
|
|
||||||
case 0x3b: /* ADDP */
|
|
||||||
if (u || size != 3) {
|
|
||||||
unallocated_encoding(s);
|
|
||||||
return;
|
|
||||||
}
|
|
||||||
if (!fp_access_check(s)) {
|
|
||||||
return;
|
|
||||||
}
|
|
||||||
break;
|
|
||||||
default:
|
|
||||||
case 0xc: /* FMAXNMP */
|
|
||||||
case 0xd: /* FADDP */
|
|
||||||
case 0xf: /* FMAXP */
|
|
||||||
case 0x2c: /* FMINNMP */
|
|
||||||
case 0x2f: /* FMINP */
|
|
||||||
unallocated_encoding(s);
|
|
||||||
return;
|
|
||||||
}
|
|
||||||
|
|
||||||
if (size == MO_64) {
|
|
||||||
TCGv_i64 tcg_op1 = tcg_temp_new_i64();
|
|
||||||
TCGv_i64 tcg_op2 = tcg_temp_new_i64();
|
|
||||||
TCGv_i64 tcg_res = tcg_temp_new_i64();
|
|
||||||
|
|
||||||
read_vec_element(s, tcg_op1, rn, 0, MO_64);
|
|
||||||
read_vec_element(s, tcg_op2, rn, 1, MO_64);
|
|
||||||
|
|
||||||
switch (opcode) {
|
|
||||||
case 0x3b: /* ADDP */
|
|
||||||
tcg_gen_add_i64(tcg_res, tcg_op1, tcg_op2);
|
|
||||||
break;
|
|
||||||
default:
|
|
||||||
case 0xc: /* FMAXNMP */
|
|
||||||
case 0xd: /* FADDP */
|
|
||||||
case 0xf: /* FMAXP */
|
|
||||||
case 0x2c: /* FMINNMP */
|
|
||||||
case 0x2f: /* FMINP */
|
|
||||||
g_assert_not_reached();
|
|
||||||
}
|
|
||||||
|
|
||||||
write_fp_dreg(s, rd, tcg_res);
|
|
||||||
} else {
|
|
||||||
g_assert_not_reached();
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
/*
|
/*
|
||||||
* Common SSHR[RA]/USHR[RA] - Shift right (optional rounding/accumulate)
|
* Common SSHR[RA]/USHR[RA] - Shift right (optional rounding/accumulate)
|
||||||
*
|
*
|
||||||
@ -10965,34 +10914,7 @@ static void handle_simd_3same_pair(DisasContext *s, int is_q, int u, int opcode,
|
|||||||
* adjacent elements being operated on to produce an element in the result.
|
* adjacent elements being operated on to produce an element in the result.
|
||||||
*/
|
*/
|
||||||
if (size == 3) {
|
if (size == 3) {
|
||||||
TCGv_i64 tcg_res[2];
|
g_assert_not_reached();
|
||||||
|
|
||||||
for (pass = 0; pass < 2; pass++) {
|
|
||||||
TCGv_i64 tcg_op1 = tcg_temp_new_i64();
|
|
||||||
TCGv_i64 tcg_op2 = tcg_temp_new_i64();
|
|
||||||
int passreg = (pass == 0) ? rn : rm;
|
|
||||||
|
|
||||||
read_vec_element(s, tcg_op1, passreg, 0, MO_64);
|
|
||||||
read_vec_element(s, tcg_op2, passreg, 1, MO_64);
|
|
||||||
tcg_res[pass] = tcg_temp_new_i64();
|
|
||||||
|
|
||||||
switch (opcode) {
|
|
||||||
case 0x17: /* ADDP */
|
|
||||||
tcg_gen_add_i64(tcg_res[pass], tcg_op1, tcg_op2);
|
|
||||||
break;
|
|
||||||
default:
|
|
||||||
case 0x58: /* FMAXNMP */
|
|
||||||
case 0x5a: /* FADDP */
|
|
||||||
case 0x5e: /* FMAXP */
|
|
||||||
case 0x78: /* FMINNMP */
|
|
||||||
case 0x7e: /* FMINP */
|
|
||||||
g_assert_not_reached();
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
for (pass = 0; pass < 2; pass++) {
|
|
||||||
write_vec_element(s, tcg_res[pass], rd, pass, MO_64);
|
|
||||||
}
|
|
||||||
} else {
|
} else {
|
||||||
int maxpass = is_q ? 4 : 2;
|
int maxpass = is_q ? 4 : 2;
|
||||||
TCGv_i32 tcg_res[4];
|
TCGv_i32 tcg_res[4];
|
||||||
@ -11009,16 +10931,6 @@ static void handle_simd_3same_pair(DisasContext *s, int is_q, int u, int opcode,
|
|||||||
tcg_res[pass] = tcg_temp_new_i32();
|
tcg_res[pass] = tcg_temp_new_i32();
|
||||||
|
|
||||||
switch (opcode) {
|
switch (opcode) {
|
||||||
case 0x17: /* ADDP */
|
|
||||||
{
|
|
||||||
static NeonGenTwoOpFn * const fns[3] = {
|
|
||||||
gen_helper_neon_padd_u8,
|
|
||||||
gen_helper_neon_padd_u16,
|
|
||||||
tcg_gen_add_i32,
|
|
||||||
};
|
|
||||||
genfn = fns[size];
|
|
||||||
break;
|
|
||||||
}
|
|
||||||
case 0x14: /* SMAXP, UMAXP */
|
case 0x14: /* SMAXP, UMAXP */
|
||||||
{
|
{
|
||||||
static NeonGenTwoOpFn * const fns[3][2] = {
|
static NeonGenTwoOpFn * const fns[3][2] = {
|
||||||
@ -11040,6 +10952,7 @@ static void handle_simd_3same_pair(DisasContext *s, int is_q, int u, int opcode,
|
|||||||
break;
|
break;
|
||||||
}
|
}
|
||||||
default:
|
default:
|
||||||
|
case 0x17: /* ADDP */
|
||||||
case 0x58: /* FMAXNMP */
|
case 0x58: /* FMAXNMP */
|
||||||
case 0x5a: /* FADDP */
|
case 0x5a: /* FADDP */
|
||||||
case 0x5e: /* FMAXP */
|
case 0x5e: /* FMAXP */
|
||||||
@ -11401,7 +11314,6 @@ static void disas_simd_three_reg_same(DisasContext *s, uint32_t insn)
|
|||||||
case 0x3: /* logic ops */
|
case 0x3: /* logic ops */
|
||||||
disas_simd_3same_logic(s, insn);
|
disas_simd_3same_logic(s, insn);
|
||||||
break;
|
break;
|
||||||
case 0x17: /* ADDP */
|
|
||||||
case 0x14: /* SMAXP, UMAXP */
|
case 0x14: /* SMAXP, UMAXP */
|
||||||
case 0x15: /* SMINP, UMINP */
|
case 0x15: /* SMINP, UMINP */
|
||||||
{
|
{
|
||||||
@ -11433,6 +11345,9 @@ static void disas_simd_three_reg_same(DisasContext *s, uint32_t insn)
|
|||||||
default:
|
default:
|
||||||
disas_simd_3same_int(s, insn);
|
disas_simd_3same_int(s, insn);
|
||||||
break;
|
break;
|
||||||
|
case 0x17: /* ADDP */
|
||||||
|
unallocated_encoding(s);
|
||||||
|
break;
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
@ -13195,7 +13110,6 @@ static const AArch64DecodeTable data_proc_simd[] = {
|
|||||||
{ 0x5e008400, 0xdf208400, disas_simd_scalar_three_reg_same_extra },
|
{ 0x5e008400, 0xdf208400, disas_simd_scalar_three_reg_same_extra },
|
||||||
{ 0x5e200000, 0xdf200c00, disas_simd_scalar_three_reg_diff },
|
{ 0x5e200000, 0xdf200c00, disas_simd_scalar_three_reg_diff },
|
||||||
{ 0x5e200800, 0xdf3e0c00, disas_simd_scalar_two_reg_misc },
|
{ 0x5e200800, 0xdf3e0c00, disas_simd_scalar_two_reg_misc },
|
||||||
{ 0x5e300800, 0xdf3e0c00, disas_simd_scalar_pairwise },
|
|
||||||
{ 0x5f000000, 0xdf000400, disas_simd_indexed }, /* scalar indexed */
|
{ 0x5f000000, 0xdf000400, disas_simd_indexed }, /* scalar indexed */
|
||||||
{ 0x5f000400, 0xdf800400, disas_simd_scalar_shift_imm },
|
{ 0x5f000400, 0xdf800400, disas_simd_scalar_shift_imm },
|
||||||
{ 0x0e780800, 0x8f7e0c00, disas_simd_two_reg_misc_fp16 },
|
{ 0x0e780800, 0x8f7e0c00, disas_simd_two_reg_misc_fp16 },
|
||||||
|
@ -514,6 +514,9 @@ void gen_gvec_saba(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
|||||||
void gen_gvec_uaba(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
void gen_gvec_uaba(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
||||||
uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
|
uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
|
||||||
|
|
||||||
|
void gen_gvec_addp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
||||||
|
uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
|
||||||
|
|
||||||
/*
|
/*
|
||||||
* Forward to the isar_feature_* tests given a DisasContext pointer.
|
* Forward to the isar_feature_* tests given a DisasContext pointer.
|
||||||
*/
|
*/
|
||||||
|
@ -2231,6 +2231,36 @@ DO_3OP_PAIR(gvec_fminnump_h, float16_minnum, float16, H2)
|
|||||||
DO_3OP_PAIR(gvec_fminnump_s, float32_minnum, float32, H4)
|
DO_3OP_PAIR(gvec_fminnump_s, float32_minnum, float32, H4)
|
||||||
DO_3OP_PAIR(gvec_fminnump_d, float64_minnum, float64, )
|
DO_3OP_PAIR(gvec_fminnump_d, float64_minnum, float64, )
|
||||||
|
|
||||||
|
#undef DO_3OP_PAIR
|
||||||
|
|
||||||
|
#define DO_3OP_PAIR(NAME, FUNC, TYPE, H) \
|
||||||
|
void HELPER(NAME)(void *vd, void *vn, void *vm, uint32_t desc) \
|
||||||
|
{ \
|
||||||
|
ARMVectorReg scratch; \
|
||||||
|
intptr_t oprsz = simd_oprsz(desc); \
|
||||||
|
intptr_t half = oprsz / sizeof(TYPE) / 2; \
|
||||||
|
TYPE *d = vd, *n = vn, *m = vm; \
|
||||||
|
if (unlikely(d == m)) { \
|
||||||
|
m = memcpy(&scratch, m, oprsz); \
|
||||||
|
} \
|
||||||
|
for (intptr_t i = 0; i < half; ++i) { \
|
||||||
|
d[H(i)] = FUNC(n[H(i * 2)], n[H(i * 2 + 1)]); \
|
||||||
|
} \
|
||||||
|
for (intptr_t i = 0; i < half; ++i) { \
|
||||||
|
d[H(i + half)] = FUNC(m[H(i * 2)], m[H(i * 2 + 1)]); \
|
||||||
|
} \
|
||||||
|
clear_tail(d, oprsz, simd_maxsz(desc)); \
|
||||||
|
}
|
||||||
|
|
||||||
|
#define ADD(A, B) (A + B)
|
||||||
|
DO_3OP_PAIR(gvec_addp_b, ADD, uint8_t, H1)
|
||||||
|
DO_3OP_PAIR(gvec_addp_h, ADD, uint16_t, H2)
|
||||||
|
DO_3OP_PAIR(gvec_addp_s, ADD, uint32_t, H4)
|
||||||
|
DO_3OP_PAIR(gvec_addp_d, ADD, uint64_t, )
|
||||||
|
#undef ADD
|
||||||
|
|
||||||
|
#undef DO_3OP_PAIR
|
||||||
|
|
||||||
#define DO_VCVT_FIXED(NAME, FUNC, TYPE) \
|
#define DO_VCVT_FIXED(NAME, FUNC, TYPE) \
|
||||||
void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc) \
|
void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc) \
|
||||||
{ \
|
{ \
|
||||||
|
Loading…
x
Reference in New Issue
Block a user