target/arm: Introduce gen_gvec_rev{16,32,64}
Reviewed-by: Peter Maydell <peter.maydell@linaro.org> Signed-off-by: Richard Henderson <richard.henderson@linaro.org> Message-id: 20241211163036.2297116-43-richard.henderson@linaro.org Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
This commit is contained in:
parent
72040d9200
commit
38f9950c8e
@ -2409,3 +2409,61 @@ void gen_gvec_rbit(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
|||||||
tcg_gen_gvec_2_ool(rd_ofs, rn_ofs, opr_sz, max_sz, 0,
|
tcg_gen_gvec_2_ool(rd_ofs, rn_ofs, opr_sz, max_sz, 0,
|
||||||
gen_helper_gvec_rbit_b);
|
gen_helper_gvec_rbit_b);
|
||||||
}
|
}
|
||||||
|
|
||||||
|
void gen_gvec_rev16(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
||||||
|
uint32_t opr_sz, uint32_t max_sz)
|
||||||
|
{
|
||||||
|
assert(vece == MO_8);
|
||||||
|
tcg_gen_gvec_rotli(MO_16, rd_ofs, rn_ofs, 8, opr_sz, max_sz);
|
||||||
|
}
|
||||||
|
|
||||||
|
static void gen_bswap32_i64(TCGv_i64 d, TCGv_i64 n)
|
||||||
|
{
|
||||||
|
tcg_gen_bswap64_i64(d, n);
|
||||||
|
tcg_gen_rotli_i64(d, d, 32);
|
||||||
|
}
|
||||||
|
|
||||||
|
void gen_gvec_rev32(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
||||||
|
uint32_t opr_sz, uint32_t max_sz)
|
||||||
|
{
|
||||||
|
static const GVecGen2 g = {
|
||||||
|
.fni8 = gen_bswap32_i64,
|
||||||
|
.fni4 = tcg_gen_bswap32_i32,
|
||||||
|
.prefer_i64 = TCG_TARGET_REG_BITS == 64,
|
||||||
|
.vece = MO_32
|
||||||
|
};
|
||||||
|
|
||||||
|
switch (vece) {
|
||||||
|
case MO_16:
|
||||||
|
tcg_gen_gvec_rotli(MO_32, rd_ofs, rn_ofs, 16, opr_sz, max_sz);
|
||||||
|
break;
|
||||||
|
case MO_8:
|
||||||
|
tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g);
|
||||||
|
break;
|
||||||
|
default:
|
||||||
|
g_assert_not_reached();
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
void gen_gvec_rev64(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
||||||
|
uint32_t opr_sz, uint32_t max_sz)
|
||||||
|
{
|
||||||
|
static const GVecGen2 g[] = {
|
||||||
|
{ .fni8 = tcg_gen_bswap64_i64,
|
||||||
|
.vece = MO_64 },
|
||||||
|
{ .fni8 = tcg_gen_hswap_i64,
|
||||||
|
.vece = MO_64 },
|
||||||
|
};
|
||||||
|
|
||||||
|
switch (vece) {
|
||||||
|
case MO_32:
|
||||||
|
tcg_gen_gvec_rotli(MO_64, rd_ofs, rn_ofs, 32, opr_sz, max_sz);
|
||||||
|
break;
|
||||||
|
case MO_8:
|
||||||
|
case MO_16:
|
||||||
|
tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
|
||||||
|
break;
|
||||||
|
default:
|
||||||
|
g_assert_not_reached();
|
||||||
|
}
|
||||||
|
}
|
||||||
|
@ -2565,58 +2565,6 @@ static bool trans_VDUP_scalar(DisasContext *s, arg_VDUP_scalar *a)
|
|||||||
return true;
|
return true;
|
||||||
}
|
}
|
||||||
|
|
||||||
static bool trans_VREV64(DisasContext *s, arg_VREV64 *a)
|
|
||||||
{
|
|
||||||
int pass, half;
|
|
||||||
TCGv_i32 tmp[2];
|
|
||||||
|
|
||||||
if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
|
|
||||||
return false;
|
|
||||||
}
|
|
||||||
|
|
||||||
/* UNDEF accesses to D16-D31 if they don't exist. */
|
|
||||||
if (!dc_isar_feature(aa32_simd_r32, s) &&
|
|
||||||
((a->vd | a->vm) & 0x10)) {
|
|
||||||
return false;
|
|
||||||
}
|
|
||||||
|
|
||||||
if ((a->vd | a->vm) & a->q) {
|
|
||||||
return false;
|
|
||||||
}
|
|
||||||
|
|
||||||
if (a->size == 3) {
|
|
||||||
return false;
|
|
||||||
}
|
|
||||||
|
|
||||||
if (!vfp_access_check(s)) {
|
|
||||||
return true;
|
|
||||||
}
|
|
||||||
|
|
||||||
tmp[0] = tcg_temp_new_i32();
|
|
||||||
tmp[1] = tcg_temp_new_i32();
|
|
||||||
|
|
||||||
for (pass = 0; pass < (a->q ? 2 : 1); pass++) {
|
|
||||||
for (half = 0; half < 2; half++) {
|
|
||||||
read_neon_element32(tmp[half], a->vm, pass * 2 + half, MO_32);
|
|
||||||
switch (a->size) {
|
|
||||||
case 0:
|
|
||||||
tcg_gen_bswap32_i32(tmp[half], tmp[half]);
|
|
||||||
break;
|
|
||||||
case 1:
|
|
||||||
gen_swap_half(tmp[half], tmp[half]);
|
|
||||||
break;
|
|
||||||
case 2:
|
|
||||||
break;
|
|
||||||
default:
|
|
||||||
g_assert_not_reached();
|
|
||||||
}
|
|
||||||
}
|
|
||||||
write_neon_element32(tmp[1], a->vd, pass * 2, MO_32);
|
|
||||||
write_neon_element32(tmp[0], a->vd, pass * 2 + 1, MO_32);
|
|
||||||
}
|
|
||||||
return true;
|
|
||||||
}
|
|
||||||
|
|
||||||
static bool do_2misc_pairwise(DisasContext *s, arg_2misc *a,
|
static bool do_2misc_pairwise(DisasContext *s, arg_2misc *a,
|
||||||
NeonGenWidenFn *widenfn,
|
NeonGenWidenFn *widenfn,
|
||||||
NeonGenTwo64OpFn *opfn,
|
NeonGenTwo64OpFn *opfn,
|
||||||
@ -3122,6 +3070,7 @@ DO_2MISC_VEC(VCGE0, gen_gvec_cge0)
|
|||||||
DO_2MISC_VEC(VCLT0, gen_gvec_clt0)
|
DO_2MISC_VEC(VCLT0, gen_gvec_clt0)
|
||||||
DO_2MISC_VEC(VCLS, gen_gvec_cls)
|
DO_2MISC_VEC(VCLS, gen_gvec_cls)
|
||||||
DO_2MISC_VEC(VCLZ, gen_gvec_clz)
|
DO_2MISC_VEC(VCLZ, gen_gvec_clz)
|
||||||
|
DO_2MISC_VEC(VREV64, gen_gvec_rev64)
|
||||||
|
|
||||||
static bool trans_VMVN(DisasContext *s, arg_2misc *a)
|
static bool trans_VMVN(DisasContext *s, arg_2misc *a)
|
||||||
{
|
{
|
||||||
@ -3139,6 +3088,22 @@ static bool trans_VCNT(DisasContext *s, arg_2misc *a)
|
|||||||
return do_2misc_vec(s, a, gen_gvec_cnt);
|
return do_2misc_vec(s, a, gen_gvec_cnt);
|
||||||
}
|
}
|
||||||
|
|
||||||
|
static bool trans_VREV16(DisasContext *s, arg_2misc *a)
|
||||||
|
{
|
||||||
|
if (a->size != 0) {
|
||||||
|
return false;
|
||||||
|
}
|
||||||
|
return do_2misc_vec(s, a, gen_gvec_rev16);
|
||||||
|
}
|
||||||
|
|
||||||
|
static bool trans_VREV32(DisasContext *s, arg_2misc *a)
|
||||||
|
{
|
||||||
|
if (a->size != 0 && a->size != 1) {
|
||||||
|
return false;
|
||||||
|
}
|
||||||
|
return do_2misc_vec(s, a, gen_gvec_rev32);
|
||||||
|
}
|
||||||
|
|
||||||
#define WRAP_2M_3_OOL_FN(WRAPNAME, FUNC, DATA) \
|
#define WRAP_2M_3_OOL_FN(WRAPNAME, FUNC, DATA) \
|
||||||
static void WRAPNAME(unsigned vece, uint32_t rd_ofs, \
|
static void WRAPNAME(unsigned vece, uint32_t rd_ofs, \
|
||||||
uint32_t rm_ofs, uint32_t oprsz, \
|
uint32_t rm_ofs, uint32_t oprsz, \
|
||||||
@ -3218,25 +3183,6 @@ static bool do_2misc(DisasContext *s, arg_2misc *a, NeonGenOneOpFn *fn)
|
|||||||
return true;
|
return true;
|
||||||
}
|
}
|
||||||
|
|
||||||
static bool trans_VREV32(DisasContext *s, arg_2misc *a)
|
|
||||||
{
|
|
||||||
static NeonGenOneOpFn * const fn[] = {
|
|
||||||
tcg_gen_bswap32_i32,
|
|
||||||
gen_swap_half,
|
|
||||||
NULL,
|
|
||||||
NULL,
|
|
||||||
};
|
|
||||||
return do_2misc(s, a, fn[a->size]);
|
|
||||||
}
|
|
||||||
|
|
||||||
static bool trans_VREV16(DisasContext *s, arg_2misc *a)
|
|
||||||
{
|
|
||||||
if (a->size != 0) {
|
|
||||||
return false;
|
|
||||||
}
|
|
||||||
return do_2misc(s, a, gen_rev16);
|
|
||||||
}
|
|
||||||
|
|
||||||
static void gen_VABS_F(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
|
static void gen_VABS_F(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
|
||||||
uint32_t oprsz, uint32_t maxsz)
|
uint32_t oprsz, uint32_t maxsz)
|
||||||
{
|
{
|
||||||
|
@ -586,6 +586,12 @@ void gen_gvec_cnt(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
|||||||
uint32_t opr_sz, uint32_t max_sz);
|
uint32_t opr_sz, uint32_t max_sz);
|
||||||
void gen_gvec_rbit(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
void gen_gvec_rbit(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
||||||
uint32_t opr_sz, uint32_t max_sz);
|
uint32_t opr_sz, uint32_t max_sz);
|
||||||
|
void gen_gvec_rev16(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
||||||
|
uint32_t opr_sz, uint32_t max_sz);
|
||||||
|
void gen_gvec_rev32(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
||||||
|
uint32_t opr_sz, uint32_t max_sz);
|
||||||
|
void gen_gvec_rev64(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
||||||
|
uint32_t opr_sz, uint32_t max_sz);
|
||||||
|
|
||||||
/*
|
/*
|
||||||
* Forward to the isar_feature_* tests given a DisasContext pointer.
|
* Forward to the isar_feature_* tests given a DisasContext pointer.
|
||||||
|
Loading…
x
Reference in New Issue
Block a user