target/sparc: Remove CC_OP_ADD, CC_OP_ADDX, CC_OP_TADD

These are all related and implementable with common code. Tested-by: Mark Cave-Ayland <mark.cave-ayland@ilande.co.uk> Acked-by: Mark Cave-Ayland <mark.cave-ayland@ilande.co.uk> Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
2023-10-14 21:03:26 -07:00 · 2023-10-14 21:03:26 -07:00 · b989ce736e
commit b989ce736e
parent 1326010322
3 changed files with 87 additions and 255 deletions
--- a/target/sparc/cc_helper.c
+++ b/target/sparc/cc_helper.c
@ -57,28 +57,6 @@ static inline uint32_t get_C_add_icc(uint32_t dst, uint32_t src1)
    return ret;
 }
 static inline uint32_t get_C_addx_icc(uint32_t dst, uint32_t src1,
                                      uint32_t src2)
 {
    uint32_t ret = 0;
    if (((src1 & src2) | (~dst & (src1 | src2))) & (1U << 31)) {
        ret = PSR_CARRY;
    }
    return ret;
 }
 static inline uint32_t get_V_add_icc(uint32_t dst, uint32_t src1,
                                     uint32_t src2)
 {
    uint32_t ret = 0;
    if (((src1 ^ src2 ^ -1) & (src1 ^ dst)) & (1U << 31)) {
        ret = PSR_OVF;
    }
    return ret;
 }
 #ifdef TARGET_SPARC64
 static inline uint32_t get_C_add_xcc(target_ulong dst, target_ulong src1)
 {
@ -90,17 +68,6 @@ static inline uint32_t get_C_add_xcc(target_ulong dst, target_ulong src1)
    return ret;
 }
 static inline uint32_t get_C_addx_xcc(target_ulong dst, target_ulong src1,
                                      target_ulong src2)
 {
    uint32_t ret = 0;
    if (((src1 & src2) | (~dst & (src1 | src2))) & (1ULL << 63)) {
        ret = PSR_CARRY;
    }
    return ret;
 }
 static inline uint32_t get_V_add_xcc(target_ulong dst, target_ulong src1,
                                     target_ulong src2)
 {
@ -128,53 +95,11 @@ static uint32_t compute_C_add_xcc(CPUSPARCState *env)
 }
 #endif
 static uint32_t compute_all_add(CPUSPARCState *env)
 {
    uint32_t ret;
    ret = get_NZ_icc(CC_DST);
    ret |= get_C_add_icc(CC_DST, CC_SRC);
    ret |= get_V_add_icc(CC_DST, CC_SRC, CC_SRC2);
    return ret;
 }
 static uint32_t compute_C_add(CPUSPARCState *env)
 {
    return get_C_add_icc(CC_DST, CC_SRC);
 }
 #ifdef TARGET_SPARC64
 static uint32_t compute_all_addx_xcc(CPUSPARCState *env)
 {
    uint32_t ret;
    ret = get_NZ_xcc(CC_DST);
    ret |= get_C_addx_xcc(CC_DST, CC_SRC, CC_SRC2);
    ret |= get_V_add_xcc(CC_DST, CC_SRC, CC_SRC2);
    return ret;
 }
 static uint32_t compute_C_addx_xcc(CPUSPARCState *env)
 {
    return get_C_addx_xcc(CC_DST, CC_SRC, CC_SRC2);
 }
 #endif
 static uint32_t compute_all_addx(CPUSPARCState *env)
 {
    uint32_t ret;
    ret = get_NZ_icc(CC_DST);
    ret |= get_C_addx_icc(CC_DST, CC_SRC, CC_SRC2);
    ret |= get_V_add_icc(CC_DST, CC_SRC, CC_SRC2);
    return ret;
 }
 static uint32_t compute_C_addx(CPUSPARCState *env)
 {
    return get_C_addx_icc(CC_DST, CC_SRC, CC_SRC2);
 }
 static inline uint32_t get_V_tag_icc(target_ulong src1, target_ulong src2)
 {
    uint32_t ret = 0;
@ -185,17 +110,6 @@ static inline uint32_t get_V_tag_icc(target_ulong src1, target_ulong src2)
    return ret;
 }
 static uint32_t compute_all_tadd(CPUSPARCState *env)
 {
    uint32_t ret;
    ret = get_NZ_icc(CC_DST);
    ret |= get_C_add_icc(CC_DST, CC_SRC);
    ret |= get_V_add_icc(CC_DST, CC_SRC, CC_SRC2);
    ret |= get_V_tag_icc(CC_SRC, CC_SRC2);
    return ret;
 }
 static uint32_t compute_all_taddtv(CPUSPARCState *env)
 {
    uint32_t ret;
@ -361,9 +275,6 @@ typedef struct CCTable {
 static const CCTable icc_table[CC_OP_NB] = {
    /* CC_OP_DYNAMIC should never happen */
    [CC_OP_ADD] = { compute_all_add, compute_C_add },
    [CC_OP_ADDX] = { compute_all_addx, compute_C_addx },
    [CC_OP_TADD] = { compute_all_tadd, compute_C_add },
    [CC_OP_TADDTV] = { compute_all_taddtv, compute_C_add },
    [CC_OP_SUB] = { compute_all_sub, compute_C_sub },
    [CC_OP_SUBX] = { compute_all_subx, compute_C_subx },
@ -374,9 +285,6 @@ static const CCTable icc_table[CC_OP_NB] = {
 #ifdef TARGET_SPARC64
 static const CCTable xcc_table[CC_OP_NB] = {
    /* CC_OP_DYNAMIC should never happen */
    [CC_OP_ADD] = { compute_all_add_xcc, compute_C_add_xcc },
    [CC_OP_ADDX] = { compute_all_addx_xcc, compute_C_addx_xcc },
    [CC_OP_TADD] = { compute_all_add_xcc, compute_C_add_xcc },
    [CC_OP_TADDTV] = { compute_all_add_xcc, compute_C_add_xcc },
    [CC_OP_SUB] = { compute_all_sub_xcc, compute_C_sub_xcc },
    [CC_OP_SUBX] = { compute_all_subx_xcc, compute_C_subx_xcc },
--- a/target/sparc/cpu.h
+++ b/target/sparc/cpu.h
@ -150,9 +150,6 @@ enum {
 enum {
    CC_OP_DYNAMIC, /* must use dynamic code to get cc_op */
    CC_OP_FLAGS,   /* all cc are back in cc_*_[NZCV] registers */
    CC_OP_ADD,     /* modify all flags, CC_DST = res, CC_SRC = src1 */
    CC_OP_ADDX,    /* modify all flags, CC_DST = res, CC_SRC = src1 */
    CC_OP_TADD,    /* modify all flags, CC_DST = res, CC_SRC = src1 */
    CC_OP_TADDTV,  /* modify all flags except V, CC_DST = res, CC_SRC = src1 */
    CC_OP_SUB,     /* modify all flags, CC_DST = res, CC_SRC = src1 */
    CC_OP_SUBX,    /* modify all flags, CC_DST = res, CC_SRC = src1 */
--- a/target/sparc/translate.c
+++ b/target/sparc/translate.c
@ -382,33 +382,71 @@ static void gen_goto_tb(DisasContext *s, int tb_num,
    }
 }
-static void gen_op_add_cc(TCGv dst, TCGv src1, TCGv src2)
+static TCGv gen_carry32(void)
 {
-    tcg_gen_mov_tl(cpu_cc_src, src1);
+    if (TARGET_LONG_BITS == 64) {
-    tcg_gen_mov_tl(cpu_cc_src2, src2);
+        TCGv t = tcg_temp_new();
-    tcg_gen_add_tl(cpu_cc_dst, cpu_cc_src, cpu_cc_src2);
+        tcg_gen_extract_tl(t, cpu_icc_C, 32, 1);
-    tcg_gen_mov_tl(dst, cpu_cc_dst);
+        return t;
    }
    return cpu_icc_C;
 }
-static TCGv_i32 gen_add32_carry32(void)
+static void gen_op_addcc_int(TCGv dst, TCGv src1, TCGv src2, TCGv cin)
 {
-    TCGv_i32 carry_32, cc_src1_32, cc_src2_32;
+    TCGv z = tcg_constant_tl(0);
-    /* Carry is computed from a previous add: (dst < src)  */
+    if (cin) {
-#if TARGET_LONG_BITS == 64
+        tcg_gen_add2_tl(cpu_cc_N, cpu_cc_C, src1, z, cin, z);
-    cc_src1_32 = tcg_temp_new_i32();
+        tcg_gen_add2_tl(cpu_cc_N, cpu_cc_C, cpu_cc_N, cpu_cc_C, src2, z);
-    cc_src2_32 = tcg_temp_new_i32();
+    } else {
-    tcg_gen_extrl_i64_i32(cc_src1_32, cpu_cc_dst);
+        tcg_gen_add2_tl(cpu_cc_N, cpu_cc_C, src1, z, src2, z);
-    tcg_gen_extrl_i64_i32(cc_src2_32, cpu_cc_src);
+    }
-#else
+    tcg_gen_xor_tl(cpu_cc_Z, src1, src2);
-    cc_src1_32 = cpu_cc_dst;
+    tcg_gen_xor_tl(cpu_cc_V, cpu_cc_N, src2);
-    cc_src2_32 = cpu_cc_src;
+    tcg_gen_andc_tl(cpu_cc_V, cpu_cc_V, cpu_cc_Z);
-#endif
+    if (TARGET_LONG_BITS == 64) {
        /*
         * Carry-in to bit 32 is result ^ src1 ^ src2.
         * We already have the src xor term in Z, from computation of V.
         */
        tcg_gen_xor_tl(cpu_icc_C, cpu_cc_Z, cpu_cc_N);
        tcg_gen_mov_tl(cpu_icc_Z, cpu_cc_N);
    }
    tcg_gen_mov_tl(cpu_cc_Z, cpu_cc_N);
    tcg_gen_mov_tl(dst, cpu_cc_N);
 }
-    carry_32 = tcg_temp_new_i32();
+static void gen_op_addcc(TCGv dst, TCGv src1, TCGv src2)
-    tcg_gen_setcond_i32(TCG_COND_LTU, carry_32, cc_src1_32, cc_src2_32);
+{
    gen_op_addcc_int(dst, src1, src2, NULL);
 }
-    return carry_32;
+static void gen_op_taddcc(TCGv dst, TCGv src1, TCGv src2)
 {
    TCGv t = tcg_temp_new();
    /* Save the tag bits around modification of dst. */
    tcg_gen_or_tl(t, src1, src2);
    gen_op_addcc(dst, src1, src2);
    /* Incorprate tag bits into icc.V */
    tcg_gen_andi_tl(t, t, 3);
    tcg_gen_neg_tl(t, t);
    tcg_gen_ext32u_tl(t, t);
    tcg_gen_or_tl(cpu_cc_V, cpu_cc_V, t);
 }
 static void gen_op_addc(TCGv dst, TCGv src1, TCGv src2)
 {
    tcg_gen_add_tl(dst, src1, src2);
    tcg_gen_add_tl(dst, dst, gen_carry32());
 }
 static void gen_op_addccc(TCGv dst, TCGv src1, TCGv src2)
 {
    gen_op_addcc_int(dst, src1, src2, gen_carry32());
 }
 static TCGv_i32 gen_sub32_carry32(void)
@ -432,89 +470,6 @@ static TCGv_i32 gen_sub32_carry32(void)
    return carry_32;
 }
 static void gen_op_addc_int(TCGv dst, TCGv src1, TCGv src2,
                            TCGv_i32 carry_32, bool update_cc)
 {
    tcg_gen_add_tl(dst, src1, src2);
 #ifdef TARGET_SPARC64
    TCGv carry = tcg_temp_new();
    tcg_gen_extu_i32_tl(carry, carry_32);
    tcg_gen_add_tl(dst, dst, carry);
 #else
    tcg_gen_add_i32(dst, dst, carry_32);
 #endif
    if (update_cc) {
        tcg_debug_assert(dst == cpu_cc_dst);
        tcg_gen_mov_tl(cpu_cc_src, src1);
        tcg_gen_mov_tl(cpu_cc_src2, src2);
    }
 }
 static void gen_op_addc_int_add(TCGv dst, TCGv src1, TCGv src2, bool update_cc)
 {
    TCGv discard;
    if (TARGET_LONG_BITS == 64) {
        gen_op_addc_int(dst, src1, src2, gen_add32_carry32(), update_cc);
        return;
    }
    /*
     * We can re-use the host's hardware carry generation by using
     * an ADD2 opcode.  We discard the low part of the output.
     * Ideally we'd combine this operation with the add that
     * generated the carry in the first place.
     */
    discard = tcg_temp_new();
    tcg_gen_add2_tl(discard, dst, cpu_cc_src, src1, cpu_cc_src2, src2);
    if (update_cc) {
        tcg_debug_assert(dst == cpu_cc_dst);
        tcg_gen_mov_tl(cpu_cc_src, src1);
        tcg_gen_mov_tl(cpu_cc_src2, src2);
    }
 }
 static void gen_op_addc_add(TCGv dst, TCGv src1, TCGv src2)
 {
    gen_op_addc_int_add(dst, src1, src2, false);
 }
 static void gen_op_addccc_add(TCGv dst, TCGv src1, TCGv src2)
 {
    gen_op_addc_int_add(dst, src1, src2, true);
 }
 static void gen_op_addc_sub(TCGv dst, TCGv src1, TCGv src2)
 {
    gen_op_addc_int(dst, src1, src2, gen_sub32_carry32(), false);
 }
 static void gen_op_addccc_sub(TCGv dst, TCGv src1, TCGv src2)
 {
    gen_op_addc_int(dst, src1, src2, gen_sub32_carry32(), true);
 }
 static void gen_op_addc_int_generic(TCGv dst, TCGv src1, TCGv src2,
                                    bool update_cc)
 {
    TCGv_i32 carry_32 = tcg_temp_new_i32();
    gen_helper_compute_C_icc(carry_32, tcg_env);
    gen_op_addc_int(dst, src1, src2, carry_32, update_cc);
 }
 static void gen_op_addc_generic(TCGv dst, TCGv src1, TCGv src2)
 {
    gen_op_addc_int_generic(dst, src1, src2, false);
 }
 static void gen_op_addccc_generic(TCGv dst, TCGv src1, TCGv src2)
 {
    gen_op_addc_int_generic(dst, src1, src2, true);
 }
 static void gen_op_sub_cc(TCGv dst, TCGv src1, TCGv src2)
 {
    tcg_gen_mov_tl(cpu_cc_src, src1);
@ -545,16 +500,6 @@ static void gen_op_subc_int(TCGv dst, TCGv src1, TCGv src2,
    }
 }
 static void gen_op_subc_add(TCGv dst, TCGv src1, TCGv src2)
 {
    gen_op_subc_int(dst, src1, src2, gen_add32_carry32(), false);
 }
 static void gen_op_subccc_add(TCGv dst, TCGv src1, TCGv src2)
 {
    gen_op_subc_int(dst, src1, src2, gen_add32_carry32(), true);
 }
 static void gen_op_subc_int_sub(TCGv dst, TCGv src1, TCGv src2, bool update_cc)
 {
    TCGv discard;
@ -609,39 +554,39 @@ static void gen_op_subccc_generic(TCGv dst, TCGv src1, TCGv src2)
 static void gen_op_mulscc(TCGv dst, TCGv src1, TCGv src2)
 {
-    TCGv r_temp, zero, t0;
+    TCGv zero = tcg_constant_tl(0);
    TCGv t_src1 = tcg_temp_new();
    TCGv t_src2 = tcg_temp_new();
    TCGv t0 = tcg_temp_new();
-    r_temp = tcg_temp_new();
+    tcg_gen_ext32u_tl(t_src1, src1);
-    t0 = tcg_temp_new();
+    tcg_gen_ext32u_tl(t_src2, src2);
-    /* old op:
+    /*
-    if (!(env->y & 1))
+     * if (!(env->y & 1))
-        T1 = 0;
+     *   src2 = 0;
-    */
+     */
-    zero = tcg_constant_tl(0);
+    tcg_gen_andi_tl(t0, cpu_y, 0x1);
-    tcg_gen_andi_tl(cpu_cc_src, src1, 0xffffffff);
+    tcg_gen_movcond_tl(TCG_COND_EQ, t_src2, t0, zero, zero, t_src2);
    tcg_gen_andi_tl(r_temp, cpu_y, 0x1);
    tcg_gen_andi_tl(cpu_cc_src2, src2, 0xffffffff);
    tcg_gen_movcond_tl(TCG_COND_EQ, cpu_cc_src2, r_temp, zero,
                       zero, cpu_cc_src2);
-    // b2 = T0 & 1;
+    /*
-    // env->y = (b2 << 31) | (env->y >> 1);
+     * b2 = src1 & 1;
     * y = (b2 << 31) | (y >> 1);
     */
    tcg_gen_extract_tl(t0, cpu_y, 1, 31);
-    tcg_gen_deposit_tl(cpu_y, t0, cpu_cc_src, 31, 1);
+    tcg_gen_deposit_tl(cpu_y, t0, src1, 31, 1);
    // b1 = N ^ V;
    tcg_gen_xor_tl(t0, cpu_cc_N, cpu_cc_V);
-    // T0 = (b1 << 31) | (T0 >> 1);
+    /*
-    // src1 = T0;
+     * src1 = (b1 << 31) | (src1 >> 1)
     */
    tcg_gen_andi_tl(t0, t0, 1u << 31);
-    tcg_gen_shri_tl(cpu_cc_src, cpu_cc_src, 1);
+    tcg_gen_shri_tl(t_src1, t_src1, 1);
-    tcg_gen_or_tl(cpu_cc_src, cpu_cc_src, t0);
+    tcg_gen_or_tl(t_src1, t_src1, t0);
-    tcg_gen_add_tl(cpu_cc_dst, cpu_cc_src, cpu_cc_src2);
+    gen_op_addcc(dst, t_src1, t_src2);
    tcg_gen_mov_tl(dst, cpu_cc_dst);
 }
 static void gen_op_multiply(TCGv dst, TCGv src1, TCGv src2, int sign_ext)
@ -3749,12 +3694,12 @@ static bool do_logic(DisasContext *dc, arg_r_r_ri_cc *a,
    return do_arith_int(dc, a, CC_OP_FLAGS, func, funci, a->cc);
 }
-TRANS(ADD, ALL, do_arith, a, CC_OP_ADD,
+TRANS(ADD, ALL, do_arith, a, CC_OP_FLAGS,
-      tcg_gen_add_tl, tcg_gen_addi_tl, gen_op_add_cc)
+      tcg_gen_add_tl, tcg_gen_addi_tl, gen_op_addcc)
 TRANS(SUB, ALL, do_arith, a, CC_OP_SUB,
      tcg_gen_sub_tl, tcg_gen_subi_tl, gen_op_sub_cc)
-TRANS(TADDcc, ALL, do_arith, a, CC_OP_TADD, NULL, NULL, gen_op_add_cc)
+TRANS(TADDcc, ALL, do_arith, a, CC_OP_FLAGS, NULL, NULL, gen_op_taddcc)
 TRANS(TSUBcc, ALL, do_arith, a, CC_OP_TSUB, NULL, NULL, gen_op_sub_cc)
 TRANS(TADDccTV, ALL, do_arith, a, CC_OP_TADDTV, NULL, NULL, gen_op_taddcctv)
 TRANS(TSUBccTV, ALL, do_arith, a, CC_OP_TSUBTV, NULL, NULL, gen_op_tsubcctv)
@ -3796,31 +3741,13 @@ static bool trans_OR(DisasContext *dc, arg_r_r_ri_cc *a)
 static bool trans_ADDC(DisasContext *dc, arg_r_r_ri_cc *a)
 {
-    switch (dc->cc_op) {
+    update_psr(dc);
-    case CC_OP_ADD:
+    return do_arith(dc, a, CC_OP_FLAGS, gen_op_addc, NULL, gen_op_addccc);
    case CC_OP_TADD:
    case CC_OP_TADDTV:
        return do_arith(dc, a, CC_OP_ADDX,
                        gen_op_addc_add, NULL, gen_op_addccc_add);
    case CC_OP_SUB:
    case CC_OP_TSUB:
    case CC_OP_TSUBTV:
        return do_arith(dc, a, CC_OP_ADDX,
                        gen_op_addc_sub, NULL, gen_op_addccc_sub);
    default:
        return do_arith(dc, a, CC_OP_ADDX,
                        gen_op_addc_generic, NULL, gen_op_addccc_generic);
    }
 }
 static bool trans_SUBC(DisasContext *dc, arg_r_r_ri_cc *a)
 {
    switch (dc->cc_op) {
    case CC_OP_ADD:
    case CC_OP_TADD:
    case CC_OP_TADDTV:
        return do_arith(dc, a, CC_OP_SUBX,
                        gen_op_subc_add, NULL, gen_op_subccc_add);
    case CC_OP_SUB:
    case CC_OP_TSUB:
    case CC_OP_TSUBTV:
@ -3835,7 +3762,7 @@ static bool trans_SUBC(DisasContext *dc, arg_r_r_ri_cc *a)
 static bool trans_MULScc(DisasContext *dc, arg_r_r_ri_cc *a)
 {
    update_psr(dc);
-    return do_arith(dc, a, CC_OP_ADD, NULL, NULL, gen_op_mulscc);
+    return do_arith(dc, a, CC_OP_FLAGS, NULL, NULL, gen_op_mulscc);
 }
 static bool gen_edge(DisasContext *dc, arg_r_r_r *a,