[v2,29/51] tcg/optimize: Use fold_masks_zs in fold_qemu_ld

Message ID	20241220041104.53105-30-richard.henderson@linaro.org
State	Superseded
Headers	show Delivered-To: patch@linaro.org Received-SPF: pass (google.com: domain of qemu-devel-bounces+patch=linaro.org@nongnu.org designates 209.51.188.17 as permitted sender) client-ip=209.51.188.17; From: Richard Henderson <richard.henderson@linaro.org> To: qemu-devel@nongnu.org Subject: [PATCH v2 29/51] tcg/optimize: Use fold_masks_zs in fold_qemu_ld Date: Thu, 19 Dec 2024 20:10:41 -0800 Message-ID: <20241220041104.53105-30-richard.henderson@linaro.org> In-Reply-To: <20241220041104.53105-1-richard.henderson@linaro.org> References: <20241220041104.53105-1-richard.henderson@linaro.org> MIME-Version: 1.0 Content-Transfer-Encoding: 8bit Received-SPF: pass client-ip=2607:f8b0:4864:20::102f; envelope-from=richard.henderson@linaro.org; helo=mail-pj1-x102f.google.com X-Spam_score_int: -20 X-Spam_score: -2.1 X-Spam_bar: -- X-Spam_report: (-2.1 / 5.0 requ) BAYES_00=-1.9, DKIM_SIGNED=0.1, DKIM_VALID=-0.1, DKIM_VALID_AU=-0.1, DKIM_VALID_EF=-0.1, RCVD_IN_DNSWL_NONE=-0.0001, SPF_HELO_NONE=0.001, SPF_PASS=-0.001 autolearn=ham autolearn_force=no X-Spam_action: no action Precedence: list Errors-To: qemu-devel-bounces+patch=linaro.org@nongnu.org Sender: qemu-devel-bounces+patch=linaro.org@nongnu.org
Series	tcg: Remove in-flight mask data from OptContext \| expand [v2,00/51] tcg: Remove in-flight mask data from OptContext [v2,01/51] tcg/optimize: Split out finish_bb, finish_ebb [v2,02/51] tcg/optimize: Split out fold_affected_mask [v2,03/51] tcg/optimize: Copy mask writeback to fold_masks [v2,04/51] tcg/optimize: Split out fold_masks_zs [v2,05/51] tcg/optimize: Augment s_mask from z_mask in fold_masks_zs [v2,06/51] tcg/optimize: Use finish_folding in fold_add, fold_add_vec, fold_addsub2 [v2,07/51] tcg/optimize: Use fold_masks_zs in fold_and [v2,08/51] tcg/optimize: Use fold_masks_zs in fold_andc [v2,09/51] tcg/optimize: Use fold_masks_zs in fold_bswap [v2,10/51] tcg/optimize: Use fold_masks_zs in fold_count_zeros [v2,11/51] tcg/optimize: Use fold_masks_z in fold_ctpop [v2,12/51] tcg/optimize: Use fold_and and fold_masks_z in fold_deposit [v2,13/51] tcg/optimize: Compute sign mask in fold_deposit [v2,14/51] tcg/optimize: Use finish_folding in fold_divide [v2,15/51] tcg/optimize: Use finish_folding in fold_dup, fold_dup2 [v2,16/51] tcg/optimize: Use fold_masks_s in fold_eqv [v2,17/51] tcg/optimize: Use fold_masks_z in fold_extract [v2,18/51] tcg/optimize: Use finish_folding in fold_extract2 [v2,19/51] tcg/optimize: Use fold_masks_zs in fold_exts [v2,20/51] tcg/optimize: Use fold_masks_z in fold_extu [v2,21/51] tcg/optimize: Use fold_masks_zs in fold_movcond [v2,22/51] tcg/optimize: Use finish_folding in fold_mul* [v2,23/51] tcg/optimize: Use fold_masks_s in fold_nand [v2,24/51] tcg/optimize: Use fold_masks_z in fold_neg_no_const [v2,25/51] tcg/optimize: Use fold_masks_s in fold_nor [v2,26/51] tcg/optimize: Use fold_masks_s in fold_not [v2,27/51] tcg/optimize: Use fold_masks_zs in fold_or [v2,28/51] tcg/optimize: Use fold_masks_zs in fold_orc [v2,29/51] tcg/optimize: Use fold_masks_zs in fold_qemu_ld [v2,30/51] tcg/optimize: Return true from fold_qemu_st, fold_tcg_st [v2,31/51] tcg/optimize: Use finish_folding in fold_remainder [v2,32/51] tcg/optimize: Distinguish simplification in fold_setcond_zmask [v2,33/51] tcg/optimize: Use fold_masks_z in fold_setcond [v2,34/51] tcg/optimize: Use fold_masks_s in fold_negsetcond [v2,35/51] tcg/optimize: Fix sign mask in fold_negsetcond [v2,36/51] tcg/optimize: Use fold_masks_z in fold_setcond2 [v2,37/51] tcg/optimize: Use finish_folding in fold_cmp_vec [v2,38/51] tcg/optimize: Use finish_folding in fold_cmpsel_vec [v2,39/51] tcg/optimize: Use fold_masks_zs in fold_sextract [v2,40/51] tcg/optimize: Canonicalize s_mask in fold_exts, fold_sextract [v2,41/51] tcg/optimize: Use fold_masks_zs, fold_masks_s in fold_shift [v2,42/51] tcg/optimize: Simplify sign bit test in fold_shift [v2,43/51] tcg/optimize: Use finish_folding in fold_sub, fold_sub_vec [v2,44/51] tcg/optimize: Use fold_masks_zs in fold_tcg_ld [v2,45/51] tcg/optimize: Use finish_folding in fold_tcg_ld_memcopy [v2,46/51] tcg/optimize: Use fold_masks_zs in fold_xor [v2,47/51] tcg/optimize: Use finish_folding in fold_bitsel_vec [v2,48/51] tcg/optimize: Use finish_folding as default in tcg_optimize [v2,49/51] tcg/optimize: Remove z_mask, s_mask from OptContext [v2,50/51] tcg/optimize: Move fold_bitsel_vec into alphabetic sort [v2,51/51] tcg/optimize: Move fold_cmp_vec, fold_cmpsel_vec into alphabetic sort

Message ID

20241220041104.53105-30-richard.henderson@linaro.org

State

Superseded

Headers

Received-SPF: pass (google.com: domain of
 qemu-devel-bounces+patch=linaro.org@nongnu.org designates 209.51.188.17 as
 permitted sender) client-ip=209.51.188.17;
From: Richard Henderson <richard.henderson@linaro.org>
To: qemu-devel@nongnu.org
Subject: [PATCH v2 29/51] tcg/optimize: Use fold_masks_zs in fold_qemu_ld
Date: Thu, 19 Dec 2024 20:10:41 -0800
Message-ID: <20241220041104.53105-30-richard.henderson@linaro.org>
In-Reply-To: <20241220041104.53105-1-richard.henderson@linaro.org>
References: <20241220041104.53105-1-richard.henderson@linaro.org>
MIME-Version: 1.0
Content-Transfer-Encoding: 8bit
Received-SPF: pass client-ip=2607:f8b0:4864:20::102f;
 envelope-from=richard.henderson@linaro.org; helo=mail-pj1-x102f.google.com
X-Spam_score_int: -20
X-Spam_score: -2.1
X-Spam_bar: --
X-Spam_report: (-2.1 / 5.0 requ) BAYES_00=-1.9, DKIM_SIGNED=0.1,
 DKIM_VALID=-0.1, DKIM_VALID_AU=-0.1, DKIM_VALID_EF=-0.1,
 RCVD_IN_DNSWL_NONE=-0.0001, SPF_HELO_NONE=0.001,
 SPF_PASS=-0.001 autolearn=ham autolearn_force=no
X-Spam_action: no action
X-BeenThere: qemu-devel@nongnu.org
X-Mailman-Version: 2.1.29
Precedence: list
List-Id: <qemu-devel.nongnu.org>
List-Unsubscribe: <https://lists.nongnu.org/mailman/options/qemu-devel>,
 <mailto:qemu-devel-request@nongnu.org?subject=unsubscribe>
List-Archive: <https://lists.nongnu.org/archive/html/qemu-devel>
List-Post: <mailto:qemu-devel@nongnu.org>
List-Help: <mailto:qemu-devel-request@nongnu.org?subject=help>
List-Subscribe: <https://lists.nongnu.org/mailman/listinfo/qemu-devel>,
 <mailto:qemu-devel-request@nongnu.org?subject=subscribe>
Errors-To: qemu-devel-bounces+patch=linaro.org@nongnu.org
Sender: qemu-devel-bounces+patch=linaro.org@nongnu.org

Series

tcg: Remove in-flight mask data from OptContext | expand

Commit Message

Richard Henderson Dec. 20, 2024, 4:10 a.m. UTC

Avoid the use of the OptContext slots.

Be careful not to call fold_masks_zs when the memory operation
is wide enough to require multiple outputs, so split into two
functions: fold_qemu_ld_1reg and fold_qemu_ld_2reg.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/optimize.c | 28 ++++++++++++++++++++++------
 1 file changed, 22 insertions(+), 6 deletions(-)

Comments

Pierrick Bouvier Dec. 20, 2024, 8:18 p.m. UTC | #1

On 12/19/24 20:10, Richard Henderson wrote:
> Avoid the use of the OptContext slots.
> 
> Be careful not to call fold_masks_zs when the memory operation
> is wide enough to require multiple outputs, so split into two
> functions: fold_qemu_ld_1reg and fold_qemu_ld_2reg.
> 
> Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
> ---
>   tcg/optimize.c | 28 ++++++++++++++++++++++------
>   1 file changed, 22 insertions(+), 6 deletions(-)
> 
> diff --git a/tcg/optimize.c b/tcg/optimize.c
> index da9c8c4669..b01929fccf 100644
> --- a/tcg/optimize.c
> +++ b/tcg/optimize.c
> @@ -2127,24 +2127,33 @@ static bool fold_orc(OptContext *ctx, TCGOp *op)
>       return fold_masks_s(ctx, op, s_mask);
>   }
>   
> -static bool fold_qemu_ld(OptContext *ctx, TCGOp *op)
> +static bool fold_qemu_ld_1reg(OptContext *ctx, TCGOp *op)
>   {
>       const TCGOpDef *def = &tcg_op_defs[op->opc];
>       MemOpIdx oi = op->args[def->nb_oargs + def->nb_iargs];
>       MemOp mop = get_memop(oi);
>       int width = 8 * memop_size(mop);
> +    uint64_t z_mask = -1, s_mask = 0;
>   
>       if (width < 64) {
> -        ctx->s_mask = MAKE_64BIT_MASK(width, 64 - width);
> +        s_mask = MAKE_64BIT_MASK(width, 64 - width);
>           if (!(mop & MO_SIGN)) {
> -            ctx->z_mask = MAKE_64BIT_MASK(0, width);
> -            ctx->s_mask <<= 1;
> +            z_mask = MAKE_64BIT_MASK(0, width);
> +            s_mask <<= 1;
>           }
>       }
>   
>       /* Opcodes that touch guest memory stop the mb optimization.  */
>       ctx->prev_mb = NULL;
> -    return false;
> +
> +    return fold_masks_zs(ctx, op, z_mask, s_mask);
> +}
> +
> +static bool fold_qemu_ld_2reg(OptContext *ctx, TCGOp *op)
> +{
> +    /* Opcodes that touch guest memory stop the mb optimization.  */
> +    ctx->prev_mb = NULL;
> +    return finish_folding(ctx, op);
>   }
>   
>   static bool fold_qemu_st(OptContext *ctx, TCGOp *op)
> @@ -3033,11 +3042,18 @@ void tcg_optimize(TCGContext *s)
>               break;
>           case INDEX_op_qemu_ld_a32_i32:
>           case INDEX_op_qemu_ld_a64_i32:
> +            done = fold_qemu_ld_1reg(&ctx, op);
> +            break;
>           case INDEX_op_qemu_ld_a32_i64:
>           case INDEX_op_qemu_ld_a64_i64:
> +            if (TCG_TARGET_REG_BITS == 64) {
> +                done = fold_qemu_ld_1reg(&ctx, op);
> +                break;
> +            }
> +            QEMU_FALLTHROUGH;
>           case INDEX_op_qemu_ld_a32_i128:
>           case INDEX_op_qemu_ld_a64_i128:
> -            done = fold_qemu_ld(&ctx, op);
> +            done = fold_qemu_ld_2reg(&ctx, op);
>               break;
>           case INDEX_op_qemu_st8_a32_i32:
>           case INDEX_op_qemu_st8_a64_i32:

Reviewed-by: Pierrick Bouvier <pierrick.bouvier@linaro.org>

diff --git a/tcg/optimize.c b/tcg/optimize.c
index da9c8c4669..b01929fccf 100644
--- a/tcg/optimize.c
+++ b/tcg/optimize.c
@@ -2127,24 +2127,33 @@  static bool fold_orc(OptContext *ctx, TCGOp *op)
     return fold_masks_s(ctx, op, s_mask);
 }
 
-static bool fold_qemu_ld(OptContext *ctx, TCGOp *op)
+static bool fold_qemu_ld_1reg(OptContext *ctx, TCGOp *op)
 {
     const TCGOpDef *def = &tcg_op_defs[op->opc];
     MemOpIdx oi = op->args[def->nb_oargs + def->nb_iargs];
     MemOp mop = get_memop(oi);
     int width = 8 * memop_size(mop);
+    uint64_t z_mask = -1, s_mask = 0;
 
     if (width < 64) {
-        ctx->s_mask = MAKE_64BIT_MASK(width, 64 - width);
+        s_mask = MAKE_64BIT_MASK(width, 64 - width);
         if (!(mop & MO_SIGN)) {
-            ctx->z_mask = MAKE_64BIT_MASK(0, width);
-            ctx->s_mask <<= 1;
+            z_mask = MAKE_64BIT_MASK(0, width);
+            s_mask <<= 1;
         }
     }
 
     /* Opcodes that touch guest memory stop the mb optimization.  */
     ctx->prev_mb = NULL;
-    return false;
+
+    return fold_masks_zs(ctx, op, z_mask, s_mask);
+}
+
+static bool fold_qemu_ld_2reg(OptContext *ctx, TCGOp *op)
+{
+    /* Opcodes that touch guest memory stop the mb optimization.  */
+    ctx->prev_mb = NULL;
+    return finish_folding(ctx, op);
 }
 
 static bool fold_qemu_st(OptContext *ctx, TCGOp *op)
@@ -3033,11 +3042,18 @@  void tcg_optimize(TCGContext *s)
             break;
         case INDEX_op_qemu_ld_a32_i32:
         case INDEX_op_qemu_ld_a64_i32:
+            done = fold_qemu_ld_1reg(&ctx, op);
+            break;
         case INDEX_op_qemu_ld_a32_i64:
         case INDEX_op_qemu_ld_a64_i64:
+            if (TCG_TARGET_REG_BITS == 64) {
+                done = fold_qemu_ld_1reg(&ctx, op);
+                break;
+            }
+            QEMU_FALLTHROUGH;
         case INDEX_op_qemu_ld_a32_i128:
         case INDEX_op_qemu_ld_a64_i128:
-            done = fold_qemu_ld(&ctx, op);
+            done = fold_qemu_ld_2reg(&ctx, op);
             break;
         case INDEX_op_qemu_st8_a32_i32:
         case INDEX_op_qemu_st8_a64_i32:

[v2,29/51] tcg/optimize: Use fold_masks_zs in fold_qemu_ld

Commit Message

Comments

Patch