[v6,40/40] drm/msm: Add VM_BIND throttling

Message ID	20250605183111.163594-41-robin.clark@oss.qualcomm.com
State	New
Headers	show Received: from mx0a-0031df01.pphosted.com (mx0a-0031df01.pphosted.com [205.220.168.131]) (using TLSv1.2 with cipher ECDHE-RSA-AES256-GCM-SHA384 (256/256 bits)) (No client certificate requested) by smtp.subspace.kernel.org (Postfix) with ESMTPS id E6FE528A1CF for <linux-arm-msm@vger.kernel.org>; Thu, 5 Jun 2025 18:34:00 +0000 (UTC) From: Rob Clark <robin.clark@oss.qualcomm.com> To: dri-devel@lists.freedesktop.org Cc: freedreno@lists.freedesktop.org, linux-arm-msm@vger.kernel.org, Connor Abbott <cwabbott0@gmail.com>, Rob Clark <robin.clark@oss.qualcomm.com>, Rob Clark <robdclark@gmail.com>, Abhinav Kumar <quic_abhinavk@quicinc.com>, Dmitry Baryshkov <lumag@kernel.org>, Sean Paul <sean@poorly.run>, Marijn Suijten <marijn.suijten@somainline.org>, David Airlie <airlied@gmail.com>, Simona Vetter <simona@ffwll.ch>, Konrad Dybcio <konradybcio@kernel.org>, linux-kernel@vger.kernel.org (open list) Subject: [PATCH v6 40/40] drm/msm: Add VM_BIND throttling Date: Thu, 5 Jun 2025 11:29:25 -0700 Message-ID: <20250605183111.163594-41-robin.clark@oss.qualcomm.com> In-Reply-To: <20250605183111.163594-1-robin.clark@oss.qualcomm.com> References: <20250605183111.163594-1-robin.clark@oss.qualcomm.com> Precedence: bulk MIME-Version: 1.0 Content-Transfer-Encoding: 8bit
Series	drm/msm: sparse / "VM_BIND" support \| expand [v6,00/40] drm/msm: sparse / "VM_BIND" support [v6,01/40] drm/gem: Add ww_acquire_ctx support to drm_gem_lru_scan() [v6,02/40] drm/msm: Rename msm_file_private -> msm_context [v6,03/40] drm/msm: Improve msm_context comments [v6,04/40] drm/msm: Rename msm_gem_address_space -> msm_gem_vm [v6,05/40] drm/msm: Remove vram carveout support [v6,06/40] drm/msm: Collapse vma allocation and initialization [v6,07/40] drm/msm: Collapse vma close and delete [v6,08/40] drm/msm: Don't close VMAs on purge [v6,09/40] drm/msm: Stop passing vm to msm_framebuffer [v6,10/40] drm/msm: Refcount framebuffer pins [v6,11/40] drm/msm: drm_gpuvm conversion [v6,12/40] drm/msm: Convert vm locking [v6,13/40] drm/msm: Use drm_gpuvm types more [v6,14/40] drm/msm: Split out helper to get iommu prot flags [v6,15/40] drm/msm: Add mmu support for non-zero offset [v6,16/40] drm/msm: Add PRR support [v6,17/40] drm/msm: Rename msm_gem_vma_purge() -> _unmap() [v6,18/40] drm/msm: Drop queued submits on lastclose() [v6,19/40] drm/msm: Lazily create context VM [v6,20/40] drm/msm: Add opt-in for VM_BIND [v6,21/40] drm/msm: Mark VM as unusable on GPU hangs [v6,22/40] drm/msm: Add _NO_SHARE flag [v6,23/40] drm/msm: Crashdump prep for sparse mappings [v6,24/40] drm/msm: rd dumping prep for sparse mappings [v6,25/40] drm/msm: Crashdump support for sparse [v6,26/40] drm/msm: rd dumping support for sparse [v6,27/40] drm/msm: Extract out syncobj helpers [v6,28/40] drm/msm: Use DMA_RESV_USAGE_BOOKKEEP/KERNEL [v6,29/40] drm/msm: Add VM_BIND submitqueue [v6,30/40] drm/msm: Support IO_PGTABLE_QUIRK_NO_WARN_ON [v6,31/40] drm/msm: Support pgtable preallocation [v6,32/40] drm/msm: Split out map/unmap ops [v6,33/40] drm/msm: Add VM_BIND ioctl [v6,34/40] drm/msm: Add VM logging for VM_BIND updates [v6,35/40] drm/msm: Add VMA unmap reason [v6,36/40] drm/msm: Add mmu prealloc tracepoint [v6,37/40] drm/msm: use trylock for debugfs [v6,38/40] drm/msm: Bump UAPI version [v6,39/40] drm/msm: Defer VMA unmap for fb unpins [v6,40/40] drm/msm: Add VM_BIND throttling

Message ID

20250605183111.163594-41-robin.clark@oss.qualcomm.com

State

New

Headers

From: Rob Clark <robin.clark@oss.qualcomm.com>
To: dri-devel@lists.freedesktop.org
Cc: freedreno@lists.freedesktop.org, linux-arm-msm@vger.kernel.org,
        Connor Abbott <cwabbott0@gmail.com>,
        Rob Clark <robin.clark@oss.qualcomm.com>,
        Rob Clark <robdclark@gmail.com>,
        Abhinav Kumar <quic_abhinavk@quicinc.com>,
        Dmitry Baryshkov <lumag@kernel.org>, Sean Paul <sean@poorly.run>,
        Marijn Suijten <marijn.suijten@somainline.org>,
        David Airlie <airlied@gmail.com>, Simona Vetter <simona@ffwll.ch>,
        Konrad Dybcio <konradybcio@kernel.org>,
        linux-kernel@vger.kernel.org (open list)
Subject: [PATCH v6 40/40] drm/msm: Add VM_BIND throttling
Date: Thu,  5 Jun 2025 11:29:25 -0700
Message-ID: <20250605183111.163594-41-robin.clark@oss.qualcomm.com>
In-Reply-To: <20250605183111.163594-1-robin.clark@oss.qualcomm.com>
References: <20250605183111.163594-1-robin.clark@oss.qualcomm.com>
Precedence: bulk
MIME-Version: 1.0
Content-Transfer-Encoding: 8bit

Series

drm/msm: sparse / "VM_BIND" support | expand

Commit Message

Rob Clark June 5, 2025, 6:29 p.m. UTC

A large number of (unsorted or separate) small (<2MB) mappings can cause
a lot of, probably unnecessary, prealloc pages.  Ie. a single 4k page
size mapping will pre-allocate 3 pages (for levels 2-4) for the
pagetable.  Which can chew up a large amount of unneeded memory.  So add
a mechanism to put an upper bound on the # of pre-alloc pages.

Signed-off-by: Rob Clark <robin.clark@oss.qualcomm.com>
---
 drivers/gpu/drm/msm/msm_gem_vma.c | 23 +++++++++++++++++++++--
 drivers/gpu/drm/msm/msm_gpu.h     |  3 +++
 2 files changed, 24 insertions(+), 2 deletions(-)

diff --git a/drivers/gpu/drm/msm/msm_gem_vma.c b/drivers/gpu/drm/msm/msm_gem_vma.c
index b6de87e5c3f7..83f6f95b4865 100644
--- a/drivers/gpu/drm/msm/msm_gem_vma.c
+++ b/drivers/gpu/drm/msm/msm_gem_vma.c
@@ -705,6 +705,8 @@  msm_vma_job_free(struct drm_sched_job *_job)
 
 	mmu->funcs->prealloc_cleanup(mmu, &job->prealloc);
 
+	atomic_sub(job->prealloc.count, &job->queue->in_flight_prealloc);
+
 	drm_sched_job_cleanup(_job);
 
 	job_foreach_bo (obj, job)
@@ -1087,10 +1089,11 @@  ops_are_same_pte(struct msm_vm_bind_op *first, struct msm_vm_bind_op *next)
  * them as a single mapping.  Otherwise the prealloc_count() will not realize
  * they can share pagetable pages and vastly overcount.
  */
-static void
+static int
 vm_bind_prealloc_count(struct msm_vm_bind_job *job)
 {
 	struct msm_vm_bind_op *first = NULL, *last = NULL;
+	int ret;
 
 	for (int i = 0; i < job->nr_ops; i++) {
 		struct msm_vm_bind_op *op = &job->ops[i];
@@ -1119,6 +1122,20 @@  vm_bind_prealloc_count(struct msm_vm_bind_job *job)
 
 	/* Flush the remaining range: */
 	prealloc_count(job, first, last);
+
+	/*
+	 * Now that we know the needed amount to pre-alloc, throttle on pending
+	 * VM_BIND jobs if we already have too much pre-alloc memory in flight
+	 */
+	ret = wait_event_interruptible(
+			to_msm_vm(job->vm)->sched.job_scheduled,
+			atomic_read(&job->queue->in_flight_prealloc) <= 1024);
+	if (ret)
+		return ret;
+
+	atomic_add(job->prealloc.count, &job->queue->in_flight_prealloc);
+
+	return 0;
 }
 
 /*
@@ -1389,7 +1406,9 @@  msm_ioctl_vm_bind(struct drm_device *dev, void *data, struct drm_file *file)
 	if (ret)
 		goto out_unlock;
 
-	vm_bind_prealloc_count(job);
+	ret = vm_bind_prealloc_count(job);
+	if (ret)
+		goto out_unlock;
 
 	struct drm_exec exec;
 	unsigned flags = DRM_EXEC_IGNORE_DUPLICATES | DRM_EXEC_INTERRUPTIBLE_WAIT;
diff --git a/drivers/gpu/drm/msm/msm_gpu.h b/drivers/gpu/drm/msm/msm_gpu.h
index 31b83e9e3673..5508885d865f 100644
--- a/drivers/gpu/drm/msm/msm_gpu.h
+++ b/drivers/gpu/drm/msm/msm_gpu.h
@@ -555,6 +555,8 @@  static inline int msm_gpu_convert_priority(struct msm_gpu *gpu, int prio,
  *             seqno, protected by submitqueue lock
  * @idr_lock:  for serializing access to fence_idr
  * @lock:      submitqueue lock for serializing submits on a queue
+ * @in_flight_prealloc: for VM_BIND queue, # of preallocated pgtable pages for
+ *             queued VM_BIND jobs
  * @ref:       reference count
  * @entity:    the submit job-queue
  */
@@ -569,6 +571,7 @@  struct msm_gpu_submitqueue {
 	struct idr fence_idr;
 	struct spinlock idr_lock;
 	struct mutex lock;
+	atomic_t in_flight_prealloc;
 	struct kref ref;
 	struct drm_sched_entity *entity;

[v6,40/40] drm/msm: Add VM_BIND throttling

Commit Message

Patch