From 5d9d815283324a4c29927ebf964e12a45085ce2b Mon Sep 17 00:00:00 2001
From: Victor Skvortsov <vds003@gmail.com>
Date: Mon, 10 Nov 2025 14:20:07 +0500
Subject: [PATCH 1/7] Forbid running multinode tasks on non-cluster fleets

---
 .../tasks/process_submitted_jobs.py           | 21 ++++++++++++-------
 1 file changed, 14 insertions(+), 7 deletions(-)

diff --git a/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py b/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
index a1c799990d..12f876b653 100644
--- a/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
+++ b/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
@@ -335,17 +335,14 @@ async def _process_submitted_job(session: AsyncSession, job_model: JobModel):
                     return
             instance = await _assign_job_to_fleet_instance(
                 session=session,
+                fleet_model=fleet_model,
                 instances_with_offers=fleet_instances_with_offers,
                 job_model=job_model,
                 multinode=multinode,
             )
-            job_model.fleet = fleet_model
-            job_model.instance_assigned = True
             job_model.last_processed_at = common_utils.get_current_datetime()
-            if len(instances_ids) > 0:
-                await session.commit()
-                return
-            # If no instances were locked, we can proceed in the same transaction.
+            await session.commit()
+            return
 
     # TODO: Volume attachment for compute groups is not yet supported since
     # currently supported compute groups (e.g. Runpod) don't need explicit volume attachment.
@@ -598,6 +595,13 @@ async def _find_optimal_fleet_with_offers(
     ] = []
     for candidate_fleet_model in fleet_models:
         candidate_fleet = fleet_model_to_fleet(candidate_fleet_model)
+        if (
+            job.job_spec.jobs_per_replica > 1
+            and candidate_fleet.spec.configuration != InstanceGroupPlacement.CLUSTER
+        ):
+            # Limit multinode runs to cluster fleets to guarantee best connectivity.
+            continue
+
         fleet_instances_with_pool_offers = _get_fleet_instances_with_pool_offers(
             fleet_model=candidate_fleet_model,
             run_spec=run_spec,
@@ -760,8 +764,9 @@ def _get_fleet_instances_with_pool_offers(
 
 async def _assign_job_to_fleet_instance(
     session: AsyncSession,
-    instances_with_offers: list[tuple[InstanceModel, InstanceOfferWithAvailability]],
+    fleet_model: Optional[FleetModel],
     job_model: JobModel,
+    instances_with_offers: list[tuple[InstanceModel, InstanceOfferWithAvailability]],
     multinode: bool,
 ) -> Optional[InstanceModel]:
     if len(instances_with_offers) == 0:
@@ -789,6 +794,8 @@ async def _assign_job_to_fleet_instance(
         },
     )
     logger.info("%s: now is provisioning on '%s'", fmt(job_model), instance.name)
+    job_model.fleet = fleet_model
+    job_model.instance_assigned = True
     job_model.instance = instance
     job_model.used_instance_id = instance.id
     job_model.job_provisioning_data = instance.job_provisioning_data

From d1237092f0b0acd6a6434c533104a7d527fef029 Mon Sep 17 00:00:00 2001
From: Victor Skvortsov <vds003@gmail.com>
Date: Tue, 11 Nov 2025 09:05:28 +0500
Subject: [PATCH 2/7] Guarantee fleet cluster placement with concurrent
 provisioning

---
 .../tasks/process_submitted_jobs.py           | 63 ++++++++++++++++++-
 .../tasks/test_process_submitted_jobs.py      | 55 +++++++++++++++-
 2 files changed, 114 insertions(+), 4 deletions(-)

diff --git a/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py b/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
index 12f876b653..f8bb205e22 100644
--- a/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
+++ b/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
@@ -366,6 +366,37 @@ async def _process_submitted_job(session: AsyncSession, job_model: JobModel):
             await session.commit()
             return
 
+        master_instance_provisioning_data = None
+        if job.job_spec.job_num == 0 and fleet_model is not None:
+            # TODO: Lock on SQLite
+            fleet = fleet_model_to_fleet(fleet_model)
+            if fleet.spec.configuration.placement == InstanceGroupPlacement.CLUSTER:
+                # To avoid violating fleet placement cluster during master provisioning,
+                # we must lock empty fleets and respect existing instances in non-empty fleets.
+                res = await session.execute(
+                    select(FleetModel)
+                    .outerjoin(FleetModel.instances)
+                    .where(
+                        FleetModel.id == fleet_model.id,
+                        InstanceModel.id.is_(None),
+                    )
+                    .with_for_update(key_share=True, of=FleetModel)
+                )
+                empty_fleet_model = res.unique().scalar()
+                if empty_fleet_model is not None:
+                    fleet_model = empty_fleet_model
+                else:
+                    res = await session.execute(
+                        select(FleetModel)
+                        .where(FleetModel.id == fleet_model.id)
+                        .options(joinedload(FleetModel.instances))
+                    )
+                    fleet_model = res.unique().scalar_one()
+                master_instance_provisioning_data = _get_fleet_master_instance_provisioning_data(
+                    fleet_model=fleet_model,
+                    fleet_spec=fleet.spec,
+                )
+
         jobs_to_provision = [job]
         if (
             multinode
@@ -377,6 +408,9 @@ async def _process_submitted_job(session: AsyncSession, job_model: JobModel):
         ):
             jobs_to_provision = replica_jobs
 
+        master_provisioning_data = (
+            master_job_provisioning_data or master_instance_provisioning_data
+        )
         run_job_result = await _run_jobs_on_new_instances(
             project=project,
             fleet_model=fleet_model,
@@ -385,7 +419,7 @@ async def _process_submitted_job(session: AsyncSession, job_model: JobModel):
             jobs=jobs_to_provision,
             project_ssh_public_key=project.ssh_public_key,
             project_ssh_private_key=project.ssh_private_key,
-            master_job_provisioning_data=master_job_provisioning_data,
+            master_job_provisioning_data=master_provisioning_data,
             volumes=volumes,
         )
         if run_job_result is None:
@@ -606,7 +640,9 @@ async def _find_optimal_fleet_with_offers(
             fleet_model=candidate_fleet_model,
             run_spec=run_spec,
             job=job,
-            master_job_provisioning_data=master_job_provisioning_data,
+            # No need to pass master_job_provisioning_data for master job
+            # as all pool offers are suitable.
+            master_job_provisioning_data=None,
             volumes=volumes,
         )
         fleet_has_pool_capacity = nodes_required_num <= len(fleet_instances_with_pool_offers)
@@ -624,6 +660,11 @@ async def _find_optimal_fleet_with_offers(
         except ValueError:
             fleet_backend_offers = []
         else:
+            # Master job offers must be in the same cluster as existing instances.
+            master_instance_provisioning_data = _get_fleet_master_instance_provisioning_data(
+                fleet_model=candidate_fleet_model,
+                fleet_spec=candidate_fleet.spec,
+            )
             # Handle multinode for old jobs that don't have requirements.multinode set.
             # TODO: Drop multinode param.
             multinode = requirements.multinode or job.job_spec.jobs_per_replica > 1
@@ -633,7 +674,7 @@ async def _find_optimal_fleet_with_offers(
                 requirements=requirements,
                 exclude_not_available=True,
                 multinode=multinode,
-                master_job_provisioning_data=master_job_provisioning_data,
+                master_job_provisioning_data=master_instance_provisioning_data,
                 volumes=volumes,
                 privileged=job.job_spec.privileged,
                 instance_mounts=check_run_spec_requires_instance_mounts(run_spec),
@@ -689,6 +730,22 @@ def _get_nodes_required_num_for_run(run_spec: RunSpec) -> int:
     return nodes_required_num
 
 
+def _get_fleet_master_instance_provisioning_data(
+    fleet_model: FleetModel,
+    fleet_spec: FleetSpec,
+) -> Optional[JobProvisioningData]:
+    master_instance_provisioning_data = None
+    if fleet_spec.configuration.placement == InstanceGroupPlacement.CLUSTER:
+        # Offers for master jobs must be in the same cluster as existing instances.
+        fleet_instance_models = [im for im in fleet_model.instances if not im.deleted]
+        if len(fleet_instance_models) > 0:
+            master_instance_model = fleet_instance_models[0]
+            master_instance_provisioning_data = JobProvisioningData.__response__.parse_raw(
+                master_instance_model.job_provisioning_data
+            )
+    return master_instance_provisioning_data
+
+
 def _run_can_fit_into_fleet(run_spec: RunSpec, fleet: Fleet) -> bool:
     """
     Returns `False` if the run cannot fit into fleet for sure.
diff --git a/src/tests/_internal/server/background/tasks/test_process_submitted_jobs.py b/src/tests/_internal/server/background/tasks/test_process_submitted_jobs.py
index 545349e585..4d430cb297 100644
--- a/src/tests/_internal/server/background/tasks/test_process_submitted_jobs.py
+++ b/src/tests/_internal/server/background/tasks/test_process_submitted_jobs.py
@@ -9,7 +9,7 @@
 from dstack._internal.core.models.backends.base import BackendType
 from dstack._internal.core.models.common import NetworkMode
 from dstack._internal.core.models.configurations import TaskConfiguration
-from dstack._internal.core.models.fleets import FleetNodesSpec
+from dstack._internal.core.models.fleets import FleetNodesSpec, InstanceGroupPlacement
 from dstack._internal.core.models.health import HealthStatus
 from dstack._internal.core.models.instances import (
     InstanceAvailability,
@@ -1189,6 +1189,59 @@ async def test_provisions_compute_group(self, test_db, session: AsyncSession):
         res = await session.execute(select(ComputeGroupModel))
         assert res.scalar() is not None
 
+    @pytest.mark.asyncio
+    @pytest.mark.parametrize("test_db", ["sqlite", "postgres"], indirect=True)
+    async def test_provisioning_master_job_respects_cluster_placement_in_non_empty_fleet(
+        self, test_db, session: AsyncSession
+    ):
+        project = await create_project(session)
+        user = await create_user(session)
+        repo = await create_repo(session=session, project_id=project.id)
+        fleet_spec = get_fleet_spec()
+        fleet_spec.configuration.placement = InstanceGroupPlacement.CLUSTER
+        fleet_spec.configuration.nodes = FleetNodesSpec(min=0, target=0, max=None)
+        fleet = await create_fleet(session=session, project=project, spec=fleet_spec)
+        await create_instance(
+            session=session,
+            project=project,
+            fleet=fleet,
+            status=InstanceStatus.BUSY,
+            backend=BackendType.AWS,
+            job_provisioning_data=get_job_provisioning_data(region="eu-west-1"),
+        )
+        configuration = TaskConfiguration(image="debian", nodes=2)
+        run_spec = get_run_spec(run_name="run", repo_id=repo.name, configuration=configuration)
+        run = await create_run(
+            session=session,
+            run_name="run",
+            project=project,
+            repo=repo,
+            user=user,
+            run_spec=run_spec,
+        )
+        job = await create_job(
+            session=session,
+            run=run,
+            fleet=fleet,
+            instance_assigned=True,
+        )
+        with patch("dstack._internal.server.services.backends.get_project_backends") as m:
+            backend_mock = Mock()
+            m.return_value = [backend_mock]
+            backend_mock.TYPE = BackendType.AWS
+            offer1 = get_instance_offer_with_availability(region="eu-west-2")
+            offer2 = get_instance_offer_with_availability(region="eu-west-1")
+            backend_mock.compute.return_value.get_offers.return_value = [offer1, offer2]
+            backend_mock.compute.return_value.run_job.return_value = get_job_provisioning_data()
+            await process_submitted_jobs()
+            m.assert_called_once()
+            backend_mock.compute.return_value.get_offers.assert_called_once()
+            backend_mock.compute.return_value.run_job.assert_called_once()
+            selected_offer = backend_mock.compute.return_value.run_job.call_args[0][2]
+            assert selected_offer.region == "eu-west-1"
+        await session.refresh(job)
+        assert job.status == JobStatus.PROVISIONING
+
 
 @pytest.mark.parametrize(
     ["job_network_mode", "blocks", "multinode", "network_mode", "constraints_are_set"],

From e7bb16221410f9b4757174b6d52edb3016b26577 Mon Sep 17 00:00:00 2001
From: Victor Skvortsov <vds003@gmail.com>
Date: Tue, 11 Nov 2025 09:38:40 +0500
Subject: [PATCH 3/7] Fix tests

---
 .../server/background/tasks/process_submitted_jobs.py      | 7 +++----
 .../server/background/tasks/test_process_submitted_jobs.py | 1 +
 2 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py b/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
index f8bb205e22..c890c48d24 100644
--- a/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
+++ b/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
@@ -585,7 +585,6 @@ async def _refetch_fleet_models_with_instances(
             *instance_filters,
         )
         .options(contains_eager(FleetModel.instances))
-        .execution_options(populate_existing=True)
     )
     fleet_models = list(res.unique().scalars().all())
     return fleet_models
@@ -631,7 +630,7 @@ async def _find_optimal_fleet_with_offers(
         candidate_fleet = fleet_model_to_fleet(candidate_fleet_model)
         if (
             job.job_spec.jobs_per_replica > 1
-            and candidate_fleet.spec.configuration != InstanceGroupPlacement.CLUSTER
+            and candidate_fleet.spec.configuration.placement != InstanceGroupPlacement.CLUSTER
         ):
             # Limit multinode runs to cluster fleets to guarantee best connectivity.
             continue
@@ -826,6 +825,8 @@ async def _assign_job_to_fleet_instance(
     instances_with_offers: list[tuple[InstanceModel, InstanceOfferWithAvailability]],
     multinode: bool,
 ) -> Optional[InstanceModel]:
+    job_model.fleet = fleet_model
+    job_model.instance_assigned = True
     if len(instances_with_offers) == 0:
         return None
 
@@ -851,8 +852,6 @@ async def _assign_job_to_fleet_instance(
         },
     )
     logger.info("%s: now is provisioning on '%s'", fmt(job_model), instance.name)
-    job_model.fleet = fleet_model
-    job_model.instance_assigned = True
     job_model.instance = instance
     job_model.used_instance_id = instance.id
     job_model.job_provisioning_data = instance.job_provisioning_data
diff --git a/src/tests/_internal/server/background/tasks/test_process_submitted_jobs.py b/src/tests/_internal/server/background/tasks/test_process_submitted_jobs.py
index 4d430cb297..c92b8a2301 100644
--- a/src/tests/_internal/server/background/tasks/test_process_submitted_jobs.py
+++ b/src/tests/_internal/server/background/tasks/test_process_submitted_jobs.py
@@ -546,6 +546,7 @@ async def test_assigns_multi_node_job_to_shared_instance(self, test_db, session:
         )
         offer = get_instance_offer_with_availability(gpu_count=8, cpu_count=64, memory_gib=128)
         fleet_spec = get_fleet_spec()
+        fleet_spec.configuration.placement = InstanceGroupPlacement.CLUSTER
         fleet_spec.configuration.nodes = FleetNodesSpec(min=1, target=1, max=None)
         fleet = await create_fleet(session=session, project=project, spec=fleet_spec)
         instance = await create_instance(

From d44fef5df8721791b93db1e227e3806b980d5b64 Mon Sep 17 00:00:00 2001
From: Victor Skvortsov <vds003@gmail.com>
Date: Tue, 11 Nov 2025 10:03:22 +0500
Subject: [PATCH 4/7] Fix fleet lock on sqlite

---
 .../tasks/process_submitted_jobs.py           | 52 +++++++++++++------
 1 file changed, 36 insertions(+), 16 deletions(-)

diff --git a/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py b/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
index c890c48d24..1cc75a216c 100644
--- a/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
+++ b/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
@@ -2,6 +2,7 @@
 import itertools
 import math
 import uuid
+from contextlib import AsyncExitStack
 from datetime import datetime, timedelta
 from typing import List, Optional, Union
 
@@ -170,14 +171,21 @@ async def _process_next_submitted_job():
             lockset.add(job_model.id)
         job_model_id = job_model.id
         try:
-            await _process_submitted_job(session=session, job_model=job_model)
+            async with AsyncExitStack() as exit_stack:
+                await _process_submitted_job(
+                    exit_stack=exit_stack,
+                    session=session,
+                    job_model=job_model,
+                )
         finally:
             lockset.difference_update([job_model_id])
         global last_processed_at
         last_processed_at = common_utils.get_current_datetime()
 
 
-async def _process_submitted_job(session: AsyncSession, job_model: JobModel):
+async def _process_submitted_job(
+    exit_stack: AsyncExitStack, session: AsyncSession, job_model: JobModel
+):
     # Refetch to load related attributes.
     res = await session.execute(
         select(JobModel)
@@ -368,11 +376,19 @@ async def _process_submitted_job(session: AsyncSession, job_model: JobModel):
 
         master_instance_provisioning_data = None
         if job.job_spec.job_num == 0 and fleet_model is not None:
-            # TODO: Lock on SQLite
             fleet = fleet_model_to_fleet(fleet_model)
             if fleet.spec.configuration.placement == InstanceGroupPlacement.CLUSTER:
                 # To avoid violating fleet placement cluster during master provisioning,
                 # we must lock empty fleets and respect existing instances in non-empty fleets.
+                # On SQLite, always take the lock during master provisioning for simplicity.
+                await exit_stack.enter_async_context(
+                    get_locker(get_db().dialect_name).lock_ctx(
+                        FleetModel.__tablename__, [fleet_model.id]
+                    )
+                )
+                if get_db().dialect_name == "sqlite":
+                    # Start new transaction to see committed changes after lock
+                    await session.commit()
                 res = await session.execute(
                     select(FleetModel)
                     .outerjoin(FleetModel.instances)
@@ -381,6 +397,7 @@ async def _process_submitted_job(session: AsyncSession, job_model: JobModel):
                         InstanceModel.id.is_(None),
                     )
                     .with_for_update(key_share=True, of=FleetModel)
+                    .execution_options(populate_existing=True)
                 )
                 empty_fleet_model = res.unique().scalar()
                 if empty_fleet_model is not None:
@@ -390,6 +407,7 @@ async def _process_submitted_job(session: AsyncSession, job_model: JobModel):
                         select(FleetModel)
                         .where(FleetModel.id == fleet_model.id)
                         .options(joinedload(FleetModel.instances))
+                        .execution_options(populate_existing=True)
                     )
                     fleet_model = res.unique().scalar_one()
                 master_instance_provisioning_data = _get_fleet_master_instance_provisioning_data(
@@ -513,19 +531,19 @@ async def _process_submitted_job(session: AsyncSession, job_model: JobModel):
             .order_by(VolumeModel.id)  # take locks in order
             .with_for_update(key_share=True, of=VolumeModel)
         )
-        async with get_locker(get_db().dialect_name).lock_ctx(
-            VolumeModel.__tablename__, volumes_ids
-        ):
-            if len(volume_models) > 0:
-                assert instance is not None
-                await _attach_volumes(
-                    session=session,
-                    project=project,
-                    job_model=job_model,
-                    instance=instance,
-                    volume_models=volume_models,
-                )
-            await session.commit()
+        await exit_stack.enter_async_context(
+            get_locker(get_db().dialect_name).lock_ctx(VolumeModel.__tablename__, volumes_ids)
+        )
+        if len(volume_models) > 0:
+            assert instance is not None
+            await _attach_volumes(
+                session=session,
+                project=project,
+                job_model=job_model,
+                instance=instance,
+                volume_models=volume_models,
+            )
+    await session.commit()
 
 
 async def _select_fleet_models(
@@ -542,6 +560,7 @@ async def _select_fleet_models(
         .options(contains_eager(FleetModel.instances))
         .order_by(InstanceModel.id)  # take locks in order
         .with_for_update(key_share=True, of=InstanceModel)
+        .execution_options(populate_existing=True)
     )
     fleet_models_with_instances = list(res.unique().scalars().all())
     fleet_models_with_instances_ids = [f.id for f in fleet_models_with_instances]
@@ -561,6 +580,7 @@ async def _select_fleet_models(
         # Load empty list of instances so that downstream code
         # knows this fleet has no instances eligible for offers.
         .options(noload(FleetModel.instances))
+        .execution_options(populate_existing=True)
     )
     fleet_models_without_instances = list(res.unique().scalars().all())
     return fleet_models_with_instances, fleet_models_without_instances

From 996ba5b89b780b105cf222de6dd73fcf51f5c3af Mon Sep 17 00:00:00 2001
From: Victor Skvortsov <vds003@gmail.com>
Date: Tue, 11 Nov 2025 12:37:31 +0500
Subject: [PATCH 5/7] Simplify fleet selection code

---
 .../tasks/process_submitted_jobs.py           | 276 ++++++++++--------
 src/dstack/_internal/server/db.py             |  17 ++
 2 files changed, 170 insertions(+), 123 deletions(-)

diff --git a/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py b/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
index 1cc75a216c..bd35c79988 100644
--- a/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
+++ b/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
@@ -50,7 +50,7 @@
 from dstack._internal.core.services.profiles import get_termination
 from dstack._internal.server import settings
 from dstack._internal.server.background.tasks.process_compute_groups import ComputeGroupStatus
-from dstack._internal.server.db import get_db, get_session_ctx
+from dstack._internal.server.db import get_db, get_session_ctx, sqlite_commit
 from dstack._internal.server.models import (
     ComputeGroupModel,
     FleetModel,
@@ -266,25 +266,16 @@ async def _process_submitted_job(
     # Then, the job runs on the assigned instance or a new instance is provisioned.
     # This is needed to avoid holding instances lock for a long time.
     if not job_model.instance_assigned:
-        # If another job freed the instance but is still trying to detach volumes,
-        # do not provision on it to prevent attaching volumes that are currently detaching.
-        detaching_instances_ids = await get_instances_ids_with_detaching_volumes(session)
-
-        fleet_filters = [
-            FleetModel.project_id == project.id,
-            FleetModel.deleted == False,
-        ]
-        if run_model.fleet is not None:
-            fleet_filters.append(FleetModel.id == run_model.fleet_id)
-        if run_spec.merged_profile.fleets is not None:
-            fleet_filters.append(FleetModel.name.in_(run_spec.merged_profile.fleets))
-
-        instance_filters = [
-            InstanceModel.deleted == False,
-            InstanceModel.id.not_in(detaching_instances_ids),
-        ]
-
-        fleet_models_with_instances, fleet_models_without_instances = await _select_fleet_models(
+        fleet_filters, instance_filters = await _get_candidate_fleet_models_filters(
+            session=session,
+            project=project,
+            run_model=run_model,
+            run_spec=run_spec,
+        )
+        (
+            fleet_models_with_instances,
+            fleet_models_without_instances,
+        ) = await _select_fleet_models_with_filters(
             session=session,
             fleet_filters=fleet_filters,
             instance_filters=instance_filters,
@@ -294,63 +285,61 @@ async def _process_submitted_job(
                 [i.id for i in f.instances] for f in fleet_models_with_instances
             )
         )
+        await sqlite_commit(session)
+        await exit_stack.enter_async_context(
+            get_locker(get_db().dialect_name).lock_ctx(InstanceModel.__tablename__, instances_ids)
+        )
         if get_db().dialect_name == "sqlite":
-            # Start new transaction to see committed changes after lock
-            await session.commit()
-
-        async with get_locker(get_db().dialect_name).lock_ctx(
-            InstanceModel.__tablename__, instances_ids
-        ):
-            if get_db().dialect_name == "sqlite":
-                fleets_with_instances_ids = [f.id for f in fleet_models_with_instances]
-                fleet_models_with_instances = await _refetch_fleet_models_with_instances(
-                    session=session,
-                    fleets_ids=fleets_with_instances_ids,
-                    instances_ids=instances_ids,
-                    fleet_filters=fleet_filters,
-                    instance_filters=instance_filters,
-                )
-            fleet_models = fleet_models_with_instances + fleet_models_without_instances
-            fleet_model, fleet_instances_with_offers = await _find_optimal_fleet_with_offers(
-                project=project,
-                fleet_models=fleet_models,
-                run_model=run_model,
-                run_spec=run.run_spec,
-                job=job,
-                master_job_provisioning_data=master_job_provisioning_data,
-                volumes=volumes,
-            )
-            if fleet_model is None:
-                if run_spec.merged_profile.fleets is not None:
-                    # Run cannot create new fleets when fleets are specified
-                    logger.debug("%s: failed to use specified fleets", fmt(job_model))
-                    job_model.status = JobStatus.TERMINATING
-                    job_model.termination_reason = (
-                        JobTerminationReason.FAILED_TO_START_DUE_TO_NO_CAPACITY
-                    )
-                    job_model.last_processed_at = common_utils.get_current_datetime()
-                    await session.commit()
-                    return
-                if FeatureFlags.AUTOCREATED_FLEETS_DISABLED:
-                    logger.debug("%s: no fleet found", fmt(job_model))
-                    job_model.status = JobStatus.TERMINATING
-                    job_model.termination_reason = (
-                        JobTerminationReason.FAILED_TO_START_DUE_TO_NO_CAPACITY
-                    )
-                    job_model.termination_reason_message = "Failed to find fleet"
-                    job_model.last_processed_at = common_utils.get_current_datetime()
-                    await session.commit()
-                    return
-            instance = await _assign_job_to_fleet_instance(
+            fleets_with_instances_ids = [f.id for f in fleet_models_with_instances]
+            fleet_models_with_instances = await _refetch_fleet_models_with_instances(
                 session=session,
-                fleet_model=fleet_model,
-                instances_with_offers=fleet_instances_with_offers,
-                job_model=job_model,
-                multinode=multinode,
+                fleets_ids=fleets_with_instances_ids,
+                instances_ids=instances_ids,
+                fleet_filters=fleet_filters,
+                instance_filters=instance_filters,
             )
-            job_model.last_processed_at = common_utils.get_current_datetime()
-            await session.commit()
-            return
+        fleet_models = fleet_models_with_instances + fleet_models_without_instances
+        fleet_model, fleet_instances_with_offers = await _find_optimal_fleet_with_offers(
+            project=project,
+            fleet_models=fleet_models,
+            run_model=run_model,
+            run_spec=run.run_spec,
+            job=job,
+            master_job_provisioning_data=master_job_provisioning_data,
+            volumes=volumes,
+        )
+        if fleet_model is None:
+            if run_spec.merged_profile.fleets is not None:
+                # Run cannot create new fleets when fleets are specified
+                logger.debug("%s: failed to use specified fleets", fmt(job_model))
+                job_model.status = JobStatus.TERMINATING
+                job_model.termination_reason = (
+                    JobTerminationReason.FAILED_TO_START_DUE_TO_NO_CAPACITY
+                )
+                job_model.termination_reason_message = "Failed to use specified fleets"
+                job_model.last_processed_at = common_utils.get_current_datetime()
+                await session.commit()
+                return
+            if FeatureFlags.AUTOCREATED_FLEETS_DISABLED:
+                logger.debug("%s: no fleet found", fmt(job_model))
+                job_model.status = JobStatus.TERMINATING
+                job_model.termination_reason = (
+                    JobTerminationReason.FAILED_TO_START_DUE_TO_NO_CAPACITY
+                )
+                job_model.termination_reason_message = "Failed to find fleet"
+                job_model.last_processed_at = common_utils.get_current_datetime()
+                await session.commit()
+                return
+        instance = await _assign_job_to_fleet_instance(
+            session=session,
+            fleet_model=fleet_model,
+            instances_with_offers=fleet_instances_with_offers,
+            job_model=job_model,
+            multinode=multinode,
+        )
+        job_model.last_processed_at = common_utils.get_current_datetime()
+        await session.commit()
+        return
 
     # TODO: Volume attachment for compute groups is not yet supported since
     # currently supported compute groups (e.g. Runpod) don't need explicit volume attachment.
@@ -374,47 +363,6 @@ async def _process_submitted_job(
             await session.commit()
             return
 
-        master_instance_provisioning_data = None
-        if job.job_spec.job_num == 0 and fleet_model is not None:
-            fleet = fleet_model_to_fleet(fleet_model)
-            if fleet.spec.configuration.placement == InstanceGroupPlacement.CLUSTER:
-                # To avoid violating fleet placement cluster during master provisioning,
-                # we must lock empty fleets and respect existing instances in non-empty fleets.
-                # On SQLite, always take the lock during master provisioning for simplicity.
-                await exit_stack.enter_async_context(
-                    get_locker(get_db().dialect_name).lock_ctx(
-                        FleetModel.__tablename__, [fleet_model.id]
-                    )
-                )
-                if get_db().dialect_name == "sqlite":
-                    # Start new transaction to see committed changes after lock
-                    await session.commit()
-                res = await session.execute(
-                    select(FleetModel)
-                    .outerjoin(FleetModel.instances)
-                    .where(
-                        FleetModel.id == fleet_model.id,
-                        InstanceModel.id.is_(None),
-                    )
-                    .with_for_update(key_share=True, of=FleetModel)
-                    .execution_options(populate_existing=True)
-                )
-                empty_fleet_model = res.unique().scalar()
-                if empty_fleet_model is not None:
-                    fleet_model = empty_fleet_model
-                else:
-                    res = await session.execute(
-                        select(FleetModel)
-                        .where(FleetModel.id == fleet_model.id)
-                        .options(joinedload(FleetModel.instances))
-                        .execution_options(populate_existing=True)
-                    )
-                    fleet_model = res.unique().scalar_one()
-                master_instance_provisioning_data = _get_fleet_master_instance_provisioning_data(
-                    fleet_model=fleet_model,
-                    fleet_spec=fleet.spec,
-                )
-
         jobs_to_provision = [job]
         if (
             multinode
@@ -426,6 +374,14 @@ async def _process_submitted_job(
         ):
             jobs_to_provision = replica_jobs
 
+        master_instance_provisioning_data = (
+            await _fetch_fleet_with_master_instance_provisioning_data(
+                exit_stack=exit_stack,
+                session=session,
+                fleet_model=fleet_model,
+                job=job,
+            )
+        )
         master_provisioning_data = (
             master_job_provisioning_data or master_instance_provisioning_data
         )
@@ -450,6 +406,7 @@ async def _process_submitted_job(
 
         if fleet_model is None:
             fleet_model = await _create_fleet_model_for_job(
+                exit_stack=exit_stack,
                 session=session,
                 project=project,
                 run=run,
@@ -521,9 +478,9 @@ async def _process_submitted_job(
 
     volumes_ids = sorted([v.id for vs in volume_models for v in vs])
     if need_volume_attachment:
-        # TODO: Lock instances for attaching volumes?
         # Take lock to prevent attaching volumes that are to be deleted.
         # If the volume was deleted before the lock, the volume will fail to attach and the job will fail.
+        # TODO: Lock instances for attaching volumes?
         await session.execute(
             select(VolumeModel)
             .where(VolumeModel.id.in_(volumes_ids))
@@ -546,7 +503,31 @@ async def _process_submitted_job(
     await session.commit()
 
 
-async def _select_fleet_models(
+async def _get_candidate_fleet_models_filters(
+    session: AsyncSession,
+    project: ProjectModel,
+    run_model: RunModel,
+    run_spec: RunSpec,
+) -> tuple[list, list]:
+    # If another job freed the instance but is still trying to detach volumes,
+    # do not provision on it to prevent attaching volumes that are currently detaching.
+    detaching_instances_ids = await get_instances_ids_with_detaching_volumes(session)
+    fleet_filters = [
+        FleetModel.project_id == project.id,
+        FleetModel.deleted == False,
+    ]
+    if run_model.fleet is not None:
+        fleet_filters.append(FleetModel.id == run_model.fleet_id)
+    if run_spec.merged_profile.fleets is not None:
+        fleet_filters.append(FleetModel.name.in_(run_spec.merged_profile.fleets))
+    instance_filters = [
+        InstanceModel.deleted == False,
+        InstanceModel.id.not_in(detaching_instances_ids),
+    ]
+    return fleet_filters, instance_filters
+
+
+async def _select_fleet_models_with_filters(
     session: AsyncSession, fleet_filters: list, instance_filters: list
 ) -> tuple[list[FleetModel], list[FleetModel]]:
     # Selecting fleets in two queries since Postgres does not allow
@@ -577,8 +558,6 @@ async def _select_fleet_models(
                 not_(and_(*instance_filters)),
             )
         )
-        # Load empty list of instances so that downstream code
-        # knows this fleet has no instances eligible for offers.
         .options(noload(FleetModel.instances))
         .execution_options(populate_existing=True)
     )
@@ -765,6 +744,54 @@ def _get_fleet_master_instance_provisioning_data(
     return master_instance_provisioning_data
 
 
+async def _fetch_fleet_with_master_instance_provisioning_data(
+    exit_stack: AsyncExitStack,
+    session: AsyncSession,
+    fleet_model: Optional[FleetModel],
+    job: Job,
+) -> Optional[JobProvisioningData]:
+    master_instance_provisioning_data = None
+    if job.job_spec.job_num == 0 and fleet_model is not None:
+        fleet = fleet_model_to_fleet(fleet_model)
+        if fleet.spec.configuration.placement == InstanceGroupPlacement.CLUSTER:
+            # To avoid violating fleet placement cluster during master provisioning,
+            # we must lock empty fleets and respect existing instances in non-empty fleets.
+            # On SQLite always take the lock during master provisioning for simplicity.
+            await exit_stack.enter_async_context(
+                get_locker(get_db().dialect_name).lock_ctx(
+                    FleetModel.__tablename__, [fleet_model.id]
+                )
+            )
+            await sqlite_commit(session)
+            res = await session.execute(
+                select(FleetModel)
+                .outerjoin(FleetModel.instances)
+                .where(
+                    FleetModel.id == fleet_model.id,
+                    InstanceModel.id.is_(None),
+                )
+                .with_for_update(key_share=True, of=FleetModel)
+                .execution_options(populate_existing=True)
+                .options(noload(FleetModel.instances))
+            )
+            empty_fleet_model = res.unique().scalar()
+            if empty_fleet_model is not None:
+                fleet_model = empty_fleet_model
+            else:
+                res = await session.execute(
+                    select(FleetModel)
+                    .where(FleetModel.id == fleet_model.id)
+                    .options(joinedload(FleetModel.instances))
+                    .execution_options(populate_existing=True)
+                )
+                fleet_model = res.unique().scalar_one()
+            master_instance_provisioning_data = _get_fleet_master_instance_provisioning_data(
+                fleet_model=fleet_model,
+                fleet_spec=fleet.spec,
+            )
+    return master_instance_provisioning_data
+
+
 def _run_can_fit_into_fleet(run_spec: RunSpec, fleet: Fleet) -> bool:
     """
     Returns `False` if the run cannot fit into fleet for sure.
@@ -1032,6 +1059,7 @@ def _can_create_new_instance_in_fleet(fleet: Fleet) -> bool:
 
 
 async def _create_fleet_model_for_job(
+    exit_stack: AsyncExitStack,
     session: AsyncSession,
     project: ProjectModel,
     run: Run,
@@ -1040,16 +1068,18 @@ async def _create_fleet_model_for_job(
     if run.run_spec.configuration.type == "task" and run.run_spec.configuration.nodes > 1:
         placement = InstanceGroupPlacement.CLUSTER
     nodes = _get_nodes_required_num_for_run(run.run_spec)
-
     lock_namespace = f"fleet_names_{project.name}"
-    # TODO: Lock fleet names on SQLite.
-    # Needs some refactoring so that the lock is released after commit.
+    if get_db().dialect_name == "sqlite":
+        # Start new transaction to see committed changes after lock
+        await session.commit()
     if get_db().dialect_name == "postgresql":
         await session.execute(
             select(func.pg_advisory_xact_lock(string_to_lock_id(lock_namespace)))
         )
+    await exit_stack.enter_async_context(
+        get_locker(get_db().dialect_name).get_lockset(lock_namespace)[0]
+    )
     fleet_name = await generate_fleet_name(session=session, project=project)
-
     spec = FleetSpec(
         configuration=FleetConfiguration(
             name=fleet_name,
diff --git a/src/dstack/_internal/server/db.py b/src/dstack/_internal/server/db.py
index 084630add1..c9ed8d5280 100644
--- a/src/dstack/_internal/server/db.py
+++ b/src/dstack/_internal/server/db.py
@@ -103,6 +103,23 @@ async def new_func(*args, **kwargs):
     return new_func
 
 
+def is_db_sqlite() -> bool:
+    return get_db().dialect_name == "sqlite"
+
+
+def is_db_postgres() -> bool:
+    return get_db().dialect_name == "postgresql"
+
+
+async def sqlite_commit(session: AsyncSession):
+    """
+    Commit an sqlite transaction.
+    Should be used before taking locks in active sessions to see committed changes.
+    """
+    if is_db_sqlite():
+        await session.commit()
+
+
 def _run_alembic_upgrade(connection):
     alembic_cfg = config.Config()
     alembic_cfg.set_main_option("script_location", settings.ALEMBIC_MIGRATIONS_LOCATION)

From d636b976eae8023b69261cbae821b14c725ef9eb Mon Sep 17 00:00:00 2001
From: Victor Skvortsov <vds003@gmail.com>
Date: Tue, 11 Nov 2025 12:53:00 +0500
Subject: [PATCH 6/7] Recommend AsyncExitStack

---
 contributing/LOCKING.md | 28 ++++++++++++++++++++++++++++
 1 file changed, 28 insertions(+)

diff --git a/contributing/LOCKING.md b/contributing/LOCKING.md
index 54ee31991c..e23fb41f9e 100644
--- a/contributing/LOCKING.md
+++ b/contributing/LOCKING.md
@@ -108,3 +108,31 @@ Note that:
 
 * This pattern works assuming that Postgres is using default isolation level Read Committed. By the time a transaction acquires the advisory lock, all other transactions that can take the name have committed, so their changes can be seen and a unique name is taken.
 * SQLite needs a commit before selecting taken names due to Snapshot Isolation as noted above.
+
+**Use `AsyncExitStack`**
+
+In-memory locking typically requires taking lock for long (until commit).
+Using lock context managers for in-memory locking is often hard because the lock is tied to a block:
+
+```python
+if something:
+    # Can't do this because the lock will be released before commit. How to lock?
+    async with get_locker(get_db().dialect_name).lock_ctx(...):
+        # ...
+# ...
+await session.commit()
+```
+
+Use [`contextlib.AsyncExitStack`](https://docs.python.org/3/library/contextlib.html#contextlib.AsyncExitStack):
+
+```python
+async with AsyncExitStack() as exit_stack:
+    if something:
+        # The lock will be released only on stack exit, so it's ok.
+        await exit_stack.enter_async_context(
+            get_locker(get_db().dialect_name).lock_ctx(...)
+        )
+        # ...
+    # ...
+    await session.commit()
+```

From 99ceb497b75d7f502944b2195297c5aa84c57823 Mon Sep 17 00:00:00 2001
From: Victor Skvortsov <vds003@gmail.com>
Date: Tue, 11 Nov 2025 12:59:30 +0500
Subject: [PATCH 7/7] Use is_db_sqlite() and is_db_postgres()

---
 .../background/tasks/process_submitted_jobs.py     | 14 ++++++++++----
 src/dstack/_internal/server/services/fleets.py     |  7 +++----
 .../_internal/server/services/gateways/__init__.py |  7 +++----
 src/dstack/_internal/server/services/runs.py       |  7 +++----
 src/dstack/_internal/server/services/volumes.py    |  7 +++----
 5 files changed, 22 insertions(+), 20 deletions(-)

diff --git a/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py b/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
index bd35c79988..9f281a75b2 100644
--- a/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
+++ b/src/dstack/_internal/server/background/tasks/process_submitted_jobs.py
@@ -50,7 +50,13 @@
 from dstack._internal.core.services.profiles import get_termination
 from dstack._internal.server import settings
 from dstack._internal.server.background.tasks.process_compute_groups import ComputeGroupStatus
-from dstack._internal.server.db import get_db, get_session_ctx, sqlite_commit
+from dstack._internal.server.db import (
+    get_db,
+    get_session_ctx,
+    is_db_postgres,
+    is_db_sqlite,
+    sqlite_commit,
+)
 from dstack._internal.server.models import (
     ComputeGroupModel,
     FleetModel,
@@ -289,7 +295,7 @@ async def _process_submitted_job(
         await exit_stack.enter_async_context(
             get_locker(get_db().dialect_name).lock_ctx(InstanceModel.__tablename__, instances_ids)
         )
-        if get_db().dialect_name == "sqlite":
+        if is_db_sqlite():
             fleets_with_instances_ids = [f.id for f in fleet_models_with_instances]
             fleet_models_with_instances = await _refetch_fleet_models_with_instances(
                 session=session,
@@ -1069,10 +1075,10 @@ async def _create_fleet_model_for_job(
         placement = InstanceGroupPlacement.CLUSTER
     nodes = _get_nodes_required_num_for_run(run.run_spec)
     lock_namespace = f"fleet_names_{project.name}"
-    if get_db().dialect_name == "sqlite":
+    if is_db_sqlite():
         # Start new transaction to see committed changes after lock
         await session.commit()
-    if get_db().dialect_name == "postgresql":
+    elif is_db_postgres():
         await session.execute(
             select(func.pg_advisory_xact_lock(string_to_lock_id(lock_namespace)))
         )
diff --git a/src/dstack/_internal/server/services/fleets.py b/src/dstack/_internal/server/services/fleets.py
index 0e3aaf2d4b..7ee0bbfab2 100644
--- a/src/dstack/_internal/server/services/fleets.py
+++ b/src/dstack/_internal/server/services/fleets.py
@@ -45,7 +45,7 @@
 from dstack._internal.core.models.users import GlobalRole
 from dstack._internal.core.services import validate_dstack_resource_name
 from dstack._internal.core.services.diff import ModelDiff, copy_model, diff_models
-from dstack._internal.server.db import get_db
+from dstack._internal.server.db import get_db, is_db_postgres, is_db_sqlite
 from dstack._internal.server.models import (
     FleetModel,
     InstanceModel,
@@ -675,14 +675,13 @@ async def _create_fleet(
     spec: FleetSpec,
 ) -> Fleet:
     lock_namespace = f"fleet_names_{project.name}"
-    if get_db().dialect_name == "sqlite":
+    if is_db_sqlite():
         # Start new transaction to see committed changes after lock
         await session.commit()
-    elif get_db().dialect_name == "postgresql":
+    elif is_db_postgres():
         await session.execute(
             select(func.pg_advisory_xact_lock(string_to_lock_id(lock_namespace)))
         )
-
     lock, _ = get_locker(get_db().dialect_name).get_lockset(lock_namespace)
     async with lock:
         if spec.configuration.name is not None:
diff --git a/src/dstack/_internal/server/services/gateways/__init__.py b/src/dstack/_internal/server/services/gateways/__init__.py
index f47b192999..afad2831b7 100644
--- a/src/dstack/_internal/server/services/gateways/__init__.py
+++ b/src/dstack/_internal/server/services/gateways/__init__.py
@@ -38,7 +38,7 @@
 )
 from dstack._internal.core.services import validate_dstack_resource_name
 from dstack._internal.server import settings
-from dstack._internal.server.db import get_db
+from dstack._internal.server.db import get_db, is_db_postgres, is_db_sqlite
 from dstack._internal.server.models import (
     GatewayComputeModel,
     GatewayModel,
@@ -148,14 +148,13 @@ async def create_gateway(
     )
 
     lock_namespace = f"gateway_names_{project.name}"
-    if get_db().dialect_name == "sqlite":
+    if is_db_sqlite():
         # Start new transaction to see committed changes after lock
         await session.commit()
-    elif get_db().dialect_name == "postgresql":
+    elif is_db_postgres():
         await session.execute(
             select(func.pg_advisory_xact_lock(string_to_lock_id(lock_namespace)))
         )
-
     lock, _ = get_locker(get_db().dialect_name).get_lockset(lock_namespace)
     async with lock:
         if configuration.name is None:
diff --git a/src/dstack/_internal/server/services/runs.py b/src/dstack/_internal/server/services/runs.py
index ed64aa7219..870b378a8e 100644
--- a/src/dstack/_internal/server/services/runs.py
+++ b/src/dstack/_internal/server/services/runs.py
@@ -58,7 +58,7 @@
 from dstack._internal.core.services import validate_dstack_resource_name
 from dstack._internal.core.services.diff import diff_models
 from dstack._internal.server import settings
-from dstack._internal.server.db import get_db
+from dstack._internal.server.db import get_db, is_db_postgres, is_db_sqlite
 from dstack._internal.server.models import (
     FleetModel,
     JobModel,
@@ -510,14 +510,13 @@ async def submit_run(
     )
 
     lock_namespace = f"run_names_{project.name}"
-    if get_db().dialect_name == "sqlite":
+    if is_db_sqlite():
         # Start new transaction to see committed changes after lock
         await session.commit()
-    elif get_db().dialect_name == "postgresql":
+    elif is_db_postgres():
         await session.execute(
             select(func.pg_advisory_xact_lock(string_to_lock_id(lock_namespace)))
         )
-
     lock, _ = get_locker(get_db().dialect_name).get_lockset(lock_namespace)
     async with lock:
         # FIXME: delete_runs commits, so Postgres lock is released too early.
diff --git a/src/dstack/_internal/server/services/volumes.py b/src/dstack/_internal/server/services/volumes.py
index f52f1f064f..fa3471192d 100644
--- a/src/dstack/_internal/server/services/volumes.py
+++ b/src/dstack/_internal/server/services/volumes.py
@@ -24,7 +24,7 @@
     VolumeStatus,
 )
 from dstack._internal.core.services import validate_dstack_resource_name
-from dstack._internal.server.db import get_db
+from dstack._internal.server.db import get_db, is_db_postgres, is_db_sqlite
 from dstack._internal.server.models import (
     InstanceModel,
     ProjectModel,
@@ -215,14 +215,13 @@ async def create_volume(
     _validate_volume_configuration(configuration)
 
     lock_namespace = f"volume_names_{project.name}"
-    if get_db().dialect_name == "sqlite":
+    if is_db_sqlite():
         # Start new transaction to see committed changes after lock
         await session.commit()
-    elif get_db().dialect_name == "postgresql":
+    elif is_db_postgres():
         await session.execute(
             select(func.pg_advisory_xact_lock(string_to_lock_id(lock_namespace)))
         )
-
     lock, _ = get_locker(get_db().dialect_name).get_lockset(lock_namespace)
     async with lock:
         if configuration.name is not None: