From 324c314c1879a3cc8f9575ffff36531798c5a213 Mon Sep 17 00:00:00 2001
From: CSY-ModelCloud <csy@modelcloud.ai>
Date: Tue, 28 Apr 2026 14:51:41 +0800
Subject: [PATCH] fix old transformers has a different func name

---
 tests/test_gptqmodel_engine.py | 4 +++-
 1 file changed, 3 insertions(+), 1 deletion(-)

diff --git a/tests/test_gptqmodel_engine.py b/tests/test_gptqmodel_engine.py
index f9c76ea..c7d1809 100644
--- a/tests/test_gptqmodel_engine.py
+++ b/tests/test_gptqmodel_engine.py
@@ -547,7 +547,9 @@ def test_gptqmodel_engine_can_generate_and_score_on_cuda() -> None:
     assert math.isfinite(scores[0].logprob)
     assert session.input_device.type == "cuda"
     execution = session.describe_execution()
-    assert execution["generation_backend"] == "continuous_batching"
+    # Some transformers versions can fail paged continuous batching at runtime
+    # and transparently fall back to standard generate().
+    assert execution["generation_backend"] in {"continuous_batching", "generate"}
     assert execution["effective_attn_implementation"] == "paged|flash_attention_2"
     assert execution["paged_attention"] is True
     assert execution["quant_method"] == "gptq"