sgl-project · slin1237 · Nov 15, 2025 · Nov 15, 2025 · gemini-code-assist · Nov 15, 2025
diff --git a/sgl-router/py_test/integration_mock/test_circuit_breaker.py b/sgl-router/py_test/integration_mock/test_circuit_breaker.py
@@ -112,17 +112,28 @@ def test_circuit_breaker_disable_flag(router_manager, mock_workers):
             "disable_retries": True,
         },
     )
-    r = requests.post(
-        f"{rh.url}/v1/completions",
-        json={
-            "model": "test-model",
-            "prompt": "x",
-            "max_tokens": 1,
-            "stream": False,
-        },
-        timeout=3,
-    )
-    assert r.status_code == 500
+
+    saw_500 = False
+    for _ in range(8):
+        r = requests.post(
+            f"{rh.url}/v1/completions",
+            json={
+                "model": "test-model",
+                "prompt": "x",
+                "max_tokens": 1,
+                "stream": False,
+            },
+            timeout=3,
+        )
+        if r.status_code == 500:
+            # Worker starts, continue to check
+            saw_500 = True
+            break
+        assert (
+            r.status_code == 503
+        ), "Should only see 503 when waiting for worker to start"
+
+    assert saw_500
-    assert saw_500
+    assert saw_500, "Worker did not return status 500 after retries"
-    assert saw_500
+    assert saw_500, "Worker did not return status 500 after retries"
 
 
 @pytest.mark.integration

diff --git a/sgl-router/py_test/integration_mock/test_retries.py b/sgl-router/py_test/integration_mock/test_retries.py
@@ -47,15 +47,25 @@ def test_disable_retries_surfaces_failure(router_manager, mock_workers):
         },
     )
 
-    r = requests.post(
-        f"{rh.url}/v1/completions",
-        json={
-            "model": "test-model",
-            "prompt": "x",
-            "max_tokens": 1,
-            "stream": False,
-        },
-        timeout=5,
-    )
-    assert r.status_code == 500
+    saw_500 = False
+    for _ in range(8):
+        r = requests.post(
+            f"{rh.url}/v1/completions",
+            json={
+                "model": "test-model",
+                "prompt": "x",
+                "max_tokens": 1,
+                "stream": False,
+            },
+            timeout=5,
+        )
+        if r.status_code == 500:
+            # Worker starts, continue to check
+            saw_500 = True
+            break
+        assert (
+            r.status_code == 503
+        ), "Should only see 503 when waiting for worker to start"
+
+    assert saw_500
-    assert saw_500
+    assert saw_500, "Worker did not return status 500 after retries"
-    assert saw_500
+    assert saw_500, "Worker did not return status 500 after retries"
     # mock_workers fixture handles cleanup