sgl-project · hnyls2002 · Oct 24, 2025 · Oct 24, 2025 · gemini-code-assist · Oct 24, 2025
@@ -587,13 +587,11 @@ def create_moe_runner(
         self, layer: torch.nn.Module, moe_runner_config: MoeRunnerConfig
     ):
         self.moe_runner_config = moe_runner_config
-        backend = get_moe_runner_backend()
-        if backend.is_auto():
-            backend = (
-                MoeRunnerBackend.TRITON_KERNELS
-                if self.use_triton_kernels
-                else MoeRunnerBackend.TRITON
-            )
+        backend = (
+            MoeRunnerBackend.TRITON_KERNELS
+            if self.use_triton_kernels
+            else MoeRunnerBackend.TRITON
+        )
-        backend = (
-            MoeRunnerBackend.TRITON_KERNELS
-            if self.use_triton_kernels
-            else MoeRunnerBackend.TRITON
-        )
+        # TODO(https://github.com/sgl-project/sglang/issues/12059): This is a temporary fix to avoid a crash with unsupported backends.
+        # This should be refactored for more flexible backend selection in the future.
+        backend = (
+            MoeRunnerBackend.TRITON_KERNELS
+            if self.use_triton_kernels
+            else MoeRunnerBackend.TRITON
+        )
-        backend = (
-            MoeRunnerBackend.TRITON_KERNELS
-            if self.use_triton_kernels
-            else MoeRunnerBackend.TRITON
-        )
+        # TODO(https://github.com/sgl-project/sglang/issues/12059): This is a temporary fix to avoid a crash with unsupported backends.
+        # This should be refactored for more flexible backend selection in the future.
+        backend = (
+            MoeRunnerBackend.TRITON_KERNELS
+            if self.use_triton_kernels
+            else MoeRunnerBackend.TRITON
+        )
         self.runner = MoeRunner(backend, moe_runner_config)
 
     def apply(

@@ -8,12 +8,7 @@
 
 from sglang.srt.custom_op import CustomOp
 from sglang.srt.layers.amx_utils import _amx_process_weight_after_loading
-from sglang.srt.layers.moe import (
-    MoeRunner,
-    MoeRunnerBackend,
-    MoeRunnerConfig,
-    get_moe_runner_backend,
-)
+from sglang.srt.layers.moe import MoeRunner, MoeRunnerBackend, MoeRunnerConfig
 from sglang.srt.layers.moe.moe_runner.triton import TritonMoeQuantInfo
 from sglang.srt.layers.quantization.base_config import (
     FusedMoEMethodBase,
@@ -225,13 +220,11 @@ def create_moe_runner(
         self, layer: torch.nn.Module, moe_runner_config: MoeRunnerConfig
     ):
         self.moe_runner_config = moe_runner_config
-        backend = get_moe_runner_backend()
-        if backend.is_auto():
-            backend = (
-                MoeRunnerBackend.TRITON_KERNELS
-                if self.use_triton_kernels
-                else MoeRunnerBackend.TRITON
-            )
+        backend = (
+            MoeRunnerBackend.TRITON_KERNELS
+            if self.use_triton_kernels
+            else MoeRunnerBackend.TRITON
+        )
-        backend = (
-            MoeRunnerBackend.TRITON_KERNELS
-            if self.use_triton_kernels
-            else MoeRunnerBackend.TRITON
-        )
+        # TODO(https://github.com/sgl-project/sglang/issues/12059): This is a temporary fix to avoid a crash with unsupported backends.
+        # This should be refactored for more flexible backend selection in the future.
+        backend = (
+            MoeRunnerBackend.TRITON_KERNELS
+            if self.use_triton_kernels
+            else MoeRunnerBackend.TRITON
+        )
-        backend = (
-            MoeRunnerBackend.TRITON_KERNELS
-            if self.use_triton_kernels
-            else MoeRunnerBackend.TRITON
-        )
+        # TODO(https://github.com/sgl-project/sglang/issues/12059): This is a temporary fix to avoid a crash with unsupported backends.
+        # This should be refactored for more flexible backend selection in the future.
+        backend = (
+            MoeRunnerBackend.TRITON_KERNELS
+            if self.use_triton_kernels
+            else MoeRunnerBackend.TRITON
+        )
         self.runner = MoeRunner(backend, moe_runner_config)
 
     def apply(