[fix] Only enable flashinfer all reduce fusion by default for single-node servers by leejnau · Pull Request #12724 · sgl-project/sglang

leejnau · 2025-11-06T01:30:24Z

Motivation

Currently multi-node non-data-parallel inference does not work for DeepseekV3ForCausalLM models.
This is due to a bug in flashinfer: flashinfer-ai/flashinfer#2006

Modifications

Currently enable_flashinfer_allreduce_fusion is enabled by default for DeepseekV3ForCausalLM and GptOssForCausalLM. Because of the flashinfer all reduce fusion bug, a workaround is to only enable flashinfer all reduce fusion if a single node is used.

gemini-code-assist · 2025-11-06T01:30:27Z

Warning

You have reached your daily quota limit. Please wait up to 24 hours and I will start processing your requests again!

leejnau changed the title ~~Only enable flashinfer all reduce fusion by default for single-node servers~~ [fix] Only enable flashinfer all reduce fusion by default for single-node servers Nov 6, 2025

Fridge003 approved these changes Nov 6, 2025

View reviewed changes

Fridge003 added the run-ci label Nov 6, 2025

only enable_flashinfer_allreduce_fusion by default for 1 node

8069e8f

leejnau force-pushed the workaround-flashinfer-allreduce-fusion-bug branch from 2c40110 to 8069e8f Compare November 6, 2025 15:26

trevor-m approved these changes Nov 6, 2025

View reviewed changes

Fridge003 merged commit b0d1c21 into sgl-project:main Nov 6, 2025
63 of 68 checks passed

eugr mentioned this pull request Dec 3, 2025

[Feature] NVIDIA DGX Spark (GB10, sm_121a) Support Tracking #11658

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Comments

[fix] Only enable flashinfer all reduce fusion by default for single-node servers#12724

[fix] Only enable flashinfer all reduce fusion by default for single-node servers#12724
Fridge003 merged 1 commit intosgl-project:mainfrom
leejnau:workaround-flashinfer-allreduce-fusion-bug

leejnau commented Nov 6, 2025

Uh oh!

gemini-code-assist bot commented Nov 6, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Comments

Conversation

leejnau commented Nov 6, 2025

Motivation

Modifications

Uh oh!

gemini-code-assist bot commented Nov 6, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants