Add VLLM_PROFILE_* flags to V1 by madamczyk-intel · Pull Request #1203 · HabanaAI/vllm-fork

madamczyk-intel · 2025-05-06T10:32:45Z

Introduces two new env variables VLLM_PROFILE_PROMPT and VLLM_PROFILE_DECODE. When either is specified, vllm will profile a single batch with given parameters.

VLLM_PROFILE_PROMPT=<BS>,<QUERY_LEN>,<MAX_BLOCKS>
VLLM_PROFILE_DECODE=<BS>,<TOTAL_BLOCKS>

BS - batch size
QUERY_LEN - query length
MAX_BLOCKS - max context blocks used in a batch
TOTAL_BLOCKS - total number of blocks used in a batch

When both variables are present a single mixed batch (profile + decode) will be created.

Signed-off-by: Michal Adamczyk <madamczyk@habana.ai>

…v1_add_profiling

Signed-off-by: Michal Adamczyk <madamczyk@habana.ai>

madamczyk-intel · 2025-05-06T11:15:33Z

/run-gaudi-tests

michalkuligowski · 2025-05-06T13:13:12Z

/run-gaudi-tests

madamczyk-intel · 2025-05-07T10:06:39Z

/run-gaudi-tests

madamczyk-intel · 2025-05-07T10:30:56Z

/run-gaudi-tests

Signed-off-by: Michal Adamczyk <madamczyk@habana.ai>

madamczyk-intel · 2025-05-07T10:48:43Z

/run-gaudi-tests

madamczyk-intel added 4 commits May 5, 2025 15:13

Add initial support for profiling flags

51928e9

Signed-off-by: Michal Adamczyk <madamczyk@habana.ai>

Merge remote-tracking branch 'origin/habana_main' into dev/madamczyk/…

9fed5cc

…v1_add_profiling

Cleanup

28c55c4

Signed-off-by: Michal Adamczyk <madamczyk@habana.ai>

Cleanup

101dd4a

Signed-off-by: Michal Adamczyk <madamczyk@habana.ai>

madamczyk-intel requested review from afierka-intel, jikunshang, kzawora-intel, mgawarkiewicz-intel, michalkuligowski, vivekgoe and xuechendi as code owners May 6, 2025 10:32

Add warning when there is mismatch between use_graphs and enforce_eager

5f75fa1

Signed-off-by: Michal Adamczyk <madamczyk@habana.ai>

Merge branch 'habana_main' into dev/madamczyk/v1_add_profiling

3c2a48d

Merge branch 'habana_main' into dev/madamczyk/v1_add_profiling

9e4c1f1

madamczyk-intel requested a review from mswiniarsk as a code owner May 7, 2025 10:04

Merge branch 'habana_main' into dev/madamczyk/v1_add_profiling

60c84f5

Merge branch 'habana_main' into dev/madamczyk/v1_add_profiling

9a18a9f

Switch prompt configuration to (bs, query_len, num_blocks)

bbbafd9

Signed-off-by: Michal Adamczyk <madamczyk@habana.ai>

kzawora-intel approved these changes May 8, 2025

View reviewed changes

kzawora-intel merged commit 6c3e443 into habana_main May 8, 2025
43 checks passed

kzawora-intel deleted the dev/madamczyk/v1_add_profiling branch May 8, 2025 12:35

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add VLLM_PROFILE_* flags to V1#1203

Add VLLM_PROFILE_* flags to V1#1203
kzawora-intel merged 10 commits intohabana_mainfrom
dev/madamczyk/v1_add_profiling

madamczyk-intel commented May 6, 2025 •

edited by github-actions Bot

Loading

Uh oh!

madamczyk-intel commented May 6, 2025

Uh oh!

michalkuligowski commented May 6, 2025

Uh oh!

madamczyk-intel commented May 7, 2025

Uh oh!

madamczyk-intel commented May 7, 2025

Uh oh!

madamczyk-intel commented May 7, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Conversation

madamczyk-intel commented May 6, 2025 • edited by github-actions Bot Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

madamczyk-intel commented May 6, 2025

Uh oh!

michalkuligowski commented May 6, 2025

Uh oh!

madamczyk-intel commented May 7, 2025

Uh oh!

madamczyk-intel commented May 7, 2025

Uh oh!

madamczyk-intel commented May 7, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

madamczyk-intel commented May 6, 2025 •

edited by github-actions Bot

Loading