NVIDIA-NeMo · parthchadha · Apr 2, 2025 · Apr 2, 2025 · Apr 2, 2025
@@ -472,7 +472,7 @@ def grpo_train(
                 # Convert LLMMessageLogType to FlatMessagesType for generation
                 batched_flat, input_lengths = batched_message_log_to_flat_message(
                     repeated_batch["message_log"],
-                    pad_value_dict={"token_ids": tokenizer.eos_token_id},
+                    pad_value_dict={"token_ids": tokenizer.pad_token_id},
                 )
                 input_ids = batched_flat["token_ids"]
                 # Create generation-specific input structure
@@ -547,7 +547,7 @@ def grpo_train(
                 # Convert updated LLMMessageLogType to FlatMessagesType for training
                 flat_messages, input_lengths = batched_message_log_to_flat_message(
                     repeated_batch["message_log"],
-                    pad_value_dict={"token_ids": tokenizer.eos_token_id},
+                    pad_value_dict={"token_ids": tokenizer.pad_token_id},
                 )
 
                 # Create training data from flattened messages
@@ -704,7 +704,7 @@ def validate(
             # Convert LLMMessageLogType to FlatMessagesType for generation
             batched_flat, input_lengths = batched_message_log_to_flat_message(
                 val_batch["message_log"],
-                pad_value_dict={"token_ids": tokenizer.eos_token_id},
+                pad_value_dict={"token_ids": tokenizer.pad_token_id},
             )
             # Extract input IDs
             input_ids = batched_flat["token_ids"]

@@ -243,7 +243,7 @@ def validate(
 
             cat_and_padded, input_lengths = batched_message_log_to_flat_message(
                 val_batch["message_log"],
-                pad_value_dict={"token_ids": tokenizer.eos_token_id},
+                pad_value_dict={"token_ids": tokenizer.pad_token_id},
             )
 
             val_data: BatchedDataDict = BatchedDataDict(
@@ -356,7 +356,7 @@ def sft_train(
 
                 cat_and_padded, input_lengths = batched_message_log_to_flat_message(
                     batch["message_log"],
-                    pad_value_dict={"token_ids": tokenizer.eos_token_id},
+                    pad_value_dict={"token_ids": tokenizer.pad_token_id},
                 )
 
                 train_data: BatchedDataDict = BatchedDataDict(

@@ -44,6 +44,11 @@ def verify_right_padding(
         f"data must be a BatchedDataDict, got type: {type(data)}"
     )
 
+    assert pad_value is not None, (
+        "Tokenizer does not have a pad token assigned. \n"
+        "If the default tokenizer does not have a pad token, you can assign it the value of eos token by tokenizer.pad_token = tokenizer.eos_token"
+    )
+
     # Determine which type of data we're dealing with
     if "input_ids" in data and "input_lengths" in data:
         # GenerationDatumSpec