add a unit test

ashors1 · ashors1 · commit 18ce2fcfaaa8 · 2025-04-29T14:14:12.000-07:00
Signed-off-by: ashors1 &lt;ashors@nvidia.com&gt;
diff --git a/tests/unit/data/test_llm_message_utils.py b/tests/unit/data/test_llm_message_utils.py
@@ -18,6 +18,7 @@
 from transformers import AutoTokenizer
 
 from nemo_rl.data.llm_message_utils import (
+    _validate_tensor_consistency,
     message_log_to_flat_messages,
     get_keys_from_message_log,
     batched_message_log_to_flat_message,
@@ -405,6 +406,21 @@ def test_get_formatted_message_log_qwen(
     assert actual_text == expected_text
 
 
+def test_formatted_message_log_empty_message():
+    message_log = [
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": ""},
+    ]
+    tokenizer = AutoTokenizer.from_pretrained("meta-llama/Meta-Llama-3-8B-Instruct")
+    task_data_spec = TaskDataSpec(task_name="test")
+    result = get_formatted_message_log(message_log, tokenizer, task_data_spec)
+    flat_result = message_log_to_flat_messages(result)
+    for k in flat_result.keys():
+        if isinstance(flat_result[k], torch.Tensor):
+            # make sure validate_tensor_consistency does not raise an error when one of the messages is empty
+            _validate_tensor_consistency([flat_result[k]])
+
+
 def test_add_loss_mask_to_chat_message_log(
     tokenized_chat_message_log: LLMMessageLogType,
 ):