huggingface · IgnazioDS · Apr 2, 2026 · lhoestq · Apr 7, 2026
diff --git a/src/datasets/iterable_dataset.py b/src/datasets/iterable_dataset.py
@@ -3848,7 +3848,13 @@ def add_column(self, name: str, column: Union[list, np.array]) -> "IterableDatas
         Returns:
             `IterableDataset`
         """
-        return self.map(partial(add_column_fn, name=name, column=column), with_indices=True)
+        # Preserve existing features and extend them with the new column's inferred type.
+        # Without this, map() would set info.features=None (its default), losing all schema info.
+        new_features = None
+        if self._info.features is not None:
+            column_features = _infer_features_from_batch({name: list(column)})
-            column_features = _infer_features_from_batch({name: list(column)})
+            column_features = _infer_features_from_batch({name: list(column[:config.DEFAULT_MAX_BATCH_SIZE])})
-            column_features = _infer_features_from_batch({name: list(column)})
+            column_features = _infer_features_from_batch({name: list(column[:config.DEFAULT_MAX_BATCH_SIZE])})
+            new_features = Features({**self._info.features, **column_features})
+        return self.map(partial(add_column_fn, name=name, column=column), with_indices=True, features=new_features)
 
     def rename_column(self, original_column_name: str, new_column_name: str) -> "IterableDataset":
         """