NVIDIA · holgerroth · Jan 27, 2025 · Jan 27, 2025
diff --git a/nvflare/app_opt/pt/decomposers.py b/nvflare/app_opt/pt/decomposers.py
@@ -22,18 +22,63 @@
 from nvflare.fuel.utils.fobs.datum import DatumManager
 
 
+class SerializationModule(torch.nn.Module):
+    def __init__(self, tensor):
+        super().__init__()
+        self.register_buffer("saved_tensor", tensor)
+
+
 class TensorDecomposer(fobs.Decomposer):
     def supported_type(self):
         return torch.Tensor
 
     def decompose(self, target: torch.Tensor, manager: DatumManager = None) -> Any:
+        if target.dtype == torch.bfloat16:
+            return self._jit_serialize(target)
+        else:
+            return self._numpy_serialize(target)
+
+    def recompose(self, data: Any, manager: DatumManager = None) -> torch.Tensor:
+        if isinstance(data, dict):
+            if data["dtype"] == "torch.bfloat16":
+                return self._jit_deserialize(data)
+            else:
+                buf = data["buffer"]
+        else:
+            buf = data
+
+        return self._numpy_deserialize(buf)
+
+    @staticmethod
+    def _numpy_serialize(tensor: torch.Tensor) -> dict:
         stream = BytesIO()
-        # torch.save uses Pickle so converting Tensor to ndarray first
-        array = target.detach().cpu().numpy()
+        # supported ScalarType, use numpy to avoid Pickle
+        array = tensor.detach().cpu().numpy()
         np.save(stream, array, allow_pickle=False)
-        return stream.getvalue()
+        return {
+            "buffer": stream.getvalue(),
+            "dtype": str(tensor.dtype),
+        }
 
-    def recompose(self, data: Any, manager: DatumManager = None) -> torch.Tensor:
+    @staticmethod
+    def _numpy_deserialize(data: Any) -> torch.Tensor:
         stream = BytesIO(data)
         array = np.load(stream, allow_pickle=False)
         return torch.from_numpy(array)
+
+    @staticmethod
+    def _jit_serialize(tensor: torch.Tensor) -> dict:
+        stream = BytesIO()
+        # unsupported ScalarType by numpy, use torch.jit to avoid Pickle
+        module = SerializationModule(tensor)
+        torch.jit.save(torch.jit.script(module), stream)
+        return {
+            "buffer": stream.getvalue(),
+            "dtype": str(tensor.dtype),
+        }
+
+    @staticmethod
+    def _jit_deserialize(data: Any) -> torch.Tensor:
+        stream = BytesIO(data["buffer"])
+        loaded_module = torch.jit.load(stream)
+        return loaded_module.saved_tensor