cuda dtype transfer

yujiaoliang · yujiaoliang · commit 1f1e9a91b96e · 2025-06-28T19:40:21.000+08:00
diff --git a/excuter/op-mem-cuda/src/deepx/dtype_cuda.hpp b/excuter/op-mem-cuda/src/deepx/dtype_cuda.hpp
@@ -3,6 +3,8 @@
 
 #include <cuda_fp16.h>
 #include <cuda_bf16.h>
+#include <cuda_fp8.h>
+#include <cuda_fp4.h>
 
 #include "deepx/dtype.hpp"
 
@@ -34,6 +36,27 @@ namespace deepx
         else
             return Precision::Any;
     }   
+
+
+    template <>
+    struct to_tensor_type<PrecisionWrapper<Precision::BFloat16>> {
+        using type = nv_bfloat16;
+    };
+
+    template <>
+    struct to_tensor_type<PrecisionWrapper<Precision::Float16>> {
+        using type = half;
+    };
+
+    template <>
+    struct to_tensor_type<PrecisionWrapper<Precision::Float8E5M2>> {
+        using type =  __nv_fp8_e5m2;
+    };
+
+    template <>
+    struct to_tensor_type<PrecisionWrapper<Precision::Float8e4m3>> {
+        using type = __nv_fp8_e4m3;
+    }
 }
 
 #endif // DEEPX_DTYPE_CUDA_HPP