update cuda op to support fp16/bf16 absmax

jiqing-feng · jiqing-feng · commit 69b2146f39e1 · 2025-06-09T09:51:38.000Z
Signed-off-by: jiqing-feng &lt;jiqing.feng@intel.com&gt;
diff --git a/bitsandbytes/backends/cuda/ops.py b/bitsandbytes/backends/cuda/ops.py
@@ -237,7 +237,7 @@ def _(A: torch.Tensor, code: torch.Tensor, blocksize: int) -> tuple[torch.Tensor
         else:
             raise ValueError(f"Blockwise quantization only supports 16/32-bit floats, but got {A.dtype}")
 
-    return out, absmax
+    return out, absmax.to(A.dtype)
 
 
 @register_kernel("bitsandbytes::dequantize_blockwise", "cuda")
@@ -332,7 +332,7 @@ def _(
             else:
                 lib.cquantize_blockwise_fp32_nf4(*args)
 
-    return out, absmax
+    return out, absmax.to(A.dtype)
 
 
 @register_kernel("bitsandbytes::dequantize_4bit", "cuda")