Can this work on quantized models too?

Hi,

AMD user here, 7900XT 20GB vram. Just too little for most text-to-image models, unfortunately.
But running a quantized version (fp8 for example, like [this](https://huggingface.co/Clybius/FLUX.1-Krea-dev-scaled-fp8)) already works well but it's so slow.

Can `cache-dit` work on that too? And if so, how?