Add User Friendly Quantize Type #93

ecyht2 · 2025-07-17T14:15:11Z

This PR aims to close #78. Maybe new quantization types can be supported as well, do let me know which ones I should add.

examples/quantize/quantize.cpp

danielzgtg · 2025-07-22T03:20:56Z

Functionality LGTM. UX see above.

The output is a valid gguf for all 4 types. md5sum matches mmwillet2@huggingface for most files. The differences with Dia DAC_F16 and of Kokoro voices being fewer predate this PR.

Updated testing script

#!/bin/bash
set -e

# If necessary:
# sudo mount -o remount,size=5G "$XDG_RUNTIME_DIR"
# ln -s ~/CLionProjects/llama.cpp/gguf-py/venv gguf_py_venv
[ $# -eq 1 ] || { echo 'Usage: ./quantize_test.sh /path/to/bin/quantize'; exit 1; }
quantize="$1"
[ -x "$quantize" ] || { echo 'Bad binary or path'; exit 1; }

if [ -d gguf_py_venv ]; then
  . gguf_py_venv/bin/activate
  dumper=gguf-dump
fi

declare -a extra_args
function q {
  model_dir="$(dirname "$model")"
  log="$(
    set -x
    "$quantize" -mp "$model" -qt "$1" -qp "$XDG_RUNTIME_DIR"/test.gguf "${extra_args[@]}" 2>&1
  )" || echo -n "$log"
  md5sum "$XDG_RUNTIME_DIR"/test.gguf
  [ -n "$dumper" ] && "$dumper" "$XDG_RUNTIME_DIR"/test.gguf > "$XDG_RUNTIME_DIR"/test.gguf.2.txt 2>/dev/null
  unlink "$XDG_RUNTIME_DIR"/test.gguf
  md5sum "$model_dir"/"$2"
  if [ -n "$dumper" ]; then
    "$dumper" "$model_dir"/"$2" > "$XDG_RUNTIME_DIR"/test.gguf.1.txt 2>/dev/null
    diff -U3 "$XDG_RUNTIME_DIR"/test.gguf.{1,2}.txt || :
    rm "$XDG_RUNTIME_DIR"/test.gguf.{1,2}.txt
  fi
}

model=Dia_GGUF/Dia.gguf
extra_args=(-nt 3)
q FP16 Dia_F16.gguf
q Q4_0 Dia_Q4.gguf
q Q5_0 Dia_Q5.gguf
q Q8_0 Dia_Q8.gguf
extra_args=(-nt 3 -df)
q FP16 Dia_F16_DAC_F16.gguf
q Q4_0 Dia_Q4_DAC_F16.gguf
q Q5_0 Dia_Q5_DAC_F16.gguf
q Q8_0 Dia_Q8_DAC_F16.gguf

model=Kokoro_GGUF/Kokoro_espeak.gguf
extra_args=(-nt 3 -nqf)
q FP16 Kokoro_espeak_F16.gguf
q Q4_0 Kokoro_espeak_Q4.gguf
q Q5_0 Kokoro_espeak_Q5.gguf
q Q8_0 Kokoro_espeak_Q8.gguf
model=Kokoro_GGUF/Kokoro_no_espeak.gguf
q FP16 Kokoro_no_espeak_F16.gguf
q Q4_0 Kokoro_no_espeak_Q4.gguf
q Q5_0 Kokoro_no_espeak_Q5.gguf
q Q8_0 Kokoro_no_espeak_Q8.gguf

model=parler-tts-mini-v1-GGUF/parler-tts-mini-v1-fp32.gguf
extra_args=(-nt 3)
q FP16 parler-tts-mini-v1-fp16.gguf
q Q4_0 parler-tts-mini-v1-Q4_0.gguf
q Q5_0 parler-tts-mini-v1-Q5_0.gguf
q Q8_0 parler-tts-mini-v1-Q8_0.gguf

Testing results

$ ./quantize_test.sh /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize |& tee log.txt
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp Dia_GGUF/Dia.gguf -qt FP16 -qp /run/user/1000/test.gguf -nt 3
74e13c012791657ddd0e8aa586f81e1e  /run/user/1000/test.gguf
74e13c012791657ddd0e8aa586f81e1e  Dia_GGUF/Dia_F16.gguf
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp Dia_GGUF/Dia.gguf -qt Q4_0 -qp /run/user/1000/test.gguf -nt 3
35b2f923aadbd1aa8cdf61a13ea22edc  /run/user/1000/test.gguf
35b2f923aadbd1aa8cdf61a13ea22edc  Dia_GGUF/Dia_Q4.gguf
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp Dia_GGUF/Dia.gguf -qt Q5_0 -qp /run/user/1000/test.gguf -nt 3
11b65bd733e25e01cb8ce47782384023  /run/user/1000/test.gguf
11b65bd733e25e01cb8ce47782384023  Dia_GGUF/Dia_Q5.gguf
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp Dia_GGUF/Dia.gguf -qt Q8_0 -qp /run/user/1000/test.gguf -nt 3
77a283139d5bedba9d00ceed2b674d98  /run/user/1000/test.gguf
77a283139d5bedba9d00ceed2b674d98  Dia_GGUF/Dia_Q8.gguf
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp Dia_GGUF/Dia.gguf -qt FP16 -qp /run/user/1000/test.gguf -nt 3 -df
6d790c2aec68a8773ae973ab6344a424  /run/user/1000/test.gguf
5a6638ff3d6c43e56b2e235c3d974c7e  Dia_GGUF/Dia_F16_DAC_F16.gguf
--- /run/user/1000/test.gguf.1.txt	2025-07-21 23:12:20.621432955 -0400
+++ /run/user/1000/test.gguf.2.txt	2025-07-21 23:12:16.381426037 -0400
@@ -419,119 +419,119 @@
     379:    4194304 |  1024,  4096,     1,     1 | F16     | dia.encoder.layers.11.up
     380:    4194304 |  4096,  1024,     1,     1 | F16     | dia.encoder.layers.11.wo
     381:       1024 |  1024,     1,     1,     1 | F32     | dia.encoder.norm
-    382:       1536 |  1536,     1,     1,     1 | F32     | audio_encoder.initial.bias
+    382:       1536 |  1536,     1,     1,     1 | F16     | audio_encoder.initial.bias
     383:   11010048 |     7,  1024,  1536,     1 | F16     | audio_encoder.initial.weight
     384:       1536 |     1,  1536,     1,     1 | F32     | audio_encoder.decoder_block.1.final.alpha
-    385:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.final.bias
+    385:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.final.bias
     386:   18874368 |    16,   768,  1536,     1 | F16     | audio_encoder.decoder_block.1.final.weight
     387:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.0.res.initial.alpha
-    388:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.0.res.initial.bias
+    388:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.0.res.initial.bias
     389:    4128768 |     7,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.0.res.initial.weight
     390:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.0.res.final.alpha
-    391:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.0.res.final.bias
+    391:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.0.res.final.bias
     392:     589824 |     1,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.0.res.final.weight
     393:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.1.res.initial.alpha
-    394:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.1.res.initial.bias
+    394:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.1.res.initial.bias
     395:    4128768 |     7,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.1.res.initial.weight
     396:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.1.res.final.alpha
-    397:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.1.res.final.bias
+    397:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.1.res.final.bias
     398:     589824 |     1,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.1.res.final.weight
     399:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.2.res.initial.alpha
-    400:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.2.res.initial.bias
+    400:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.2.res.initial.bias
     401:    4128768 |     7,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.2.res.initial.weight
     402:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.2.res.final.alpha
-    403:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.2.res.final.bias
+    403:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.2.res.final.bias
     404:     589824 |     1,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.2.res.final.weight
     405:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.2.final.alpha
-    406:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.final.bias
+    406:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.final.bias
     407:    4718592 |    16,   384,   768,     1 | F16     | audio_encoder.decoder_block.2.final.weight
     408:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.0.res.initial.alpha
-    409:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.0.res.initial.bias
+    409:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.0.res.initial.bias
     410:    1032192 |     7,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.0.res.initial.weight
     411:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.0.res.final.alpha
-    412:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.0.res.final.bias
+    412:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.0.res.final.bias
     413:     147456 |     1,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.0.res.final.weight
     414:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.1.res.initial.alpha
-    415:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.1.res.initial.bias
+    415:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.1.res.initial.bias
     416:    1032192 |     7,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.1.res.initial.weight
     417:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.1.res.final.alpha
-    418:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.1.res.final.bias
+    418:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.1.res.final.bias
     419:     147456 |     1,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.1.res.final.weight
     420:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.2.res.initial.alpha
-    421:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.2.res.initial.bias
+    421:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.2.res.initial.bias
     422:    1032192 |     7,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.2.res.initial.weight
     423:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.2.res.final.alpha
-    424:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.2.res.final.bias
+    424:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.2.res.final.bias
     425:     147456 |     1,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.2.res.final.weight
     426:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.3.final.alpha
-    427:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.final.bias
+    427:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.final.bias
     428:     589824 |     8,   192,   384,     1 | F16     | audio_encoder.decoder_block.3.final.weight
     429:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.0.res.initial.alpha
-    430:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.0.res.initial.bias
+    430:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.0.res.initial.bias
     431:     258048 |     7,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.0.res.initial.weight
     432:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.0.res.final.alpha
-    433:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.0.res.final.bias
+    433:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.0.res.final.bias
     434:      36864 |     1,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.0.res.final.weight
     435:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.1.res.initial.alpha
-    436:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.1.res.initial.bias
+    436:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.1.res.initial.bias
     437:     258048 |     7,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.1.res.initial.weight
     438:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.1.res.final.alpha
-    439:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.1.res.final.bias
+    439:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.1.res.final.bias
     440:      36864 |     1,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.1.res.final.weight
     441:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.2.res.initial.alpha
-    442:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.2.res.initial.bias
+    442:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.2.res.initial.bias
     443:     258048 |     7,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.2.res.initial.weight
     444:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.2.res.final.alpha
-    445:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.2.res.final.bias
+    445:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.2.res.final.bias
     446:      36864 |     1,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.2.res.final.weight
     447:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.4.final.alpha
-    448:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.final.bias
+    448:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.final.bias
     449:      73728 |     4,    96,   192,     1 | F16     | audio_encoder.decoder_block.4.final.weight
     450:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.0.res.initial.alpha
-    451:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.0.res.initial.bias
+    451:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.0.res.initial.bias
     452:      64512 |     7,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.0.res.initial.weight
     453:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.0.res.final.alpha
-    454:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.0.res.final.bias
+    454:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.0.res.final.bias
     455:       9216 |     1,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.0.res.final.weight
     456:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.1.res.initial.alpha
-    457:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.1.res.initial.bias
+    457:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.1.res.initial.bias
     458:      64512 |     7,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.1.res.initial.weight
     459:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.1.res.final.alpha
-    460:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.1.res.final.bias
+    460:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.1.res.final.bias
     461:       9216 |     1,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.1.res.final.weight
     462:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.2.res.initial.alpha
-    463:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.2.res.initial.bias
+    463:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.2.res.initial.bias
     464:      64512 |     7,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.2.res.initial.weight
     465:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.2.res.final.alpha
-    466:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.2.res.final.bias
+    466:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.2.res.final.bias
     467:       9216 |     1,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.2.res.final.weight
     468:         96 |     1,    96,     1,     1 | F32     | audio_encoder.final.alpha
-    469:          1 |     1,     1,     1,     1 | F32     | audio_encoder.final.bias
+    469:          1 |     1,     1,     1,     1 | F16     | audio_encoder.final.bias
     470:        672 |     7,    96,     1,     1 | F16     | audio_encoder.final.weight
-    471:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.0.out_proj.bias
+    471:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.0.out_proj.bias
     472:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.0.out_proj.weight
     473:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.0.codebook.weight
-    474:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.1.out_proj.bias
+    474:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.1.out_proj.bias
     475:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.1.out_proj.weight
     476:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.1.codebook.weight
-    477:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.2.out_proj.bias
+    477:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.2.out_proj.bias
     478:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.2.out_proj.weight
     479:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.2.codebook.weight
-    480:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.3.out_proj.bias
+    480:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.3.out_proj.bias
     481:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.3.out_proj.weight
     482:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.3.codebook.weight
-    483:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.4.out_proj.bias
+    483:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.4.out_proj.bias
     484:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.4.out_proj.weight
     485:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.4.codebook.weight
-    486:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.5.out_proj.bias
+    486:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.5.out_proj.bias
     487:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.5.out_proj.weight
     488:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.5.codebook.weight
-    489:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.6.out_proj.bias
+    489:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.6.out_proj.bias
     490:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.6.out_proj.weight
     491:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.6.codebook.weight
-    492:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.7.out_proj.bias
+    492:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.7.out_proj.bias
     493:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.7.out_proj.weight
     494:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.7.codebook.weight
-    495:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.8.out_proj.bias
+    495:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.8.out_proj.bias
     496:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.8.out_proj.weight
     497:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.8.codebook.weight
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp Dia_GGUF/Dia.gguf -qt Q4_0 -qp /run/user/1000/test.gguf -nt 3 -df
be7d23385c3a6feaae9ee21023d12971  /run/user/1000/test.gguf
80a3aefbe871e5a783af94a7c51c7241  Dia_GGUF/Dia_Q4_DAC_F16.gguf
--- /run/user/1000/test.gguf.1.txt	2025-07-21 23:12:27.017443455 -0400
+++ /run/user/1000/test.gguf.2.txt	2025-07-21 23:12:25.577441084 -0400
@@ -419,119 +419,119 @@
     379:    4194304 |  1024,  4096,     1,     1 | Q4_0    | dia.encoder.layers.11.up
     380:    4194304 |  4096,  1024,     1,     1 | Q4_0    | dia.encoder.layers.11.wo
     381:       1024 |  1024,     1,     1,     1 | F32     | dia.encoder.norm
-    382:       1536 |  1536,     1,     1,     1 | F32     | audio_encoder.initial.bias
+    382:       1536 |  1536,     1,     1,     1 | F16     | audio_encoder.initial.bias
     383:   11010048 |     7,  1024,  1536,     1 | F16     | audio_encoder.initial.weight
     384:       1536 |     1,  1536,     1,     1 | F32     | audio_encoder.decoder_block.1.final.alpha
-    385:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.final.bias
+    385:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.final.bias
     386:   18874368 |    16,   768,  1536,     1 | F16     | audio_encoder.decoder_block.1.final.weight
     387:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.0.res.initial.alpha
-    388:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.0.res.initial.bias
+    388:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.0.res.initial.bias
     389:    4128768 |     7,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.0.res.initial.weight
     390:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.0.res.final.alpha
-    391:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.0.res.final.bias
+    391:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.0.res.final.bias
     392:     589824 |     1,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.0.res.final.weight
     393:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.1.res.initial.alpha
-    394:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.1.res.initial.bias
+    394:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.1.res.initial.bias
     395:    4128768 |     7,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.1.res.initial.weight
     396:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.1.res.final.alpha
-    397:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.1.res.final.bias
+    397:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.1.res.final.bias
     398:     589824 |     1,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.1.res.final.weight
     399:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.2.res.initial.alpha
-    400:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.2.res.initial.bias
+    400:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.2.res.initial.bias
     401:    4128768 |     7,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.2.res.initial.weight
     402:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.2.res.final.alpha
-    403:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.2.res.final.bias
+    403:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.2.res.final.bias
     404:     589824 |     1,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.2.res.final.weight
     405:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.2.final.alpha
-    406:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.final.bias
+    406:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.final.bias
     407:    4718592 |    16,   384,   768,     1 | F16     | audio_encoder.decoder_block.2.final.weight
     408:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.0.res.initial.alpha
-    409:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.0.res.initial.bias
+    409:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.0.res.initial.bias
     410:    1032192 |     7,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.0.res.initial.weight
     411:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.0.res.final.alpha
-    412:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.0.res.final.bias
+    412:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.0.res.final.bias
     413:     147456 |     1,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.0.res.final.weight
     414:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.1.res.initial.alpha
-    415:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.1.res.initial.bias
+    415:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.1.res.initial.bias
     416:    1032192 |     7,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.1.res.initial.weight
     417:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.1.res.final.alpha
-    418:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.1.res.final.bias
+    418:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.1.res.final.bias
     419:     147456 |     1,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.1.res.final.weight
     420:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.2.res.initial.alpha
-    421:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.2.res.initial.bias
+    421:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.2.res.initial.bias
     422:    1032192 |     7,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.2.res.initial.weight
     423:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.2.res.final.alpha
-    424:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.2.res.final.bias
+    424:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.2.res.final.bias
     425:     147456 |     1,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.2.res.final.weight
     426:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.3.final.alpha
-    427:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.final.bias
+    427:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.final.bias
     428:     589824 |     8,   192,   384,     1 | F16     | audio_encoder.decoder_block.3.final.weight
     429:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.0.res.initial.alpha
-    430:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.0.res.initial.bias
+    430:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.0.res.initial.bias
     431:     258048 |     7,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.0.res.initial.weight
     432:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.0.res.final.alpha
-    433:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.0.res.final.bias
+    433:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.0.res.final.bias
     434:      36864 |     1,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.0.res.final.weight
     435:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.1.res.initial.alpha
-    436:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.1.res.initial.bias
+    436:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.1.res.initial.bias
     437:     258048 |     7,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.1.res.initial.weight
     438:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.1.res.final.alpha
-    439:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.1.res.final.bias
+    439:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.1.res.final.bias
     440:      36864 |     1,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.1.res.final.weight
     441:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.2.res.initial.alpha
-    442:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.2.res.initial.bias
+    442:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.2.res.initial.bias
     443:     258048 |     7,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.2.res.initial.weight
     444:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.2.res.final.alpha
-    445:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.2.res.final.bias
+    445:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.2.res.final.bias
     446:      36864 |     1,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.2.res.final.weight
     447:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.4.final.alpha
-    448:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.final.bias
+    448:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.final.bias
     449:      73728 |     4,    96,   192,     1 | F16     | audio_encoder.decoder_block.4.final.weight
     450:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.0.res.initial.alpha
-    451:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.0.res.initial.bias
+    451:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.0.res.initial.bias
     452:      64512 |     7,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.0.res.initial.weight
     453:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.0.res.final.alpha
-    454:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.0.res.final.bias
+    454:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.0.res.final.bias
     455:       9216 |     1,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.0.res.final.weight
     456:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.1.res.initial.alpha
-    457:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.1.res.initial.bias
+    457:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.1.res.initial.bias
     458:      64512 |     7,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.1.res.initial.weight
     459:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.1.res.final.alpha
-    460:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.1.res.final.bias
+    460:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.1.res.final.bias
     461:       9216 |     1,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.1.res.final.weight
     462:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.2.res.initial.alpha
-    463:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.2.res.initial.bias
+    463:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.2.res.initial.bias
     464:      64512 |     7,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.2.res.initial.weight
     465:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.2.res.final.alpha
-    466:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.2.res.final.bias
+    466:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.2.res.final.bias
     467:       9216 |     1,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.2.res.final.weight
     468:         96 |     1,    96,     1,     1 | F32     | audio_encoder.final.alpha
-    469:          1 |     1,     1,     1,     1 | F32     | audio_encoder.final.bias
+    469:          1 |     1,     1,     1,     1 | F16     | audio_encoder.final.bias
     470:        672 |     7,    96,     1,     1 | F16     | audio_encoder.final.weight
-    471:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.0.out_proj.bias
+    471:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.0.out_proj.bias
     472:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.0.out_proj.weight
     473:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.0.codebook.weight
-    474:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.1.out_proj.bias
+    474:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.1.out_proj.bias
     475:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.1.out_proj.weight
     476:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.1.codebook.weight
-    477:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.2.out_proj.bias
+    477:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.2.out_proj.bias
     478:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.2.out_proj.weight
     479:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.2.codebook.weight
-    480:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.3.out_proj.bias
+    480:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.3.out_proj.bias
     481:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.3.out_proj.weight
     482:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.3.codebook.weight
-    483:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.4.out_proj.bias
+    483:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.4.out_proj.bias
     484:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.4.out_proj.weight
     485:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.4.codebook.weight
-    486:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.5.out_proj.bias
+    486:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.5.out_proj.bias
     487:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.5.out_proj.weight
     488:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.5.codebook.weight
-    489:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.6.out_proj.bias
+    489:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.6.out_proj.bias
     490:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.6.out_proj.weight
     491:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.6.codebook.weight
-    492:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.7.out_proj.bias
+    492:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.7.out_proj.bias
     493:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.7.out_proj.weight
     494:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.7.codebook.weight
-    495:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.8.out_proj.bias
+    495:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.8.out_proj.bias
     496:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.8.out_proj.weight
     497:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.8.codebook.weight
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp Dia_GGUF/Dia.gguf -qt Q5_0 -qp /run/user/1000/test.gguf -nt 3 -df
2257fc2c956313d23ad03f62d6f1ad21  /run/user/1000/test.gguf
d4142f920c6a4938410d9fdea5e64ae8  Dia_GGUF/Dia_Q5_DAC_F16.gguf
--- /run/user/1000/test.gguf.1.txt	2025-07-21 23:12:34.197455336 -0400
+++ /run/user/1000/test.gguf.2.txt	2025-07-21 23:12:32.517452546 -0400
@@ -419,119 +419,119 @@
     379:    4194304 |  1024,  4096,     1,     1 | Q5_0    | dia.encoder.layers.11.up
     380:    4194304 |  4096,  1024,     1,     1 | Q5_0    | dia.encoder.layers.11.wo
     381:       1024 |  1024,     1,     1,     1 | F32     | dia.encoder.norm
-    382:       1536 |  1536,     1,     1,     1 | F32     | audio_encoder.initial.bias
+    382:       1536 |  1536,     1,     1,     1 | F16     | audio_encoder.initial.bias
     383:   11010048 |     7,  1024,  1536,     1 | F16     | audio_encoder.initial.weight
     384:       1536 |     1,  1536,     1,     1 | F32     | audio_encoder.decoder_block.1.final.alpha
-    385:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.final.bias
+    385:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.final.bias
     386:   18874368 |    16,   768,  1536,     1 | F16     | audio_encoder.decoder_block.1.final.weight
     387:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.0.res.initial.alpha
-    388:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.0.res.initial.bias
+    388:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.0.res.initial.bias
     389:    4128768 |     7,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.0.res.initial.weight
     390:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.0.res.final.alpha
-    391:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.0.res.final.bias
+    391:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.0.res.final.bias
     392:     589824 |     1,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.0.res.final.weight
     393:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.1.res.initial.alpha
-    394:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.1.res.initial.bias
+    394:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.1.res.initial.bias
     395:    4128768 |     7,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.1.res.initial.weight
     396:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.1.res.final.alpha
-    397:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.1.res.final.bias
+    397:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.1.res.final.bias
     398:     589824 |     1,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.1.res.final.weight
     399:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.2.res.initial.alpha
-    400:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.2.res.initial.bias
+    400:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.2.res.initial.bias
     401:    4128768 |     7,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.2.res.initial.weight
     402:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.2.res.final.alpha
-    403:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.2.res.final.bias
+    403:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.2.res.final.bias
     404:     589824 |     1,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.2.res.final.weight
     405:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.2.final.alpha
-    406:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.final.bias
+    406:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.final.bias
     407:    4718592 |    16,   384,   768,     1 | F16     | audio_encoder.decoder_block.2.final.weight
     408:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.0.res.initial.alpha
-    409:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.0.res.initial.bias
+    409:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.0.res.initial.bias
     410:    1032192 |     7,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.0.res.initial.weight
     411:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.0.res.final.alpha
-    412:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.0.res.final.bias
+    412:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.0.res.final.bias
     413:     147456 |     1,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.0.res.final.weight
     414:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.1.res.initial.alpha
-    415:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.1.res.initial.bias
+    415:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.1.res.initial.bias
     416:    1032192 |     7,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.1.res.initial.weight
     417:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.1.res.final.alpha
-    418:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.1.res.final.bias
+    418:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.1.res.final.bias
     419:     147456 |     1,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.1.res.final.weight
     420:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.2.res.initial.alpha
-    421:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.2.res.initial.bias
+    421:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.2.res.initial.bias
     422:    1032192 |     7,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.2.res.initial.weight
     423:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.2.res.final.alpha
-    424:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.2.res.final.bias
+    424:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.2.res.final.bias
     425:     147456 |     1,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.2.res.final.weight
     426:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.3.final.alpha
-    427:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.final.bias
+    427:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.final.bias
     428:     589824 |     8,   192,   384,     1 | F16     | audio_encoder.decoder_block.3.final.weight
     429:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.0.res.initial.alpha
-    430:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.0.res.initial.bias
+    430:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.0.res.initial.bias
     431:     258048 |     7,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.0.res.initial.weight
     432:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.0.res.final.alpha
-    433:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.0.res.final.bias
+    433:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.0.res.final.bias
     434:      36864 |     1,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.0.res.final.weight
     435:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.1.res.initial.alpha
-    436:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.1.res.initial.bias
+    436:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.1.res.initial.bias
     437:     258048 |     7,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.1.res.initial.weight
     438:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.1.res.final.alpha
-    439:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.1.res.final.bias
+    439:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.1.res.final.bias
     440:      36864 |     1,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.1.res.final.weight
     441:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.2.res.initial.alpha
-    442:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.2.res.initial.bias
+    442:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.2.res.initial.bias
     443:     258048 |     7,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.2.res.initial.weight
     444:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.2.res.final.alpha
-    445:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.2.res.final.bias
+    445:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.2.res.final.bias
     446:      36864 |     1,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.2.res.final.weight
     447:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.4.final.alpha
-    448:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.final.bias
+    448:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.final.bias
     449:      73728 |     4,    96,   192,     1 | F16     | audio_encoder.decoder_block.4.final.weight
     450:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.0.res.initial.alpha
-    451:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.0.res.initial.bias
+    451:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.0.res.initial.bias
     452:      64512 |     7,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.0.res.initial.weight
     453:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.0.res.final.alpha
-    454:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.0.res.final.bias
+    454:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.0.res.final.bias
     455:       9216 |     1,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.0.res.final.weight
     456:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.1.res.initial.alpha
-    457:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.1.res.initial.bias
+    457:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.1.res.initial.bias
     458:      64512 |     7,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.1.res.initial.weight
     459:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.1.res.final.alpha
-    460:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.1.res.final.bias
+    460:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.1.res.final.bias
     461:       9216 |     1,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.1.res.final.weight
     462:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.2.res.initial.alpha
-    463:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.2.res.initial.bias
+    463:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.2.res.initial.bias
     464:      64512 |     7,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.2.res.initial.weight
     465:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.2.res.final.alpha
-    466:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.2.res.final.bias
+    466:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.2.res.final.bias
     467:       9216 |     1,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.2.res.final.weight
     468:         96 |     1,    96,     1,     1 | F32     | audio_encoder.final.alpha
-    469:          1 |     1,     1,     1,     1 | F32     | audio_encoder.final.bias
+    469:          1 |     1,     1,     1,     1 | F16     | audio_encoder.final.bias
     470:        672 |     7,    96,     1,     1 | F16     | audio_encoder.final.weight
-    471:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.0.out_proj.bias
+    471:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.0.out_proj.bias
     472:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.0.out_proj.weight
     473:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.0.codebook.weight
-    474:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.1.out_proj.bias
+    474:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.1.out_proj.bias
     475:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.1.out_proj.weight
     476:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.1.codebook.weight
-    477:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.2.out_proj.bias
+    477:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.2.out_proj.bias
     478:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.2.out_proj.weight
     479:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.2.codebook.weight
-    480:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.3.out_proj.bias
+    480:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.3.out_proj.bias
     481:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.3.out_proj.weight
     482:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.3.codebook.weight
-    483:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.4.out_proj.bias
+    483:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.4.out_proj.bias
     484:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.4.out_proj.weight
     485:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.4.codebook.weight
-    486:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.5.out_proj.bias
+    486:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.5.out_proj.bias
     487:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.5.out_proj.weight
     488:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.5.codebook.weight
-    489:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.6.out_proj.bias
+    489:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.6.out_proj.bias
     490:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.6.out_proj.weight
     491:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.6.codebook.weight
-    492:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.7.out_proj.bias
+    492:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.7.out_proj.bias
     493:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.7.out_proj.weight
     494:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.7.codebook.weight
-    495:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.8.out_proj.bias
+    495:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.8.out_proj.bias
     496:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.8.out_proj.weight
     497:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.8.codebook.weight
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp Dia_GGUF/Dia.gguf -qt Q8_0 -qp /run/user/1000/test.gguf -nt 3 -df
82424df1dc8151864d3817705642baf6  /run/user/1000/test.gguf
e94a5251e28fc072998d1f8c723cef18  Dia_GGUF/Dia_Q8_DAC_F16.gguf
--- /run/user/1000/test.gguf.1.txt	2025-07-21 23:12:44.009471728 -0400
+++ /run/user/1000/test.gguf.2.txt	2025-07-21 23:12:41.617467714 -0400
@@ -419,119 +419,119 @@
     379:    4194304 |  1024,  4096,     1,     1 | Q8_0    | dia.encoder.layers.11.up
     380:    4194304 |  4096,  1024,     1,     1 | Q8_0    | dia.encoder.layers.11.wo
     381:       1024 |  1024,     1,     1,     1 | F32     | dia.encoder.norm
-    382:       1536 |  1536,     1,     1,     1 | F32     | audio_encoder.initial.bias
+    382:       1536 |  1536,     1,     1,     1 | F16     | audio_encoder.initial.bias
     383:   11010048 |     7,  1024,  1536,     1 | F16     | audio_encoder.initial.weight
     384:       1536 |     1,  1536,     1,     1 | F32     | audio_encoder.decoder_block.1.final.alpha
-    385:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.final.bias
+    385:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.final.bias
     386:   18874368 |    16,   768,  1536,     1 | F16     | audio_encoder.decoder_block.1.final.weight
     387:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.0.res.initial.alpha
-    388:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.0.res.initial.bias
+    388:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.0.res.initial.bias
     389:    4128768 |     7,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.0.res.initial.weight
     390:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.0.res.final.alpha
-    391:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.0.res.final.bias
+    391:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.0.res.final.bias
     392:     589824 |     1,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.0.res.final.weight
     393:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.1.res.initial.alpha
-    394:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.1.res.initial.bias
+    394:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.1.res.initial.bias
     395:    4128768 |     7,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.1.res.initial.weight
     396:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.1.res.final.alpha
-    397:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.1.res.final.bias
+    397:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.1.res.final.bias
     398:     589824 |     1,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.1.res.final.weight
     399:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.2.res.initial.alpha
-    400:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.2.res.initial.bias
+    400:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.2.res.initial.bias
     401:    4128768 |     7,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.2.res.initial.weight
     402:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.2.res.final.alpha
-    403:        768 |   768,     1,     1,     1 | F32     | audio_encoder.decoder_block.1.residual_unit.2.res.final.bias
+    403:        768 |   768,     1,     1,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.2.res.final.bias
     404:     589824 |     1,   768,   768,     1 | F16     | audio_encoder.decoder_block.1.residual_unit.2.res.final.weight
     405:        768 |     1,   768,     1,     1 | F32     | audio_encoder.decoder_block.2.final.alpha
-    406:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.final.bias
+    406:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.final.bias
     407:    4718592 |    16,   384,   768,     1 | F16     | audio_encoder.decoder_block.2.final.weight
     408:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.0.res.initial.alpha
-    409:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.0.res.initial.bias
+    409:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.0.res.initial.bias
     410:    1032192 |     7,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.0.res.initial.weight
     411:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.0.res.final.alpha
-    412:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.0.res.final.bias
+    412:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.0.res.final.bias
     413:     147456 |     1,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.0.res.final.weight
     414:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.1.res.initial.alpha
-    415:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.1.res.initial.bias
+    415:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.1.res.initial.bias
     416:    1032192 |     7,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.1.res.initial.weight
     417:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.1.res.final.alpha
-    418:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.1.res.final.bias
+    418:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.1.res.final.bias
     419:     147456 |     1,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.1.res.final.weight
     420:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.2.res.initial.alpha
-    421:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.2.res.initial.bias
+    421:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.2.res.initial.bias
     422:    1032192 |     7,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.2.res.initial.weight
     423:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.2.res.final.alpha
-    424:        384 |   384,     1,     1,     1 | F32     | audio_encoder.decoder_block.2.residual_unit.2.res.final.bias
+    424:        384 |   384,     1,     1,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.2.res.final.bias
     425:     147456 |     1,   384,   384,     1 | F16     | audio_encoder.decoder_block.2.residual_unit.2.res.final.weight
     426:        384 |     1,   384,     1,     1 | F32     | audio_encoder.decoder_block.3.final.alpha
-    427:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.final.bias
+    427:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.final.bias
     428:     589824 |     8,   192,   384,     1 | F16     | audio_encoder.decoder_block.3.final.weight
     429:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.0.res.initial.alpha
-    430:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.0.res.initial.bias
+    430:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.0.res.initial.bias
     431:     258048 |     7,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.0.res.initial.weight
     432:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.0.res.final.alpha
-    433:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.0.res.final.bias
+    433:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.0.res.final.bias
     434:      36864 |     1,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.0.res.final.weight
     435:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.1.res.initial.alpha
-    436:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.1.res.initial.bias
+    436:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.1.res.initial.bias
     437:     258048 |     7,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.1.res.initial.weight
     438:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.1.res.final.alpha
-    439:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.1.res.final.bias
+    439:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.1.res.final.bias
     440:      36864 |     1,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.1.res.final.weight
     441:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.2.res.initial.alpha
-    442:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.2.res.initial.bias
+    442:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.2.res.initial.bias
     443:     258048 |     7,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.2.res.initial.weight
     444:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.2.res.final.alpha
-    445:        192 |   192,     1,     1,     1 | F32     | audio_encoder.decoder_block.3.residual_unit.2.res.final.bias
+    445:        192 |   192,     1,     1,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.2.res.final.bias
     446:      36864 |     1,   192,   192,     1 | F16     | audio_encoder.decoder_block.3.residual_unit.2.res.final.weight
     447:        192 |     1,   192,     1,     1 | F32     | audio_encoder.decoder_block.4.final.alpha
-    448:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.final.bias
+    448:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.final.bias
     449:      73728 |     4,    96,   192,     1 | F16     | audio_encoder.decoder_block.4.final.weight
     450:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.0.res.initial.alpha
-    451:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.0.res.initial.bias
+    451:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.0.res.initial.bias
     452:      64512 |     7,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.0.res.initial.weight
     453:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.0.res.final.alpha
-    454:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.0.res.final.bias
+    454:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.0.res.final.bias
     455:       9216 |     1,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.0.res.final.weight
     456:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.1.res.initial.alpha
-    457:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.1.res.initial.bias
+    457:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.1.res.initial.bias
     458:      64512 |     7,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.1.res.initial.weight
     459:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.1.res.final.alpha
-    460:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.1.res.final.bias
+    460:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.1.res.final.bias
     461:       9216 |     1,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.1.res.final.weight
     462:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.2.res.initial.alpha
-    463:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.2.res.initial.bias
+    463:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.2.res.initial.bias
     464:      64512 |     7,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.2.res.initial.weight
     465:         96 |     1,    96,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.2.res.final.alpha
-    466:         96 |    96,     1,     1,     1 | F32     | audio_encoder.decoder_block.4.residual_unit.2.res.final.bias
+    466:         96 |    96,     1,     1,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.2.res.final.bias
     467:       9216 |     1,    96,    96,     1 | F16     | audio_encoder.decoder_block.4.residual_unit.2.res.final.weight
     468:         96 |     1,    96,     1,     1 | F32     | audio_encoder.final.alpha
-    469:          1 |     1,     1,     1,     1 | F32     | audio_encoder.final.bias
+    469:          1 |     1,     1,     1,     1 | F16     | audio_encoder.final.bias
     470:        672 |     7,    96,     1,     1 | F16     | audio_encoder.final.weight
-    471:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.0.out_proj.bias
+    471:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.0.out_proj.bias
     472:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.0.out_proj.weight
     473:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.0.codebook.weight
-    474:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.1.out_proj.bias
+    474:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.1.out_proj.bias
     475:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.1.out_proj.weight
     476:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.1.codebook.weight
-    477:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.2.out_proj.bias
+    477:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.2.out_proj.bias
     478:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.2.out_proj.weight
     479:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.2.codebook.weight
-    480:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.3.out_proj.bias
+    480:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.3.out_proj.bias
     481:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.3.out_proj.weight
     482:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.3.codebook.weight
-    483:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.4.out_proj.bias
+    483:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.4.out_proj.bias
     484:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.4.out_proj.weight
     485:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.4.codebook.weight
-    486:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.5.out_proj.bias
+    486:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.5.out_proj.bias
     487:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.5.out_proj.weight
     488:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.5.codebook.weight
-    489:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.6.out_proj.bias
+    489:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.6.out_proj.bias
     490:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.6.out_proj.weight
     491:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.6.codebook.weight
-    492:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.7.out_proj.bias
+    492:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.7.out_proj.bias
     493:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.7.out_proj.weight
     494:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.7.codebook.weight
-    495:       1024 |  1024,     1,     1,     1 | F32     | audio_encoder.quantizers.8.out_proj.bias
+    495:       1024 |  1024,     1,     1,     1 | F16     | audio_encoder.quantizers.8.out_proj.bias
     496:       8192 |     1,     8,  1024,     1 | F16     | audio_encoder.quantizers.8.out_proj.weight
     497:       8192 |     8,  1024,     1,     1 | F16     | audio_encoder.quantizers.8.codebook.weight
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp Kokoro_GGUF/Kokoro_espeak.gguf -qt FP16 -qp /run/user/1000/test.gguf -nt 3 -nqf
ade92e4ecc814ada11e80fd3fb26a224  /run/user/1000/test.gguf
ade92e4ecc814ada11e80fd3fb26a224  Kokoro_GGUF/Kokoro_espeak_F16.gguf
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp Kokoro_GGUF/Kokoro_espeak.gguf -qt Q4_0 -qp /run/user/1000/test.gguf -nt 3 -nqf
03dda2b744b382e832b3a2540b44ce58  /run/user/1000/test.gguf
03dda2b744b382e832b3a2540b44ce58  Kokoro_GGUF/Kokoro_espeak_Q4.gguf
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp Kokoro_GGUF/Kokoro_espeak.gguf -qt Q5_0 -qp /run/user/1000/test.gguf -nt 3 -nqf
4aab4e1fbe5d455f9b94a0cbadd71482  /run/user/1000/test.gguf
4aab4e1fbe5d455f9b94a0cbadd71482  Kokoro_GGUF/Kokoro_espeak_Q5.gguf
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp Kokoro_GGUF/Kokoro_espeak.gguf -qt Q8_0 -qp /run/user/1000/test.gguf -nt 3 -nqf
5321d41971cd24df84f06becad41eb5d  /run/user/1000/test.gguf
5321d41971cd24df84f06becad41eb5d  Kokoro_GGUF/Kokoro_espeak_Q8.gguf
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp Kokoro_GGUF/Kokoro_no_espeak.gguf -qt FP16 -qp /run/user/1000/test.gguf -nt 3 -nqf
f3ad84f97e5823655899bf5c1e77e4bd  /run/user/1000/test.gguf
e50115e9bfdb20b824513dff8705b3c1  Kokoro_GGUF/Kokoro_no_espeak_F16.gguf
--- /run/user/1000/test.gguf.1.txt	2025-07-21 23:13:36.333562064 -0400
+++ /run/user/1000/test.gguf.2.txt	2025-07-21 23:13:12.641520565 -0400
@@ -1,13 +1,13 @@
 * File is LITTLE endian, script is running on a LITTLE endian host.
 * Dumping 94 key/value pair(s)
       1: UINT32     |        1 | GGUF.version = 3
-      2: UINT64     |        1 | GGUF.tensor_count = 797
+      2: UINT64     |        1 | GGUF.tensor_count = 775
       3: UINT64     |        1 | GGUF.kv_count = 91
       4: STRING     |        1 | general.architecture = 'kokoro'
-      5: [STRING]   |       50 | kokoro.voices = ['af_alloy', 'af_aoede', 'af_bella', 'af_heart', 'af_jessica', 'af_kore', ...]
+      5: [STRING]   |       28 | kokoro.voices = ['af_alloy', 'af_aoede', 'af_bella', 'af_heart', 'af_jessica', 'af_kore', ...]
       6: STRING     |        1 | general.type = 'model'
       7: STRING     |        1 | general.name = 'kokoro'
-      8: STRING     |        1 | general.size_label = '88M'
+      8: STRING     |        1 | general.size_label = '85M'
       9: UINT32     |        1 | tokenizer.ggml.padding_token_id = 0
      10: UINT32     |        1 | kokoro.decoder_start_token_id = 0
      11: UINT32     |        1 | kokoro.duration_predictor.albert.context_length = 512
@@ -83,7 +83,7 @@
      81: UINT32     |        1 | kokoro.decoder.generator.up_convs.1.padding = 3
      82: UINT32     |        1 | kokoro.decoder.generator.up_convs.1.stride = 6
      83: UINT32     |        1 | phonemizer.type = 0
-     84: UINT32     |        1 | phonemizer.phoneme_type = 1
+     84: UINT32     |        1 | phonemizer.phoneme_type = 0
      85: [STRING]   |     4422 | phonemizer.graphemes = ['oil', 'ise', 'val', 'dia', 'nii', 'miner', ...]
      86: [STRING]   |   995928 | phonemizer.rules.keys = ['a', 'a.^', 'a.^.$', 'a.^.aro', 'a.^.fa', 'a.^.fe', ...]
      87: [STRING]   |   995928 | phonemizer.rules.phonemes = ['ə', 'ɐ', 'ˈeɪ', 'ˈ', 'ɐ', 'ɐ', ...]
@@ -94,7 +94,7 @@
      92: UINT32     |        1 | tokenizer.ggml.eos_token_id = 0
      93: UINT32     |        1 | general.quantization_version = 2
      94: UINT32     |        1 | general.quantization_type = 1
-* Dumping 797 tensor(s)
+* Dumping 775 tensor(s)
       1:      22784 |   128,   178,     1,     1 | F32     | kokoro.albert.token_embd
       2:      65536 |   128,   512,     1,     1 | F32     | kokoro.albert.position_embd
       3:        128 |   128,     1,     1,     1 | F32     | kokoro.albert.token_type_embd
@@ -870,25 +870,3 @@
     773:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.bm_fable
     774:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.bm_george
     775:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.bm_lewis
-    776:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.ef_dora
-    777:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.em_alex
-    778:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.em_santa
-    779:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.ff_siwis
-    780:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.hf_alpha
-    781:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.hf_beta
-    782:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.hm_omega
-    783:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.hm_psi
-    784:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.if_sara
-    785:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.im_nicola
-    786:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jf_alpha
-    787:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jf_gongitsune
-    788:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jf_nezumi
-    789:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jf_tebukuro
-    790:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jm_kumo
-    791:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.pf_dora
-    792:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.pm_alex
-    793:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.pm_santa
-    794:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.zf_xiaobei
-    795:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.zf_xiaoni
-    796:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.zf_xiaoxiao
-    797:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.zf_xiaoyi
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp Kokoro_GGUF/Kokoro_no_espeak.gguf -qt Q4_0 -qp /run/user/1000/test.gguf -nt 3 -nqf
ce864e41853ec04d15ed68d744081357  /run/user/1000/test.gguf
883269572c6fc09380381d1640ce72b2  Kokoro_GGUF/Kokoro_no_espeak_Q4.gguf
--- /run/user/1000/test.gguf.1.txt	2025-07-21 23:14:24.805649815 -0400
+++ /run/user/1000/test.gguf.2.txt	2025-07-21 23:14:01.037606322 -0400
@@ -1,13 +1,13 @@
 * File is LITTLE endian, script is running on a LITTLE endian host.
 * Dumping 94 key/value pair(s)
       1: UINT32     |        1 | GGUF.version = 3
-      2: UINT64     |        1 | GGUF.tensor_count = 797
+      2: UINT64     |        1 | GGUF.tensor_count = 775
       3: UINT64     |        1 | GGUF.kv_count = 91
       4: STRING     |        1 | general.architecture = 'kokoro'
-      5: [STRING]   |       50 | kokoro.voices = ['af_alloy', 'af_aoede', 'af_bella', 'af_heart', 'af_jessica', 'af_kore', ...]
+      5: [STRING]   |       28 | kokoro.voices = ['af_alloy', 'af_aoede', 'af_bella', 'af_heart', 'af_jessica', 'af_kore', ...]
       6: STRING     |        1 | general.type = 'model'
       7: STRING     |        1 | general.name = 'kokoro'
-      8: STRING     |        1 | general.size_label = '88M'
+      8: STRING     |        1 | general.size_label = '85M'
       9: UINT32     |        1 | tokenizer.ggml.padding_token_id = 0
      10: UINT32     |        1 | kokoro.decoder_start_token_id = 0
      11: UINT32     |        1 | kokoro.duration_predictor.albert.context_length = 512
@@ -83,7 +83,7 @@
      81: UINT32     |        1 | kokoro.decoder.generator.up_convs.1.padding = 3
      82: UINT32     |        1 | kokoro.decoder.generator.up_convs.1.stride = 6
      83: UINT32     |        1 | phonemizer.type = 0
-     84: UINT32     |        1 | phonemizer.phoneme_type = 1
+     84: UINT32     |        1 | phonemizer.phoneme_type = 0
      85: [STRING]   |     4422 | phonemizer.graphemes = ['oil', 'ise', 'val', 'dia', 'nii', 'miner', ...]
      86: [STRING]   |   995928 | phonemizer.rules.keys = ['a', 'a.^', 'a.^.$', 'a.^.aro', 'a.^.fa', 'a.^.fe', ...]
      87: [STRING]   |   995928 | phonemizer.rules.phonemes = ['ə', 'ɐ', 'ˈeɪ', 'ˈ', 'ɐ', 'ɐ', ...]
@@ -94,7 +94,7 @@
      92: UINT32     |        1 | tokenizer.ggml.eos_token_id = 0
      93: UINT32     |        1 | general.quantization_version = 2
      94: UINT32     |        1 | general.quantization_type = 2
-* Dumping 797 tensor(s)
+* Dumping 775 tensor(s)
       1:      22784 |   128,   178,     1,     1 | F32     | kokoro.albert.token_embd
       2:      65536 |   128,   512,     1,     1 | F32     | kokoro.albert.position_embd
       3:        128 |   128,     1,     1,     1 | F32     | kokoro.albert.token_type_embd
@@ -870,25 +870,3 @@
     773:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.bm_fable
     774:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.bm_george
     775:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.bm_lewis
-    776:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.ef_dora
-    777:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.em_alex
-    778:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.em_santa
-    779:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.ff_siwis
-    780:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.hf_alpha
-    781:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.hf_beta
-    782:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.hm_omega
-    783:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.hm_psi
-    784:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.if_sara
-    785:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.im_nicola
-    786:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jf_alpha
-    787:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jf_gongitsune
-    788:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jf_nezumi
-    789:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jf_tebukuro
-    790:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jm_kumo
-    791:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.pf_dora
-    792:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.pm_alex
-    793:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.pm_santa
-    794:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.zf_xiaobei
-    795:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.zf_xiaoni
-    796:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.zf_xiaoxiao
-    797:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.zf_xiaoyi
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp Kokoro_GGUF/Kokoro_no_espeak.gguf -qt Q5_0 -qp /run/user/1000/test.gguf -nt 3 -nqf
2ed0005fb1446ffac5e169e6f1fe3f24  /run/user/1000/test.gguf
97fc92ce5b8ce675cad42e49e2d1949b  Kokoro_GGUF/Kokoro_no_espeak_Q5.gguf
--- /run/user/1000/test.gguf.1.txt	2025-07-21 23:15:12.945740485 -0400
+++ /run/user/1000/test.gguf.2.txt	2025-07-21 23:14:49.393695709 -0400
@@ -1,13 +1,13 @@
 * File is LITTLE endian, script is running on a LITTLE endian host.
 * Dumping 94 key/value pair(s)
       1: UINT32     |        1 | GGUF.version = 3
-      2: UINT64     |        1 | GGUF.tensor_count = 797
+      2: UINT64     |        1 | GGUF.tensor_count = 775
       3: UINT64     |        1 | GGUF.kv_count = 91
       4: STRING     |        1 | general.architecture = 'kokoro'
-      5: [STRING]   |       50 | kokoro.voices = ['af_alloy', 'af_aoede', 'af_bella', 'af_heart', 'af_jessica', 'af_kore', ...]
+      5: [STRING]   |       28 | kokoro.voices = ['af_alloy', 'af_aoede', 'af_bella', 'af_heart', 'af_jessica', 'af_kore', ...]
       6: STRING     |        1 | general.type = 'model'
       7: STRING     |        1 | general.name = 'kokoro'
-      8: STRING     |        1 | general.size_label = '88M'
+      8: STRING     |        1 | general.size_label = '85M'
       9: UINT32     |        1 | tokenizer.ggml.padding_token_id = 0
      10: UINT32     |        1 | kokoro.decoder_start_token_id = 0
      11: UINT32     |        1 | kokoro.duration_predictor.albert.context_length = 512
@@ -83,7 +83,7 @@
      81: UINT32     |        1 | kokoro.decoder.generator.up_convs.1.padding = 3
      82: UINT32     |        1 | kokoro.decoder.generator.up_convs.1.stride = 6
      83: UINT32     |        1 | phonemizer.type = 0
-     84: UINT32     |        1 | phonemizer.phoneme_type = 1
+     84: UINT32     |        1 | phonemizer.phoneme_type = 0
      85: [STRING]   |     4422 | phonemizer.graphemes = ['oil', 'ise', 'val', 'dia', 'nii', 'miner', ...]
      86: [STRING]   |   995928 | phonemizer.rules.keys = ['a', 'a.^', 'a.^.$', 'a.^.aro', 'a.^.fa', 'a.^.fe', ...]
      87: [STRING]   |   995928 | phonemizer.rules.phonemes = ['ə', 'ɐ', 'ˈeɪ', 'ˈ', 'ɐ', 'ɐ', ...]
@@ -94,7 +94,7 @@
      92: UINT32     |        1 | tokenizer.ggml.eos_token_id = 0
      93: UINT32     |        1 | general.quantization_version = 2
      94: UINT32     |        1 | general.quantization_type = 6
-* Dumping 797 tensor(s)
+* Dumping 775 tensor(s)
       1:      22784 |   128,   178,     1,     1 | F32     | kokoro.albert.token_embd
       2:      65536 |   128,   512,     1,     1 | F32     | kokoro.albert.position_embd
       3:        128 |   128,     1,     1,     1 | F32     | kokoro.albert.token_type_embd
@@ -870,25 +870,3 @@
     773:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.bm_fable
     774:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.bm_george
     775:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.bm_lewis
-    776:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.ef_dora
-    777:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.em_alex
-    778:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.em_santa
-    779:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.ff_siwis
-    780:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.hf_alpha
-    781:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.hf_beta
-    782:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.hm_omega
-    783:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.hm_psi
-    784:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.if_sara
-    785:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.im_nicola
-    786:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jf_alpha
-    787:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jf_gongitsune
-    788:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jf_nezumi
-    789:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jf_tebukuro
-    790:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jm_kumo
-    791:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.pf_dora
-    792:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.pm_alex
-    793:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.pm_santa
-    794:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.zf_xiaobei
-    795:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.zf_xiaoni
-    796:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.zf_xiaoxiao
-    797:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.zf_xiaoyi
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp Kokoro_GGUF/Kokoro_no_espeak.gguf -qt Q8_0 -qp /run/user/1000/test.gguf -nt 3 -nqf
b64bda058aec1afebee1e7f2c9d136be  /run/user/1000/test.gguf
0dd31d469948b4f4625d1b5d48d6fbe9  Kokoro_GGUF/Kokoro_no_espeak_Q8.gguf
--- /run/user/1000/test.gguf.1.txt	2025-07-21 23:16:01.093834356 -0400
+++ /run/user/1000/test.gguf.2.txt	2025-07-21 23:15:37.273787535 -0400
@@ -1,13 +1,13 @@
 * File is LITTLE endian, script is running on a LITTLE endian host.
 * Dumping 94 key/value pair(s)
       1: UINT32     |        1 | GGUF.version = 3
-      2: UINT64     |        1 | GGUF.tensor_count = 797
+      2: UINT64     |        1 | GGUF.tensor_count = 775
       3: UINT64     |        1 | GGUF.kv_count = 91
       4: STRING     |        1 | general.architecture = 'kokoro'
-      5: [STRING]   |       50 | kokoro.voices = ['af_alloy', 'af_aoede', 'af_bella', 'af_heart', 'af_jessica', 'af_kore', ...]
+      5: [STRING]   |       28 | kokoro.voices = ['af_alloy', 'af_aoede', 'af_bella', 'af_heart', 'af_jessica', 'af_kore', ...]
       6: STRING     |        1 | general.type = 'model'
       7: STRING     |        1 | general.name = 'kokoro'
-      8: STRING     |        1 | general.size_label = '88M'
+      8: STRING     |        1 | general.size_label = '85M'
       9: UINT32     |        1 | tokenizer.ggml.padding_token_id = 0
      10: UINT32     |        1 | kokoro.decoder_start_token_id = 0
      11: UINT32     |        1 | kokoro.duration_predictor.albert.context_length = 512
@@ -83,7 +83,7 @@
      81: UINT32     |        1 | kokoro.decoder.generator.up_convs.1.padding = 3
      82: UINT32     |        1 | kokoro.decoder.generator.up_convs.1.stride = 6
      83: UINT32     |        1 | phonemizer.type = 0
-     84: UINT32     |        1 | phonemizer.phoneme_type = 1
+     84: UINT32     |        1 | phonemizer.phoneme_type = 0
      85: [STRING]   |     4422 | phonemizer.graphemes = ['oil', 'ise', 'val', 'dia', 'nii', 'miner', ...]
      86: [STRING]   |   995928 | phonemizer.rules.keys = ['a', 'a.^', 'a.^.$', 'a.^.aro', 'a.^.fa', 'a.^.fe', ...]
      87: [STRING]   |   995928 | phonemizer.rules.phonemes = ['ə', 'ɐ', 'ˈeɪ', 'ˈ', 'ɐ', 'ɐ', ...]
@@ -94,7 +94,7 @@
      92: UINT32     |        1 | tokenizer.ggml.eos_token_id = 0
      93: UINT32     |        1 | general.quantization_version = 2
      94: UINT32     |        1 | general.quantization_type = 8
-* Dumping 797 tensor(s)
+* Dumping 775 tensor(s)
       1:      22784 |   128,   178,     1,     1 | F32     | kokoro.albert.token_embd
       2:      65536 |   128,   512,     1,     1 | F32     | kokoro.albert.position_embd
       3:        128 |   128,     1,     1,     1 | F32     | kokoro.albert.token_type_embd
@@ -870,25 +870,3 @@
     773:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.bm_fable
     774:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.bm_george
     775:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.bm_lewis
-    776:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.ef_dora
-    777:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.em_alex
-    778:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.em_santa
-    779:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.ff_siwis
-    780:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.hf_alpha
-    781:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.hf_beta
-    782:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.hm_omega
-    783:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.hm_psi
-    784:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.if_sara
-    785:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.im_nicola
-    786:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jf_alpha
-    787:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jf_gongitsune
-    788:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jf_nezumi
-    789:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jf_tebukuro
-    790:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.jm_kumo
-    791:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.pf_dora
-    792:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.pm_alex
-    793:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.pm_santa
-    794:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.zf_xiaobei
-    795:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.zf_xiaoni
-    796:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.zf_xiaoxiao
-    797:     130560 |   256,   510,     1,     1 | F32     | kokoro.voice_tensors.zf_xiaoyi
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp parler-tts-mini-v1-GGUF/parler-tts-mini-v1-fp32.gguf -qt FP16 -qp /run/user/1000/test.gguf -nt 3
452d5088dfca204c3f3c3d471c85428c  /run/user/1000/test.gguf
452d5088dfca204c3f3c3d471c85428c  parler-tts-mini-v1-GGUF/parler-tts-mini-v1-fp16.gguf
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp parler-tts-mini-v1-GGUF/parler-tts-mini-v1-fp32.gguf -qt Q4_0 -qp /run/user/1000/test.gguf -nt 3
02de215e4f28390ac55241cb5116eae8  /run/user/1000/test.gguf
02de215e4f28390ac55241cb5116eae8  parler-tts-mini-v1-GGUF/parler-tts-mini-v1-Q4_0.gguf
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp parler-tts-mini-v1-GGUF/parler-tts-mini-v1-fp32.gguf -qt Q5_0 -qp /run/user/1000/test.gguf -nt 3
f449fffe0f2b5b779bc2e5cc96829ed5  /run/user/1000/test.gguf
f449fffe0f2b5b779bc2e5cc96829ed5  parler-tts-mini-v1-GGUF/parler-tts-mini-v1-Q5_0.gguf
++ /home/home/CLionProjects/TTS-cpp/TTS.cpp/build/bin/quantize -mp parler-tts-mini-v1-GGUF/parler-tts-mini-v1-fp32.gguf -qt Q8_0 -qp /run/user/1000/test.gguf -nt 3
8f8a23b9684e7bc489bc18369e2afc97  /run/user/1000/test.gguf
8f8a23b9684e7bc489bc18369e2afc97  parler-tts-mini-v1-GGUF/parler-tts-mini-v1-Q8_0.gguf

ecyht2 · 2025-07-22T07:49:23Z

Updated testing script

@danielzgtg Can you push the testing script. Maybe I can create a GitHub Action for the test.

feat: Added user friendly quantize type

310c7ee

danielzgtg requested changes Jul 22, 2025

View reviewed changes

examples/quantize/quantize.cpp Show resolved Hide resolved

danielzgtg reviewed Jul 22, 2025

View reviewed changes

examples/quantize/quantize.cpp Outdated Show resolved Hide resolved

feat: Added aliases for quantization types

b203913

danielzgtg approved these changes Jul 22, 2025

View reviewed changes

danielzgtg mentioned this pull request Jul 22, 2025

quantize: Add snapshot testing #94

Open

danielzgtg merged commit 0b42010 into mmwillet:main Jul 25, 2025
2 checks passed

ecyht2 deleted the feat/user-friendly-quantized-type branch August 10, 2025 07:52

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Add User Friendly Quantize Type #93

Add User Friendly Quantize Type #93

Uh oh!

ecyht2 commented Jul 17, 2025

Uh oh!

Uh oh!

Uh oh!

danielzgtg commented Jul 22, 2025

Uh oh!

ecyht2 commented Jul 22, 2025

Uh oh!

Uh oh!

Uh oh!

Add User Friendly Quantize Type #93

Add User Friendly Quantize Type #93

Uh oh!

Conversation

ecyht2 commented Jul 17, 2025

Uh oh!

Uh oh!

Uh oh!

danielzgtg commented Jul 22, 2025

Uh oh!

ecyht2 commented Jul 22, 2025

Uh oh!

Uh oh!

Uh oh!