jamiepine · tsvalek · Apr 26, 2026 · Apr 26, 2026 · coderabbitai · Apr 26, 2026
diff --git a/app/src/components/Generation/EngineModelSelector.tsx b/app/src/components/Generation/EngineModelSelector.tsx
@@ -19,6 +19,8 @@ import type { GenerationFormValues } from '@/lib/hooks/useGenerationForm';
 const ENGINE_OPTIONS = [
   { value: 'qwen:1.7B', label: 'Qwen3-TTS 1.7B', engine: 'qwen' },
   { value: 'qwen:0.6B', label: 'Qwen3-TTS 0.6B', engine: 'qwen' },
+  { value: 'qwen:1.7B-4bit', label: 'Qwen3-TTS 1.7B ⚡ Fast', engine: 'qwen' },
+  { value: 'qwen:0.6B-4bit', label: 'Qwen3-TTS 0.6B ⚡ Fast', engine: 'qwen' },
   { value: 'qwen_custom_voice:1.7B', label: 'Qwen CustomVoice 1.7B', engine: 'qwen_custom_voice' },
   { value: 'qwen_custom_voice:0.6B', label: 'Qwen CustomVoice 0.6B', engine: 'qwen_custom_voice' },
   { value: 'luxtts', label: 'LuxTTS', engine: 'luxtts' },

diff --git a/app/src/lib/hooks/useGenerationForm.ts b/app/src/lib/hooks/useGenerationForm.ts
@@ -16,7 +16,7 @@ const generationSchema = z.object({
   text: z.string().min(1, '').max(50000),
   language: z.enum(LANGUAGE_CODES as [LanguageCode, ...LanguageCode[]]),
   seed: z.number().int().optional(),
-  modelSize: z.enum(['1.7B', '0.6B', '1B', '3B']).optional(),
+  modelSize: z.enum(['1.7B', '0.6B', '1.7B-4bit', '0.6B-4bit', '1B', '3B']).optional(),
   instruct: z.string().max(500).optional(),
   engine: z
     .enum([
@@ -122,7 +122,11 @@ export function useGenerationForm(options: UseGenerationFormOptions = {}) {
                       : 'Qwen CustomVoice 0.6B'
                     : data.modelSize === '1.7B'
                       ? 'Qwen TTS 1.7B'
-                      : 'Qwen TTS 0.6B';
+                      : data.modelSize === '1.7B-4bit'
+                        ? 'Qwen TTS 1.7B ⚡ Fast'
+                        : data.modelSize === '0.6B-4bit'
+                          ? 'Qwen TTS 0.6B ⚡ Fast'
+                          : 'Qwen TTS 0.6B';
 
       // Check if model needs downloading
       try {

diff --git a/backend/backends/__init__.py b/backend/backends/__init__.py
@@ -228,11 +228,17 @@ def _get_qwen_model_configs() -> list[ModelConfig]:
     if backend_type == "mlx":
         repo_1_7b = "mlx-community/Qwen3-TTS-12Hz-1.7B-Base-bf16"
         repo_0_6b = "mlx-community/Qwen3-TTS-12Hz-0.6B-Base-bf16"
+        repo_1_7b_4bit = "mlx-community/Qwen3-TTS-12Hz-1.7B-Base-4bit"
+        repo_0_6b_4bit = "mlx-community/Qwen3-TTS-12Hz-0.6B-Base-4bit"
     else:
         repo_1_7b = "Qwen/Qwen3-TTS-12Hz-1.7B-Base"
         repo_0_6b = "Qwen/Qwen3-TTS-12Hz-0.6B-Base"
+        repo_1_7b_4bit = None
+        repo_0_6b_4bit = None
 
-    return [
+    _languages = ["zh", "en", "ja", "ko", "de", "fr", "ru", "pt", "es", "it"]
+
+    configs = [
         ModelConfig(
             model_name="qwen-tts-1.7B",
             display_name="Qwen TTS 1.7B",
@@ -241,7 +247,7 @@ def _get_qwen_model_configs() -> list[ModelConfig]:
             model_size="1.7B",
             size_mb=3500,
             supports_instruct=False,  # Base model drops instruct silently
-            languages=["zh", "en", "ja", "ko", "de", "fr", "ru", "pt", "es", "it"],
+            languages=_languages,
         ),
         ModelConfig(
             model_name="qwen-tts-0.6B",
@@ -251,10 +257,37 @@ def _get_qwen_model_configs() -> list[ModelConfig]:
             model_size="0.6B",
             size_mb=1200,
             supports_instruct=False,
-            languages=["zh", "en", "ja", "ko", "de", "fr", "ru", "pt", "es", "it"],
+            languages=_languages,
         ),
     ]
 
+    # 4-bit quantized variants — MLX only, ~2-3x faster on Apple Silicon
+    if backend_type == "mlx":
+        configs.extend([
+            ModelConfig(
+                model_name="qwen-tts-1.7B-4bit",
+                display_name="Qwen TTS 1.7B ⚡ Fast (4-bit)",
+                engine="qwen",
+                hf_repo_id=repo_1_7b_4bit,
+                model_size="1.7B-4bit",
+                size_mb=1100,
+                supports_instruct=False,
+                languages=_languages,
+            ),
+            ModelConfig(
+                model_name="qwen-tts-0.6B-4bit",
+                display_name="Qwen TTS 0.6B ⚡ Fast (4-bit)",
+                engine="qwen",
+                hf_repo_id=repo_0_6b_4bit,
+                model_size="0.6B-4bit",
+                size_mb=400,
+                supports_instruct=False,
+                languages=_languages,
+            ),
+        ])
+
+    return configs
+
 
 def _get_qwen_custom_voice_configs() -> list[ModelConfig]:
     """Return Qwen CustomVoice model configs."""

diff --git a/backend/backends/mlx_backend.py b/backend/backends/mlx_backend.py
@@ -39,14 +39,16 @@ def _get_model_path(self, model_size: str) -> str:
         Get the MLX model path.
 
         Args:
-            model_size: Model size (1.7B or 0.6B)
+            model_size: Model size (1.7B, 0.6B, 1.7B-4bit, 0.6B-4bit)
 
         Returns:
             HuggingFace Hub model ID for MLX
         """
         mlx_model_map = {
             "1.7B": "mlx-community/Qwen3-TTS-12Hz-1.7B-Base-bf16",
             "0.6B": "mlx-community/Qwen3-TTS-12Hz-0.6B-Base-bf16",
+            "1.7B-4bit": "mlx-community/Qwen3-TTS-12Hz-1.7B-Base-4bit",
+            "0.6B-4bit": "mlx-community/Qwen3-TTS-12Hz-0.6B-Base-4bit",
         }
 
         if model_size not in mlx_model_map:

diff --git a/backend/utils/chunked_tts.py b/backend/utils/chunked_tts.py
@@ -25,6 +25,7 @@
 # Lowercase for case-insensitive matching.
 _ABBREVIATIONS = frozenset(
     {
+        # English
         "mr",
         "mrs",
         "ms",
@@ -50,6 +51,44 @@
         "u.s",
         "u.s.a",
         "u.k",
+        # Russian
+        "т.д",   # и т.д. (и так далее)
+        "т.п",   # и т.п. (и тому подобное)
+        "т.е",   # т.е. (то есть)
+        "т.к",   # т.к. (так как)
+        "т.н",   # т.н. (так называемый)
+        "т.о",   # т.о. (таким образом)
+        "др",    # и др. (и другие)
+        "пр",    # и пр. (и прочее)
+        "г",     # г. (год / город)
+        "гг",    # гг. (годы)
+        "в",     # в. (век)
+        "вв",    # вв. (века)
+        "н.э",   # н.э. (нашей эры)
+        "ул",    # ул. (улица)
+        "д",     # д. (дом)
+        "корп",  # корп. (корпус)
+        "стр",   # стр. (строение / страница)
+        "руб",   # руб. (рублей)
+        "коп",   # коп. (копеек)
+        "тыс",   # тыс. (тысяч)
+        "млн",   # млн. (миллионов)
+        "млрд",  # млрд. (миллиардов)
+        "трлн",  # трлн. (триллионов)
+        "кв",    # кв. (квадратный)
+        "см",    # см. (смотри / сантиметр)
+        "им",    # им. (имени)
+        "проф",  # проф. (профессор)
+        "акад",  # акад. (академик)
+        "доц",   # доц. (доцент)
+        "ред",   # ред. (редактор)
+        "изд",   # изд. (издание)
+        "обл",   # обл. (область)
+        "р",     # р. (река / рублей)
+        "оз",    # оз. (озеро)
+        "о",     # о. (остров)
+        "м",     # м. (метро / метр)
+        "гр",    # гр. (гражданин / грамм)
     }
 )