Add silero-stress accentor examples

Sontref · Sontref · commit 9fa594963cec · 2025-11-22T16:26:55.000Z
diff --git a/examples_tts_cis.ipynb b/examples_tts_cis.ipynb
@@ -253,6 +253,137 @@
     "print(example_text)\n",
     "display(Audio(audio, rate=sample_rate))"
    ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "4f597d45",
+   "metadata": {},
+   "source": [
+    "# Accentor Demo\n",
+    "\n",
+    "In case, you need word stress, but you don't want to manually annotate texts, we provide supplementary accentuation modules as a part of `silero-stress` project.\n",
+    "\n",
+    "- We provide full-fledged accentor and `ё`-ficator trained on large vocab with homograph disambiguation for Russian language.\n",
+    "\n",
+    "- We provide accentor trained on large vocab for Ukrainian language.\n",
+    "\n",
+    "- And we provide manually annotated dictionaries with minimalistic wrapper for another languages."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "4f27f662",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "!pip install -q silero-stress"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "bd6d7faf",
+   "metadata": {},
+   "source": [
+    "### Russian / Ukrainian"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 7,
+   "id": "ce90772d",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from silero_stress import load_accentor"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "a8c74c89",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "accentor = load_accentor(lang='ru')  # lang could be \"ru\" / \"ukr\"\n",
+    "sample_sent = \"В недрах тундры выдры в гетрах тырят в ведра ядра кедров.\"\n",
+    "print(accentor(sample_sent))"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "056e09d5",
+   "metadata": {},
+   "source": [
+    "### Other Languages\n",
+    "\n",
+    "Basically, there is no \"accentor\" for other languages, but we released stress dictionaries with some minimalistic wrapper."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 9,
+   "id": "a32d5b22",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "sample_texts = {\n",
+    "    # if you need \"aze\" language, you need to specify which layout do you use - latin or cyrillic\n",
+    "    'aze_lat': 'Mən hər səhər erkən qalxıb təzə hava ilə məşq edirəm.',\n",
+    "    'aze_cyr': 'Мән һәр сәһәр еркән галхыб тәзә һава ылә мәшг едырәм.',\n",
+    "    'bak': 'Мин һәр саңғыраҡ тауҙа түбәнәгендә йәйенә йөҙөп йөрөйм.',\n",
+    "    'bel': 'Я вечарам люблю чытаць цікавыя кнігі пры святле начовай лямпы.',\n",
+    "    'chv': 'Эпĕ ача чухнех пиччĕшсемпе юнашар кĕтӳльех вăйă вылянă.',\n",
+    "    'erz': 'Монь веленек шачемсёномань панжовксонть кис эрьва кизонь туема.',\n",
+    "    'hye': 'Ես շաբաթ օրերին սիրում եմ երկար զբոսնել անտառով:',\n",
+    "    'kat': 'მე ძალიან მიყვარს ჩემი ოჯახის წევრებთან ერთად დროის გატარება.',\n",
+    "    'kaz': 'Мен балалық шақта жаңа досдармен танысуды әбден ұнататынмын.',\n",
+    "    'kbd': 'Сэ уиӀуанэ уашъхъэри унагъуэхэри сэбэп хъущтыр сыту щӀэлъэӀу.',\n",
+    "    'kir': 'Мен мектепте окуп жүргөндө эң жакшы досум менен тааныштым.',\n",
+    "    'kjh': 'Мин аал чоньчарға пастабахсынар хайдиғырам хынаңның хоный.',\n",
+    "    'mdf': 'Монь тяштеть эзда кизонь карьхть сельметь кштинь аф лац.',\n",
+    "    'sah': 'Мин бүгүн оройунан саһарҕа оонньуу сылдьан сымнаҕыстык утуйбутум.',\n",
+    "    'tat': 'Мин ерак түгел урман эчендә чиста һавада йөргәне яратам.',\n",
+    "    'tgk': 'Ман дар бораи хонаи нави худ дар канори дарё хондем.',\n",
+    "    'udm': 'Мон ашалэ тӥлед нуналлы огы быдэсэ кошко учке.',\n",
+    "    # if you need \"uzb\" language, you need to specify which layout do you use - latin or cyrillic\n",
+    "    'uzb_lat': \"Men bolaligimda ko'pincha do'stlarim bilan hovlida futbol o'ynardim.\",\n",
+    "    'uzb_cyr': \"Мен болалигимда кўпинча дўстларим билан ҳовлида футбол ўйнардим.\",\n",
+    "    'xal': 'Би эцкд сарин җилин дуулҗана хойр седклтә күрәм.'\n",
+    "}"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 10,
+   "id": "db3d7793",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from silero_stress.simple_accentor import SimpleAccentor"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "7fcb5e1c",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "for lang in sample_texts:\n",
+    "    accentor = SimpleAccentor(lang=lang)\n",
+    "    print(sample_texts[lang])\n",
+    "    print(accentor(sample_texts[lang]))\n",
+    "    print()"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "a0e05d6e",
+   "metadata": {},
+   "outputs": [],
+   "source": []
   }
  ],
  "metadata": {
@@ -271,7 +402,7 @@
    "name": "python",
    "nbconvert_exporter": "python",
    "pygments_lexer": "ipython3",
-   "version": "3.10.9"
+   "version": "3.7.13"
   },
   "toc": {
    "base_numbering": 1,