Skip to content

Commit 9fa5949

Browse files
committed
Add silero-stress accentor examples
1 parent 180f118 commit 9fa5949

File tree

1 file changed

+132
-1
lines changed

1 file changed

+132
-1
lines changed

examples_tts_cis.ipynb

Lines changed: 132 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -253,6 +253,137 @@
253253
"print(example_text)\n",
254254
"display(Audio(audio, rate=sample_rate))"
255255
]
256+
},
257+
{
258+
"cell_type": "markdown",
259+
"id": "4f597d45",
260+
"metadata": {},
261+
"source": [
262+
"# Accentor Demo\n",
263+
"\n",
264+
"In case, you need word stress, but you don't want to manually annotate texts, we provide supplementary accentuation modules as a part of `silero-stress` project.\n",
265+
"\n",
266+
"- We provide full-fledged accentor and `ё`-ficator trained on large vocab with homograph disambiguation for Russian language.\n",
267+
"\n",
268+
"- We provide accentor trained on large vocab for Ukrainian language.\n",
269+
"\n",
270+
"- And we provide manually annotated dictionaries with minimalistic wrapper for another languages."
271+
]
272+
},
273+
{
274+
"cell_type": "code",
275+
"execution_count": null,
276+
"id": "4f27f662",
277+
"metadata": {},
278+
"outputs": [],
279+
"source": [
280+
"!pip install -q silero-stress"
281+
]
282+
},
283+
{
284+
"cell_type": "markdown",
285+
"id": "bd6d7faf",
286+
"metadata": {},
287+
"source": [
288+
"### Russian / Ukrainian"
289+
]
290+
},
291+
{
292+
"cell_type": "code",
293+
"execution_count": 7,
294+
"id": "ce90772d",
295+
"metadata": {},
296+
"outputs": [],
297+
"source": [
298+
"from silero_stress import load_accentor"
299+
]
300+
},
301+
{
302+
"cell_type": "code",
303+
"execution_count": null,
304+
"id": "a8c74c89",
305+
"metadata": {},
306+
"outputs": [],
307+
"source": [
308+
"accentor = load_accentor(lang='ru') # lang could be \"ru\" / \"ukr\"\n",
309+
"sample_sent = \"В недрах тундры выдры в гетрах тырят в ведра ядра кедров.\"\n",
310+
"print(accentor(sample_sent))"
311+
]
312+
},
313+
{
314+
"cell_type": "markdown",
315+
"id": "056e09d5",
316+
"metadata": {},
317+
"source": [
318+
"### Other Languages\n",
319+
"\n",
320+
"Basically, there is no \"accentor\" for other languages, but we released stress dictionaries with some minimalistic wrapper."
321+
]
322+
},
323+
{
324+
"cell_type": "code",
325+
"execution_count": 9,
326+
"id": "a32d5b22",
327+
"metadata": {},
328+
"outputs": [],
329+
"source": [
330+
"sample_texts = {\n",
331+
" # if you need \"aze\" language, you need to specify which layout do you use - latin or cyrillic\n",
332+
" 'aze_lat': 'Mən hər səhər erkən qalxıb təzə hava ilə məşq edirəm.',\n",
333+
" 'aze_cyr': 'Мән һәр сәһәр еркән галхыб тәзә һава ылә мәшг едырәм.',\n",
334+
" 'bak': 'Мин һәр саңғыраҡ тауҙа түбәнәгендә йәйенә йөҙөп йөрөйм.',\n",
335+
" 'bel': 'Я вечарам люблю чытаць цікавыя кнігі пры святле начовай лямпы.',\n",
336+
" 'chv': 'Эпĕ ача чухнех пиччĕшсемпе юнашар кĕтӳльех вăйă вылянă.',\n",
337+
" 'erz': 'Монь веленек шачемсёномань панжовксонть кис эрьва кизонь туема.',\n",
338+
" 'hye': 'Ես շաբաթ օրերին սիրում եմ երկար զբոսնել անտառով:',\n",
339+
" 'kat': 'მე ძალიან მიყვარს ჩემი ოჯახის წევრებთან ერთად დროის გატარება.',\n",
340+
" 'kaz': 'Мен балалық шақта жаңа досдармен танысуды әбден ұнататынмын.',\n",
341+
" 'kbd': 'Сэ уиӀуанэ уашъхъэри унагъуэхэри сэбэп хъущтыр сыту щӀэлъэӀу.',\n",
342+
" 'kir': 'Мен мектепте окуп жүргөндө эң жакшы досум менен тааныштым.',\n",
343+
" 'kjh': 'Мин аал чоньчарға пастабахсынар хайдиғырам хынаңның хоный.',\n",
344+
" 'mdf': 'Монь тяштеть эзда кизонь карьхть сельметь кштинь аф лац.',\n",
345+
" 'sah': 'Мин бүгүн оройунан саһарҕа оонньуу сылдьан сымнаҕыстык утуйбутум.',\n",
346+
" 'tat': 'Мин ерак түгел урман эчендә чиста һавада йөргәне яратам.',\n",
347+
" 'tgk': 'Ман дар бораи хонаи нави худ дар канори дарё хондем.',\n",
348+
" 'udm': 'Мон ашалэ тӥлед нуналлы огы быдэсэ кошко учке.',\n",
349+
" # if you need \"uzb\" language, you need to specify which layout do you use - latin or cyrillic\n",
350+
" 'uzb_lat': \"Men bolaligimda ko'pincha do'stlarim bilan hovlida futbol o'ynardim.\",\n",
351+
" 'uzb_cyr': \"Мен болалигимда кўпинча дўстларим билан ҳовлида футбол ўйнардим.\",\n",
352+
" 'xal': 'Би эцкд сарин җилин дуулҗана хойр седклтә күрәм.'\n",
353+
"}"
354+
]
355+
},
356+
{
357+
"cell_type": "code",
358+
"execution_count": 10,
359+
"id": "db3d7793",
360+
"metadata": {},
361+
"outputs": [],
362+
"source": [
363+
"from silero_stress.simple_accentor import SimpleAccentor"
364+
]
365+
},
366+
{
367+
"cell_type": "code",
368+
"execution_count": null,
369+
"id": "7fcb5e1c",
370+
"metadata": {},
371+
"outputs": [],
372+
"source": [
373+
"for lang in sample_texts:\n",
374+
" accentor = SimpleAccentor(lang=lang)\n",
375+
" print(sample_texts[lang])\n",
376+
" print(accentor(sample_texts[lang]))\n",
377+
" print()"
378+
]
379+
},
380+
{
381+
"cell_type": "code",
382+
"execution_count": null,
383+
"id": "a0e05d6e",
384+
"metadata": {},
385+
"outputs": [],
386+
"source": []
256387
}
257388
],
258389
"metadata": {
@@ -271,7 +402,7 @@
271402
"name": "python",
272403
"nbconvert_exporter": "python",
273404
"pygments_lexer": "ipython3",
274-
"version": "3.10.9"
405+
"version": "3.7.13"
275406
},
276407
"toc": {
277408
"base_numbering": 1,

0 commit comments

Comments
 (0)