-
-
Notifications
You must be signed in to change notification settings - Fork 21
Open
Description
Steps to reproduce
Windows.
Downloaded the latest release, already have ffmpeg installed.
Transcription Language: Swedish
Audio source: file (file.mkv)
Transcription method: Whisper X
Output filetype: srt
Clicked on "Generate transcription"
Took around an hour, then I got:
Traceback (most recent call last):
File "handlers\whisperx_handler.py", line 53, in transcribe_file
File "whisperx\alignment.py", line 71, in load_align_model
raise ValueError(f"No default align-model for language: {language_code}")
ValueError: No default align-model for language: sv
An .srt file was created, and looking at the result (here are the first 11 lines):
1
00:00:23,660 --> 00:00:52,381
–Trodde du att jag hade glömt bort dig? –Risto, vad är det du gör? –Varför betalar du inte för? –Jag har inte sett nåt! Jesper! Jag betalar för att du får dubbelt så mycket jag lovar! –Jag vill inte! –Risto, gör inte det! –Titta på mig! –Titta mig i ögonen!
2
00:00:59,838 --> 00:01:01,510
För en väckbara.
3
00:03:30,452 --> 00:03:59,684
–Vad är det som har hänt? –Jag kan tyvärr inte berätta. –Jag ska besöka en vän som bor här. –Vad heter den personen? –Jakob Fivel. –Jag ska kalla på nån. Vad sa du nyligen?
It seems it does a decent job, but it cant split the dialogs correctly.
Perhaps its because there is no align model?
Metadata
Metadata
Assignees
Labels
No labels