Wav2Vec2-MultiTask

This is a fine-tuned Wav2Vec2.0 model for multi-task learning:

Phoneme recognition
Emotion classification
Speaker identification

Usage

from transformers import AutoModel, AutoConfig, AutoProcessor

model = AutoModel.from_pretrained(
    "username/my-wav2vec2-multitask",
    trust_remote_code=True
)

config = AutoConfig.from_pretrained(
    "username/my-wav2vec2-multitask",
    trust_remote_code=True
)

processor = AutoProcessor.from_pretrained("facebook/wav2vec2-base")

inputs = processor("hello world", return_tensors="pt", sampling_rate=16000)

# phoneme recognition
logits = model(**inputs, task="phoneme")

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
__pycache__		__pycache__
README.md		README.md
__init__.py		__init__.py
config.json		config.json
configuration_wav2vec2_multitask.py		configuration_wav2vec2_multitask.py
emotion_map.json		emotion_map.json
ensemble.sh		ensemble.sh
mix-dataset-filter.csv		mix-dataset-filter.csv
modeling_wav2vec2_multitask.py		modeling_wav2vec2_multitask.py
preprocessor_config.json		preprocessor_config.json
requirements.txt		requirements.txt
speaker_map.json		speaker_map.json
special_tokens_map.json		special_tokens_map.json
test_model.py		test_model.py
tokenizer_config.json		tokenizer_config.json
vocab.json		vocab.json
w2v_pr_si_er_multi_gpu.py		w2v_pr_si_er_multi_gpu.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Wav2Vec2-MultiTask

Usage

About

Uh oh!

Releases

Packages

Languages

asadullah797/ssl-semi-multitask

Folders and files

Latest commit

History

Repository files navigation

Wav2Vec2-MultiTask

Usage

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages