video.mp4
VerbaLive is an advanced desktop application that can listen to any sound your microphone can capture. Whether it's your own voice, someone speaking in the room, a video playing on your computer, or voices from online meetings, it instantly converts English speech to text and translates it into your desired language.
- Offline ASR: Works without internet using the April-ASR model
- Real-Time: Speech is transcribed instantly on screen
- Smart Detection: Partial and final results are shown in different formats
- High Accuracy: Trained with numbers and punctuation for precise transcription
- Dual Engine: Supports both Google Translate and DeepL
- 12+ Languages: Includes Turkish, French, German, Spanish, and more
- Live Translation: Line-by-line real-time translation
- Detailed Translation: Full sentences are translated once the speaker pauses
- Clear, user-friendly design that adapts to different screen sizes
- Sentence-based processing, silence detection, and high-performance low-latency translation
git clone https://github.com/your-username/VerbaLive.git
cd VerbaLive# Windows
python -m venv verbaenv
verbaenv\Scripts\activate
# macOS/Linux
python3 -m venv verbaenv
source verbaenv/bin/activateWindows:
# With Chocolatey
choco install portaudio
# Or manual download may be requiredmacOS:
brew install portaudioUbuntu/Debian based
sudo apt-get update
sudo apt-get install portaudio19-dev python3-pyqt5 python3-pyqt5.qtmultimediaArch Based
sudo pacman -Syu
sudo pacman -S portaudio python-pyqt5 python-pyqt5-multimediaFedora Based
sudo dnf update
sudo dnf install portaudio-devel python3-qt5 python3-qt5-multimediapip install --upgrade pip
pip install -r requirements.txt- Visit April-ASR Model Page
- Download
april-english-dev-01110_en.aprilfile - Place the downloaded file in the project root directory (same folder as
app.py)
python app.py-
Select Translation Service
- Google Translate (free, no API key required)
- DeepL (higher quality, API key required)
-
Choose Target Language
- 12+ language options(Visual representation with flags)
-
DeepL Usage (optional)
- Create DeepL API account
- Enter your API key in the interface
-
Start Speaking
- Microphone automatically becomes active
- Speak in English or play English audio
- Text starts appearing instantly
🇺🇸 English Speech: Real-time transcription of microphone input
⚡ Instant Translation: Line-by-line live translation of ongoing speech
📝 Detailed Translation: After a 2-second pause, the entire completed speech is fully translated
# Configurable settings in app.py
self.silence_threshold_ms = 1500 # Silence threshold (ms)
self.realtime_timer.start(500) # Live translation frequency (ms)1. Microphone Not Detected
# Windows
Check microphone permission in sound settings
# macOS
System Preferences > Security & Privacy > Privacy > Microphone
# Linux
pulseaudio --check && echo "PulseAudio running"2. Google Translate "[Google not available]" Error
Solution 1: Check your internet connection
Solution 2: Reinstall googletrans package
pip uninstall googletrans
pip install googletrans==3.1.0a0VerbaLive, mikrofonunuzdan gelen her türlü sesi dinleyebilen gelişmiş bir masaüstü uygulamasıdır. Kendi sesiniz, odadaki başka birinin konuşması, bilgisayardan çalan bir video veya çevrim içi toplantılardan gelen sesleri anlık olarak metne dönüştürür ve istediğiniz dile çevirir.
- Çevrimdışı ASR: April-ASR modeli ile internet bağlantısı olmadan çalışır
- Gerçek Zamanlı: Konuşma anında metin ekrana yansır
- Akıllı Algılama: Kısmi ve final sonuçlar ayrı formatlarda gösterilir
- Yüksek Doğruluk: Sayılar ve noktalama işaretleri dahil kapsamlı eğitim
- Çifte Motor: Google Translate ve DeepL desteği
- 12+ Dil Desteği: Türkçe, Fransızca, Almanca, İspanyolca ve diğerleri
- Anlık Çeviri: Satır satır gerçek zamanlı çeviri
- Detaylı Çeviri: Konuşma tamamlandığında kapsamlı çeviri
- Okunabilir, kullanıcı dostu ve farklı ekran boyutlarına uyumlu tasarım
- Cümle bazlı işlem, sessizlik algılama ve düşük gecikmeli yüksek performanslı çeviri
git clone https://github.com/your-username/VerbaLive.git
cd VerbaLive# Windows
python -m venv verbaenv
verbaenv\Scripts\activate
# macOS/Linux
python3 -m venv verbaenv
source verbaenv/bin/activateWindows:
# Chocolatey ile
choco install portaudio
# Veya manuel indirme gerekebilirmacOS:
brew install portaudioUbuntu/Debian based
sudo apt-get update
sudo apt-get install portaudio19-dev python3-pyqt5 python3-pyqt5.qtmultimediaArch Based
sudo pacman -Syu
sudo pacman -S portaudio python-pyqt5 python-pyqt5-multimediaFedora Based
sudo dnf update
sudo dnf install portaudio-devel python3-qt5 python3-qt5-multimediapip install --upgrade pip
pip install -r requirements.txt- April-ASR Model Sayfası adresini ziyaret edin
april-english-dev-01110_en.aprildosyasını indirin- İndirilen dosyayı proje ana dizinine (
app.pyile aynı klasöre) yerleştirin
python app.py-
Çeviri Servisi Seçin
- Google Translate (ücretsiz, API anahtarı gerektirmez)
- DeepL (daha kaliteli, API anahtarı gerektirir)
-
Hedef Dili Seçin
- 12+ dil seçeneği(Bayraklı görsel gösterim)
-
DeepL Kullanımı (isteğe bağlı)
- DeepL API hesabı oluşturun
- API anahtarınızı arayüzde ilgili alana girin
-
Konuşmaya Başlayın
- Mikrofonunuz otomatik olarak aktif olur
- İngilizce konuşun veya İngilizce ses çalın
- Metinler anında görünmeye başlar
🇺🇸 İngilizce Konuşma: Mikrofonla alınan sesin metne anlık dönüşümü
⚡ Anlık Çeviri: Sesin satır satır gerçek zamanlı çevirisi
📝 Detaylı Çeviri: Konuşma tamamlanınca 2 saniyelik duraklamadan sonra tüm konuşmanın kapsamlı çevirisi
# app.py içinde değiştirilebilir ayarlar
self.silence_threshold_ms = 1500 # Sessizlik eşiği (ms)
self.realtime_timer.start(500) # Anlık çeviri sıklığı (ms)1. Mikrofon Algılanmıyor
# Windows
Ses ayarlarından mikrofon iznini kontrol edin
# macOS
Sistem Tercihleri > Güvenlik ve Gizlilik > Gizlilik > Mikrofon
# Linux
pulseaudio --check && echo "PulseAudio çalışıyor"2. Google Translate "[Google not available]" Hatası
Çözüm 1: İnternet bağlantınızı kontrol edin
Çözüm 2: googletrans paketini yeniden yükleyin
pip uninstall googletrans
pip install googletrans==3.1.0a0- April-ASR: Offline speech recognition engine
This project is licensed under the MIT License. See LICENSE file for details.