Evoars: Advanced AI Media Processing Platform

⭐ If you find this project useful, give it a star! / Bu projeyi yararlı buluyorsanız yıldızlayın! ⭐

📎 Live Demo - Canlı Demo

🇬🇧 Try the previous version of Evoars on Hugging Face (CPU-based, processing may be slower)
🇹🇷 Evoars'ın önceki sürümünü Hugging Face'te test edin (CPU tabanlı, işlem daha yavaş olabilir)

These repositories contain earlier versions of the project (archived/previous work):

Manga Comic Colorization and Translation v2

manga_cizgi_roman_ceviri_v1

🇬🇧English | 🇹🇷Türkçe

English

🇬🇧

📖 Overview

Evoars is an AI-powered web platform that fully automates the processing of manga, comics, and videos. Using advanced AI techniques, it colorizes manga and comics, translates them into different languages, generates automatic subtitles for videos, and creates dubbed audio by cloning voices. Developed by leveraging open-source projects and models, Evoars offers a modern, flexible, and comprehensive solution for content creation and processing.

✨ Core Features & How They Work

🎨 1. Manga and Comics Colorization

Process: Transforms black-and-white manga pages into vibrant colored artwork using deep learning neural networks.

Technical Implementation:

Loads pre-trained AI colorization models (generator.zip)
Processes images through PyTorch-based neural networks
Maintains original image quality and details
Optimizes output for natural color distribution

🌐 2. Manga and Comics Translation

Process: Automatically detects, extracts, and translates all text elements on manga pages.

Technical Implementation:

Text Detection: Uses PaddleOCR to identify all text regions on the page
Text Grouping: Custom algorithm groups nearby text elements into sentences using coordinate proximity
Text Processing: Handles hyphenated words and text formatting issues
Translation: DeepL API translates processed text to target language
Text Removal: LAMA inpainting AI intelligently removes original text
Text Placement: Positions translated text naturally within original speech bubbles

🔄 3. Combined Processing (Colorization + Translation)

Process: Performs both colorization and translation in a single optimized workflow.

Technical Implementation:

First applies the complete translation process
Then processes the translated image through colorization
Ensures text legibility on colored backgrounds
Maintains visual consistency throughout the process

🎬 4. Video Subtitling

Process: Generates subtitle files from video audio using advanced speech recognition.

Technical Implementation:

Audio Extraction: MoviePy extracts audio track from video
Speech Recognition: OpenAI Whisper transcribes audio to text with timestamps
Translation: DeepL API translates transcript to target language
SRT Generation: Creates properly formatted subtitle files with time codes

🎙️ 5. AI Dubbing

Process: Creates natural-sounding voiceovers in multiple languages with voice cloning.

Technical Implementation:

Audio Analysis: Extracts original speaker voices from video
Voice Cloning: TTS model learns speaker characteristics
Text Processing: Uses translated subtitles as dubbing script
Voice Synthesis: Generates new audio using cloned voices
Audio Synchronization: Matches timing with original video
Video Integration: Replaces original audio with dubbed version

🛠️ Technology Stack

Core: Python 3.10, Flask 3.1.0, SQLite
AI/ML: PyTorch 2.2.2, PaddleOCR, OpenAI Whisper, TTS, LAMA Inpainting
Media: OpenCV, FFmpeg, MoviePy, Pydub
UI: HTML5, TailwindCSS, JavaScript
Deployment: Docker with NVIDIA CUDA 12.1 support

🚀 Installation & Setup

Prerequisites

Docker (recommended for easy setup)
Python 3.10+ (for manual installation)
DeepL API Key (free tier available)

Option 1: Docker Installation (Recommended)

Clone Repository

git clone https://github.com/koesan/Evoars.git
cd Evoars

Download AI Models

Download the required AI models for manga colorization:
- Get generator.zip from Google Drive
- Extract the contents to the networks/ folder in your project directory
Configure Translation API

You need to update the DeepL API key in two files:

File 1: translate.py (line 128)
```
translator = deepl.Translator("YOUR_DEEPL_API_KEY_HERE")
```
File 2: colorize_and_translate.py (line 129)
```
translator = deepl.Translator("YOUR_DEEPL_API_KEY_HERE")
```
📝 Get your DeepL API key: Visit DeepL API to obtain your free API key.
Build and Run

# Build Docker image
docker build -t evoars .

# Run container (with GPU support)
docker run -p 7860:7860 --gpus all evoars

# Run container (CPU only)
docker run -p 7860:7860 evoars

Access Application

Open your browser and navigate to: http://localhost:7860

Option 2: Manual Installation

Clone and Setup

git clone https://github.com/koesan/Evoars.git
cd Evoars

Install Dependencies

pip install -r requirements.txt

Download AI Models

Download and extract generator.zip to the networks/ folder as described above.
Configure API Keys

Edit both translate.py and colorize_and_translate.py files to replace the DeepL API keys as shown in the Docker installation section.
Run Application

python app.py

💡 Usage Guide

Manga Colorization = Choose Colorize → Upload black-and-white manga → Submit

Manga Translation = Choose Translate → Upload manga → Select source & target languages → Submit

Combined (Color + Translate) = Choose Both → Upload manga → Set languages → Submit

Video Subtitling = Choose Subtitle → Upload video → Select source language → Submit

AI Dubbing = Choose Dubbing → Upload video + SRT file → Choose Sourch & target language → Submit

Türkçe

🇹🇷

📖 Genel Bakış

Evoars, manga, çizgi roman ve video işleme süreçlerini tamamen otomatikleştiren yapay zekâ destekli bir web platformudur. Yapay zekâ tekniklerini kullanarak manga ve çizgi romanları renklendirir, farklı dillere çevirir; videolara otomatik altyazı ekler ve videolardaki sesleri klonlayarak dublaj oluşturur. Açık kaynaklı projeler ve modellerden yararlanarak geliştirilmiş modern, esnek ve kapsamlı bir içerik işleme çözümüdür.

✨ Temel Özellikler ve Nasıl Çalışır

🎨 1. Manga ve Çizgi Roman Renklendirme

İşlem: Derin öğrenme sinir ağları kullanarak siyah-beyaz manga sayfalarını canlı renkli sanat eserlerine dönüştürür.

🌐 2. Manga ve Çizgi Roman Çevirisi

İşlem: Manga sayfalarındaki tüm metin öğelerini otomatik olarak algılar, çıkarır ve çevirir.

Teknik Uygulama:

Metin Algılama: PaddleOCR kullanarak sayfadaki tüm metin bölgelerini tanımlar
Metin Gruplama: Özel algoritma koordinat yakınlığını kullanarak yakın metin öğelerini cümlelere gruplar
Metin İşleme: Tire ile bölünmüş kelimeler ve metin biçimlendirme sorunlarını ele alır
Çeviri: DeepL API işlenmiş metni hedef dile çevirir
Metin Kaldırma: LAMA inpainting AI orijinal metni akıllıca kaldırır
Metin Yerleştirme: Çevrilmiş metni orijinal konuşma balonları içinde doğal olarak konumlandırır

🔄 3. Birleşik İşleme (Renklendirme + Çeviri)

İşlem: Tek bir optimize edilmiş iş akışında hem renklendirme hem de çeviri gerçekleştirir.

Teknik Uygulama:

Önce tüm çeviri sürecini uygular
Sonra çevrilmiş görüntüyü renklendirme işleminden geçirir
Renkli arka planlarda metin okunabilirliğini sağlar
Süreç boyunca görsel tutarlılığı korur

🎬 4. Video Altyazılama

İşlem: Gelişmiş konuşma tanıma kullanarak video sesinden altyazı dosyaları oluşturur.

Teknik Uygulama:

Ses Çıkarma: MoviePy video dosyasından ses parçasını çıkarır
Konuşma Tanıma: OpenAI Whisper sesi zaman damgalarıyla birlikte metne dönüştürür
Çeviri: DeepL API transkripti hedef dile çevirir
SRT Oluşturma: Zaman kodlarıyla düzgün biçimlendirilmiş altyazı dosyaları oluşturur

🎙️ 5. AI Dublajı

İşlem: Ses klonlama ile birden fazla dilde doğal sesli seslendirmeler oluşturur.

Teknik Uygulama:

Ses Analizi: Videodan orijinal konuşmacı seslerini çıkarır
Ses Klonlama: TTS modeli konuşmacı özelliklerini öğrenir
Metin İşleme: Çevrilmiş altyazıları dublaj metni olarak kullanır
Ses Sentezi: Klonlanmış sesleri kullanarak yeni ses oluşturur
Ses Senkronizasyonu: Orijinal video ile zamanlamayı eşleştirir
Video Entegrasyonu: Orijinal sesi dublajlı sürümle değiştirir

🛠️ Teknoloji Yığını

Temel: Python 3.10, Flask 3.1.0, SQLite
AI/ML: PyTorch 2.2.2, PaddleOCR, OpenAI Whisper, TTS, LAMA Inpainting
Medya: OpenCV, FFmpeg, MoviePy, Pydub
UI: HTML5, TailwindCSS, JavaScript
Dağıtım: NVIDIA CUDA 12.1 destekli Docker

🚀 Kurulum ve Yapılandırma

Gereksinimler

Docker (kolay kurulum için önerilir)
Python 3.10+ (manuel kurulum için)
DeepL API Key (ücretsiz katman mevcut)

Seçenek 1: Docker Kurulumu (Önerilen)

Depoyu Klonlayın

git clone https://github.com/koesan/Evoars.git
cd Evoars

AI Modellerini İndirin

Manga renklendirme için gerekli AI modellerini indirin:
- generator.zip dosyasını Google Drive üzerinden indirin
- İçeriği proje dizininizdeki networks/ klasörüne çıkarın
Çeviri API'sini Yapılandırın

DeepL API anahtarını iki dosyada güncellemeniz gerekiyor:

Dosya 1: translate.py (128. satır)
```
translator = deepl.Translator("DEEPL_API_ANAHTARINIZ")
```
Dosya 2: colorize_and_translate.py (129. satır)
```
translator = deepl.Translator("DEEPL_API_ANAHTARINIZ")
```
📝 DeepL API anahtarınızı alın: Ücretsiz API anahtarınız için DeepL API sitesini ziyaret edin.
Oluşturun ve Çalıştırın

# Docker imajını oluşturun
docker build -t evoars .

# Container'ı çalıştırın (GPU desteği ile)
docker run -p 7860:7860 --gpus all evoars

# Container'ı çalıştırın (sadece CPU)
docker run -p 7860:7860 evoars

Uygulamaya Erişin

Tarayıcınızı açın ve şu adrese gidin: http://localhost:7860

Seçenek 2: Manuel Kurulum

Klonlayın ve Kurun

git clone https://github.com/koesan/Evoars.git
cd Evoars

Bağımlılıkları Yükleyin

pip install -r requirements.txt

AI Modellerini İndirin

Yukarıda açıklandığı gibi generator.zip dosyasını indirin ve networks/ klasörüne çıkarın.
API Anahtarlarını Yapılandırın

Hem translate.py hem de colorize_and_translate.py dosyalarını düzenleyin ve DeepL API anahtarlarını Docker kurulum bölümünde gösterildiği gibi değiştirin.
Uygulamayı Çalıştırın

python app.py

💡 Kullanım Kılavuzu

Manga Renklendirme = Colorize seçin → Siyah-beyaz resmi yükleyin → Submit

Manga Çevirisi = Translate seçin → Manga resmini yükleyin → Kaynak & hedef dili seçin → Submit

Birleşik (Renk + Çeviri) = Both seçin → Manga resmini yükleyin → Dil ayarını yapın → Submit

Video Altyazılama = Subtitle seçin → Videoyu yükleyin → Kaynak dili seçin → Submit

AI Dublaj = Dubbing seçin → Video + SRT dosyasını yükleyin → kaynak & hedef Dili seçin → Submit

🙏 Acknowledgements / Yararlanılan Açık Kaynak Projeler

This project builds on and uses ideas/code from the following open-source projects — big thanks to the authors:

manga-colorization-v2 — manga colorization techniques and model examples.
OpenAI Whisper — speech-to-text ASR.
whisperX — improved Whisper alignment utilities.
Coqui TTS — text-to-speech / voice cloning tools.
LaMa (LAMA) Inpainting — image inpainting for text removal and repair.
PaddleOCR — OCR engine for text detection/extraction.

Name		Name	Last commit message	Last commit date
Latest commit History 54 Commits
denoising		denoising
fonts		fonts
images		images
lib/simple_lama_inpainting		lib/simple_lama_inpainting
networks		networks
static		static
templates		templates
.gitattributes		.gitattributes
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
app.py		app.py
colorizator.py		colorizator.py
colorize.py		colorize.py
colorize_and_translate.py		colorize_and_translate.py
main.py		main.py
manuel_dubbing.py		manuel_dubbing.py
requirements.txt		requirements.txt
subtitles.py		subtitles.py
translate.py		translate.py

License

koesan/Evoars

Folders and files

Latest commit

History

Repository files navigation

Evoars: Advanced AI Media Processing Platform

📎 Live Demo - Canlı Demo

English

🇬🇧

📖 Overview

✨ Core Features & How They Work

🎨 1. Manga and Comics Colorization

🌐 2. Manga and Comics Translation

🔄 3. Combined Processing (Colorization + Translation)

🎬 4. Video Subtitling

🎙️ 5. AI Dubbing

🛠️ Technology Stack

🚀 Installation & Setup

Prerequisites

Option 1: Docker Installation (Recommended)

Option 2: Manual Installation

💡 Usage Guide

Türkçe

🇹🇷

📖 Genel Bakış

✨ Temel Özellikler ve Nasıl Çalışır

🎨 1. Manga ve Çizgi Roman Renklendirme

🌐 2. Manga ve Çizgi Roman Çevirisi

🔄 3. Birleşik İşleme (Renklendirme + Çeviri)

🎬 4. Video Altyazılama

🎙️ 5. AI Dublajı

🛠️ Teknoloji Yığını

🚀 Kurulum ve Yapılandırma

Gereksinimler

Seçenek 1: Docker Kurulumu (Önerilen)

Seçenek 2: Manuel Kurulum

💡 Kullanım Kılavuzu

🙏 Acknowledgements / Yararlanılan Açık Kaynak Projeler

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages