📢 Phiên bản mới cho desktop win&mac đã phát hành, chào mừng bạn thử nghiệm và phản hồi [Tài liệu đang được cập nhật]
Krillin AI là một giải pháp toàn diện cho việc địa phương hóa và nâng cao âm thanh và video. Công cụ đơn giản nhưng mạnh mẽ này tích hợp dịch video, lồng ghép giọng nói và nhân bản giọng nói, hỗ trợ xuất định dạng ngang và dọc, đảm bảo hiển thị hoàn hảo trên tất cả các nền tảng chính (Bilibili, Xiaohongshu, Douyin, Video Number, Kuaishou, YouTube, TikTok, v.v.). Với quy trình làm việc đầu cuối, Krillin AI chỉ cần vài cú nhấp chuột để biến nguyên liệu gốc thành nội dung đa nền tảng sẵn sàng sử dụng.
🎯 Khởi động một cú nhấp chuột: Không cần cấu hình môi trường phức tạp, tự động cài đặt phụ thuộc, sẵn sàng sử dụng ngay lập tức, phiên bản desktop mới, dễ sử dụng hơn!
📥 Lấy video: Hỗ trợ tải xuống yt-dlp hoặc tải lên tệp cục bộ
📜 Nhận diện chính xác: Nhận diện giọng nói với độ chính xác cao dựa trên Whisper
🧠 Phân đoạn thông minh: Sử dụng LLM để phân đoạn và căn chỉnh phụ đề
🔄 Thay thế thuật ngữ: Thay thế từ ngữ chuyên ngành chỉ với một cú nhấp chuột
🌍 Dịch chuyên nghiệp: Dịch cấp đoạn dựa trên LLM, giữ nguyên tính liên kết ngữ nghĩa
🎙️ Nhân bản giọng nói: Cung cấp giọng nói chọn lọc từ CosyVoice hoặc nhân bản giọng nói tùy chỉnh
🎬 Ghép video: Tự động xử lý video định dạng ngang và dọc cùng với bố cục phụ đề
Hình dưới đây là hiệu ứng của tệp phụ đề được tạo ra sau khi nhập video cục bộ dài 46 phút, không cần điều chỉnh thủ công. Không có thiếu sót, chồng chéo, câu được ngắt tự nhiên, chất lượng dịch cũng rất cao.
subtitle_translation.mp4 |
tts.mp4 |
agi.mp4 |
Tất cả các mô hình cục bộ trong bảng dưới đây đều hỗ trợ cài đặt tự động tệp thực thi + tệp mô hình, bạn chỉ cần chọn, KrillinAI sẽ chuẩn bị tất cả cho bạn.
Nguồn dịch vụ | Nền tảng hỗ trợ | Tùy chọn mô hình | Cục bộ/Đám mây | Ghi chú |
---|---|---|---|---|
OpenAI Whisper | Tất cả nền tảng | - | Đám mây | Nhanh và hiệu quả |
FasterWhisper | Windows/Linux | tiny /medium /large-v2 (khuyên dùng medium+) |
Cục bộ | Nhanh hơn, không tốn chi phí đám mây |
WhisperKit | macOS (chỉ dành cho chip M) | large-v2 |
Cục bộ | Tối ưu hóa cho chip Apple |
Alibaba Cloud ASR | Tất cả nền tảng | - | Đám mây | Tránh vấn đề mạng ở Trung Quốc đại lục |
✅ Tương thích với tất cả các dịch vụ mô hình ngôn ngữ lớn cục bộ/đám mây tuân thủ chuẩn API OpenAI, bao gồm nhưng không giới hạn:
- OpenAI
- DeepSeek
- Tongyi Qianwen
- Mô hình mã nguồn mở triển khai cục bộ
- Các dịch vụ API tương thích với định dạng OpenAI khác
Ngôn ngữ đầu vào hỗ trợ: tiếng Trung, tiếng Anh, tiếng Nhật, tiếng Đức, tiếng Thổ Nhĩ Kỳ, tiếng Hàn, tiếng Nga, tiếng Mã Lai (đang tiếp tục mở rộng)
Ngôn ngữ dịch hỗ trợ: tiếng Anh, tiếng Trung, tiếng Nga, tiếng Tây Ban Nha, tiếng Pháp và 101 ngôn ngữ khác
Đầu tiên tải xuống tệp thực thi phù hợp với hệ điều hành của bạn từ Release, theo hướng dẫn dưới đây để chọn phiên bản desktop hay không phải desktop, sau đó đặt vào một thư mục trống, tải phần mềm vào một thư mục trống vì sau khi chạy sẽ tạo ra một số thư mục, đặt vào thư mục trống sẽ dễ quản lý hơn.
【Nếu là phiên bản desktop, tức là tệp release có chữ desktop, xem tại đây】
Version desktop mới phát hành, nhằm giải quyết vấn đề người dùng mới khó chỉnh sửa tệp cấu hình đúng cách, vẫn còn nhiều lỗi, đang được cập nhật liên tục
- Nhấp đúp vào tệp để bắt đầu sử dụng (phiên bản desktop cũng cần cấu hình trong phần mềm)
【Nếu là phiên bản không phải desktop, tức là tệp release không có chữ desktop, xem tại đây】
Version không phải desktop là phiên bản ban đầu, cấu hình phức tạp hơn nhưng chức năng ổn định, đồng thời phù hợp cho triển khai trên máy chủ vì sẽ cung cấp giao diện người dùng theo cách web
- Tạo thư mục
config
trong thư mục, sau đó tạo tệpconfig.toml
trong thư mụcconfig
, sao chép nội dung của tệpconfig-example.toml
trong thư mụcconfig
và điền thông tin cấu hình của bạn. - Nhấp đúp hoặc thực thi tệp thực thi trong terminal để khởi động dịch vụ
- Mở trình duyệt, nhập
http://127.0.0.1:8888
, bắt đầu sử dụng (thay 8888 bằng cổng bạn đã điền trong tệp cấu hình)
【Nếu là phiên bản desktop, tức là tệp release có chữ desktop, xem tại đây】
Hiện tại, cách đóng gói phiên bản desktop do vấn đề chữ ký, không thể nhấp đúp để chạy trực tiếp hoặc cài đặt dmg, cần phải tin tưởng ứng dụng thủ công, cách làm như sau:
- Mở terminal đến thư mục chứa tệp thực thi (giả sử tên tệp là KrillinAI_1.0.0_desktop_macOS_arm64)
- Thực hiện lần lượt các lệnh sau:
sudo xattr -cr ./KrillinAI_1.0.0_desktop_macOS_arm64
sudo chmod +x ./KrillinAI_1.0.0_desktop_macOS_arm64
./KrillinAI_1.0.0_desktop_macOS_arm64
【Nếu là phiên bản không phải desktop, tức là tệp release không có chữ desktop, xem tại đây】
Phần mềm này không có chữ ký, vì vậy khi chạy trên macOS, sau khi hoàn thành cấu hình tệp trong "các bước cơ bản", cần phải tin tưởng ứng dụng thủ công, cách làm như sau:
- Mở terminal đến thư mục chứa tệp thực thi (giả sử tên tệp là KrillinAI_1.0.0_macOS_arm64)
- Thực hiện lần lượt các lệnh sau:
để khởi động dịch vụ
sudo xattr -rd com.apple.quarantine ./KrillinAI_1.0.0_macOS_arm64 sudo chmod +x ./KrillinAI_1.0.0_macOS_arm64 ./KrillinAI_1.0.0_macOS_arm64
Dự án này hỗ trợ triển khai Docker, vui lòng tham khảo Hướng dẫn triển khai Docker
Nếu bạn gặp phải tình trạng tải video không thành công
Vui lòng tham khảo Hướng dẫn cấu hình Cookie để cấu hình thông tin Cookie của bạn.
Cách cấu hình nhanh chóng và tiện lợi nhất:
- Chọn
transcription_provider
vàllm_provider
đều làopenai
, như vậy trong ba mục cấu hình lớnopenai
、local_model
、aliyun
chỉ cần điềnopenai.apikey
là có thể thực hiện dịch phụ đề. (app.proxy
、model
vàopenai.base_url
có thể điền theo tình hình của bạn)
Cách cấu hình sử dụng mô hình nhận diện ngôn ngữ cục bộ (tạm thời không hỗ trợ macOS) (cân nhắc chi phí, tốc độ và chất lượng)
- Điền
transcription_provider
làfasterwhisper
,llm_provider
làopenai
, như vậy trong ba mục cấu hình lớnopenai
、local_model
chỉ cần điềnopenai.apikey
vàlocal_model.faster_whisper
là có thể thực hiện dịch phụ đề, mô hình cục bộ sẽ tự động tải xuống. (app.proxy
vàopenai.base_url
như trên)
Các trường hợp sử dụng sau đây cần cấu hình Alibaba Cloud:
- Nếu
llm_provider
điền làaliyun
, cần sử dụng dịch vụ mô hình lớn của Alibaba Cloud, vì vậy cần cấu hình mụcaliyun.bailian
- Nếu
transcription_provider
điền làaliyun
, hoặc khi khởi động nhiệm vụ đã bật chức năng "lồng ghép giọng nói", đều cần sử dụng dịch vụ giọng nói của Alibaba Cloud, vì vậy cần điền mụcaliyun.speech
- Nếu bật chức năng "lồng ghép giọng nói", đồng thời tải lên âm thanh cục bộ để làm nhân bản giọng nói, thì cũng cần sử dụng dịch vụ lưu trữ đám mây OSS của Alibaba Cloud, vì vậy cần điền mục
aliyun.oss
Hướng dẫn cấu hình Alibaba Cloud: Hướng dẫn cấu hình Alibaba Cloud
Vui lòng tham khảo Câu hỏi thường gặp
- Không gửi tệp không cần thiết, như .vscode, .idea, v.v., hãy sử dụng .gitignore để lọc
- Không gửi config.toml, mà hãy sử dụng config-example.toml để gửi
- Tham gia nhóm QQ của chúng tôi để giải đáp thắc mắc: 754069680
- Theo dõi tài khoản mạng xã hội của chúng tôi, Bilibili, hàng ngày chia sẻ nội dung chất lượng trong lĩnh vực công nghệ AI