枫云AI虚拟伙伴Web版

枫云AI虚拟伙伴Web版是一个由MewCo-AI开源的高自由度的网页二次元AI数字人框架，现已升级至4.0版本。支持声纹识别语音交互、文本对话、语音合成、图像识别、桌宠模式、Live2D/MMD/VRM 3D角色展示、多智能体助手等功能。用户可以通过Web界面或桌宠与虚拟伙伴进行互动，虚拟伙伴能够根据用户的输入进行智能回复，并支持多种语言模型和语音合成引擎。

功能特性

高自由度与模块化扩展性：面向开发者的开源框架，支持修改代码二次开发以实现高度个性化的AI伙伴。
广泛的开源AI生态：对接多种云端/本地大语言模型、多模态模型、语音合成大模型。支持GLM-4、通义千问、DeepSeek-R1推理模型、Qwen-VL多模态模型等，并兼容OpenAI标准API。
声纹识别语音交互：通过SenseVoice本地ASR引擎实现实时语音识别，支持流畅的语音交流。语音合成功能支持打断，用户可通过语音、按钮或按键方式中断过长的回复。还支持声纹识别功能，虚拟伙伴只应答特定用户的声音。
多模态图像识别：支持电脑屏幕画面/摄像头内容/手动上传图片的多模态图像识别。
本地知识库：对接本地AnythingLLM、Dify聊天助手提升虚拟伙伴的理解与回应精度。
多设备全平台访问：在Windows电脑上运行后，局域网内的设备(如电脑、手机、平板、车机)可通过浏览器展示虚拟伙伴。
桌宠模式：支持Live2D桌面宠物模式，虚拟伙伴以悬浮窗形式显示在桌面上。
多智能体助手模式：支持音乐播放、语音输入、软件控制、文本写作、屏幕翻译、智能家居控制、天气查询、新闻搜索、系统状态监控、联网搜索、视频生成等丰富功能。
丰富的自定义设置：用户可自定义虚拟伙伴的名称、语音、人设、Live2D/MMD/VRM 3D角色模型等，并个性化配置ASR、TTS、LLM、VLM等模块。
主动感知对话：支持根据时间、屏幕内容、摄像头内容等主动发起对话，提供更自然的交互体验。
角色扮演聊天：基于所选的大语言模型、虚拟伙伴人设、语音合成引擎和图像识别引擎，可与用户进行自然语言交流。

安装与使用

环境要求

操作系统：Windows 10或更高版本
处理器：Intel Core i5 8th / AMD R5 3000 系列
内存：8GB RAM
显卡：Intel UHD 620 核显 / AMD Vega 7 核显
存储空间：至少3GB可用空间
网络：支持联网使用，也支持下载本地AI引擎DLC离线使用
麦克风：0.5米拾音（语音输入需求）
摄像头：720P彩色（多模态图像识别需求）

安装步骤

方法一(推荐)：下载安装整合包(简单易上手)

下载整合包

从官方网站下载整合包：下载链接
解压并运行

使用7-Zip或Bandizip软件智能解压已下载的安装包，双击运行"枫云AI虚拟伙伴Web版.bat"文件即可启动软件。
本地AI引擎（可选）

如果您希望实现软件的本地运行，可以下载AI虚拟伙伴插件-本地端侧AI引擎DLC：下载链接

方法二：通过源码安装(面向开发者)

克隆仓库

首先，确保您已经安装了Git和Anaconda/Miniconda。然后，打开命令行窗口并运行以下命令来克隆仓库：
```
git clone https://github.com/swordswind/ai_virtual_mate_web.git 
cd ai_virtual_mate_web
```

安装依赖

在项目根目录下，运行以下命令安装所需的Python依赖：

conda create -n aivmw python==3.12
conda activate aivmw
pip install -r requirements.txt

配置环境
- 如果需要使用云端免费API，请在 data/set/cloud_ai_key_set.json 中填写相应的API密钥。
- 从网盘模型整合包(推荐) 或 sherpa_onnx项目地址下载语音识别(sherpa-onnx-sense-voice-zh-en-ja-ko-yue)、声纹识别(3dspeaker_speech_campplus_sv_zh_en_16k-common_advanced)、语音合成(sherpa-onnx-vits-zh-ll)模型，解压后放入或替换 data/model 文件夹。
运行应用

在项目根目录下，运行以下命令启动应用：
```
python main.py
```
应用启动后，可以通过浏览器访问 http://127.0.0.1:5260 进入Web界面。

使用说明

启动软件：双击运行程序，软件主界面将自动弹出。首次使用建议阅读软件使用文档并同意GPL-3.0开源协议。请将屏幕缩放比例调整为100%或125%，以获得最佳视觉体验。
首次使用初始化配置：双击枫云AI虚拟伙伴Web版.bat打开软件 → 点击右上角软件设置按钮 → 点击右侧云端AI Key设置按钮 → 记事本修改填入对应云端LLM平台的Key → 点击记事本左上角菜单文件，保存 → 关闭记事本和软件，重新运行上述bat文件 → 完成初始化配置
桌面端操作：软件默认关闭实时语音交互，按下"Alt+x"可切换实时语音开关。打开实时语音交互后，可在任意界面和虚拟伙伴聊天。用户也可以在输入框内输入文本与虚拟伙伴进行对话。
网页端操作：点击主界面"网页对话"按钮或通过浏览器访问 http://127.0.0.1:5260 打开对话网页。
多智能体助手：在运行模式切换中选择"多智能体助手"，即可使用音乐播放、语音输入、软件控制、文本写作、屏幕翻译、智能家居控制、天气查询、新闻搜索、系统状态监控、联网搜索、视频生成等丰富功能。
Live2D角色互动：点击主界面"L2D角色"按钮，将打开Live2D角色展示网页。用户可在网页上通过滑动鼠标或手指实时与虚拟伙伴互动，虚拟伙伴视线持续跟随鼠标或手指。
MMD 3D角色展示：点击主界面"MMD角色"按钮，将打开MMD 3D角色展示网页，虚拟伙伴嘴部会跟随语音输出动起来。
VRM 3D角色展示：点击主界面"VRM角色"按钮，将打开VRM 3D角色展示网页，支持触摸互动。
MMD 3D动作展示：点击主界面的"MMD动作"按钮，将打开MMD 3D动作展示网页。用户可前往资源管理便捷更换MMD 3D的vmd动作。
桌面宠物：点击主界面"L2D桌宠"按钮，可在桌面上显示Live2D桌宠，支持拖拽、缩放、右键菜单操作。桌宠仅支持Live2D，不支持MMD/VRM 3D。

项目结构

ai_virtual_mate_web/
├── data/                    # 数据文件
│   ├── cache/               # 缓存文件
│   ├── db/                  # 配置文件
│   ├── image/               # 图片资源
│   ├── model/               # AI模型资源
│   │   ├── ASR/             # 语音识别模型
│   │   ├── TTS/             # 语音合成模型
│   │   └── SpeakerID/       # 声纹识别模型
│   ├── music/               # 音乐目录
│   └── set/                 # 设置文件
├── dist/                    # 静态资源
│   └── assets/              # Live2D/MMD/VRM模型和Web资源
├── agent.py                 # 智能体功能模块
├── ase.py                   # 主动感知模块
├── asr.py                   # 语音识别模块
├── chat_web.py              # Web聊天界面
├── function.py              # 功能函数
├── gui.py                   # GUI主界面
├── gui_qt.py                # Qt桌面宠物
├── gui_sub.py               # GUI子模块
├── llm.py                   # 语言模型模块
├── live2d.py                # Live2D模块
├── main.py                  # 主程序
├── main_sub.py              # 主程序子模块
├── mmd.py                   # MMD 3D模块
├── sys_init.py              # 系统初始化
├── tts.py                   # 语音合成模块
├── vlm.py                   # 图像识别模块
├── vrm.py                   # VRM 3D模块
└── requirements.txt         # 依赖文件

配置说明

主要配置文件

data/db/config.json：主配置文件，包含虚拟伙伴名称、语音识别灵敏度、语音合成引擎等配置项。
data/set/cloud_ai_key_set.json：云端AI密钥配置文件，包含GLM智谱、SiliconCloud、百度文心、腾讯混元、讯飞星火等平台的API密钥。
data/set/more_set.json：更多配置文件，包含摄像头编号、麦克风编号、本地服务端口等设置。
data/set/home_assistant_set.txt：Home Assistant智能家居配置。
data/set/custom_tts_set.txt：自定义云端OpenAI标准兼容格式TTS API配置。

支持的大语言模型

云端模型：智谱GLM、通义千问、DeepSeek、文心一言、腾讯混元、讯飞星火
本地模型：Ollama LLM框架、LM Studio框架、Transformers框架、Dify聊天助手知识库、AnythingLLM知识库
自定义API：支持任何兼容OpenAI API标准的LLM模型

支持的语音合成引擎

云端引擎：edge-tts、Paddle-TTS
本地引擎：GPT-SoVITS、CosyVoice、Index-TTS、VoxCPM
内置引擎：低延迟VITS、系统自带TTS
自定义API：支持任何兼容OpenAI API标准的TTS模型

支持的图像识别引擎

云端引擎：智谱GLM-V
本地引擎：Ollama VLM框架、LM Studio框架、QwenVL整合包、Janus整合包
自定义API：支持任何兼容OpenAI API标准的VLM模型

支持的图像生成引擎

云端引擎：CogView-3、Kolors、文心Web
本地引擎：Janus整合包、Stable Diffusion API

常见问题解答

软件启动闪退怎么办？
- 对于整合包用户，该问题原因为极少数电脑系统Python环境冲突。可前往C:\Users(用户)\用户名\AppData\Roaming\Python文件夹，把其中的Python312(也可能是其他版本号)文件夹重命名为Python312_backup。然后再次启动软件，正常进入。对于从源码安装的用户，请检查安装步骤确保Python版本正确以及库安装完整。
点击打开桌宠/角色但不显示怎么办？
- 如果是默认的角色不显示，则是Windows系统渲染库的问题，可能是因为Windows更新出错导致，如果有条件可在另一台电脑上使用本软件。如果是更换后的模型不显示，可能是模型兼容性问题或模型路径配置错误，可尝试其它模型或恢复默认设置。
服务不可用怎么办？
- 请首先检查您的API Key是否配置正确以及网络连接是否稳定。若网络无问题，请尝试在设置中更换另一个对话语言模型或语音合成引擎。也可选择下载DLC并开启对应的本地AI引擎，实现离线使用。
语音识别不完整/没反应怎么办？
- 软件默认使用中灵敏度语音识别，可前往软件设置根据电脑麦克风实际情况调高/调低语音识别灵敏度，也可能需要调节电脑麦克风音量，保存设置后重启软件即可。
伙伴语音自我打断/自言自语怎么办？
- 推荐选择自定义唤醒词，避免自我打断；也可以戴耳机使用，或者调低扬声器的音量。还可进入软件设置录制个人声纹，这样虚拟伙伴只会回复主人语音。
MMD/VRM 3D角色网页卡顿怎么办？
- 谷歌浏览器右上角三个点→设置→左侧栏"系统"，打开使用图形加速功能（如果可用），之后MMD/VRM模型会在GPU上加载，动作更加流畅。
被杀毒软件清理了怎么办？
- 该情况属于误报毒行为，本软件为绿色软件，请放心使用。从杀毒软件隔离区恢复软件并加入白名单(信任区)即可。

开源协议

本项目采用 GPL-3.0 开源协议，详情请参阅 LICENSE 文件。本软件公益开源免费，严禁商用、套壳和倒卖，请遵守开源协议使用。

致谢

感谢所有贡献者和用户的支持！
虚拟伙伴[小月]Live2D模型版权：Live2D inc.
感谢以下等开源项目的支持：
- GPT-SoVITS: https://github.com/RVC-Boss/GPT-SoVITS
- opencv: https://github.com/opencv/opencv-python
- FunAudioLLM: https://github.com/FunAudioLLM
- edge-tts: https://github.com/rany2/edge-tts
- Qwen3-VL: https://github.com/QwenLM/Qwen3-VL
- ollama: https://github.com/ollama/ollama
- flask: https://github.com/pallets/flask
- live2d: https://github.com/nladuo/live2d-chatbot-demo
- three.js: https://github.com/mrdoob/three.js
- sherpa-onnx: https://github.com/k2-fsa/sherpa-onnx

联系开发者团队

如有任何问题或建议，请联系开发者团队：

Email: [email protected]
GitHub: swordswind
项目主页: https://swordswind.github.io/2024/07/09/mateweb/
GitHub仓库: https://github.com/swordswind/ai_virtual_mate_web

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

枫云AI虚拟伙伴Web版

功能特性

安装与使用

环境要求

安装步骤

方法一(推荐)：下载安装整合包(简单易上手)

方法二：通过源码安装(面向开发者)

使用说明

项目结构

配置说明

主要配置文件

支持的大语言模型

支持的语音合成引擎

支持的图像识别引擎

支持的图像生成引擎

常见问题解答

开源协议

致谢

联系开发者团队

About

Uh oh!

Releases

Packages

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 55 Commits
data		data
dist/assets		dist/assets
LICENSE		LICENSE
README.md		README.md
agent.py		agent.py
ase.py		ase.py
asr.py		asr.py
chat_web.py		chat_web.py
function.py		function.py
gui.py		gui.py
gui_qt.py		gui_qt.py
gui_sub.py		gui_sub.py
live2d.py		live2d.py
llm.py		llm.py
main.py		main.py
main_sub.py		main_sub.py
mmd.py		mmd.py
requirements.txt		requirements.txt
sys_init.py		sys_init.py
tts.py		tts.py
vlm.py		vlm.py
vrm.py		vrm.py
websearch.py		websearch.py
枫云AI虚拟伙伴Web版(调试模式).bat		枫云AI虚拟伙伴Web版(调试模式).bat
枫云AI虚拟伙伴Web版.bat		枫云AI虚拟伙伴Web版.bat
枫云AI虚拟伙伴Web版使用文档v4.0.pdf		枫云AI虚拟伙伴Web版使用文档v4.0.pdf

License

swordswind/ai_virtual_mate_web

Folders and files

Latest commit

History

Repository files navigation

枫云AI虚拟伙伴Web版

功能特性

安装与使用

环境要求

安装步骤

方法一(推荐)：下载安装整合包(简单易上手)

方法二：通过源码安装(面向开发者)

使用说明

项目结构

配置说明

主要配置文件

支持的大语言模型

支持的语音合成引擎

支持的图像识别引擎

支持的图像生成引擎

常见问题解答

开源协议

致谢

联系开发者团队

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages