Abogen 中文介绍
Abogen 是一个强大的文本转语音工具,能够将 ePub、PDF 或文本文件快速转换为高质量音频,并生成同步字幕。它适用于制作有声书、为 Instagram、YouTube、TikTok 等平台创建配音,或任何需要自然语音的文本转语音项目。Abogen 使用 Kokoro-82M 模型,提供高品质的语音合成。
功能亮点
- 多格式支持:支持 ePub、PDF 和文本文件(.txt)输入,内置文本编辑器。
- 快速转换:例如,约 3000 字的文本可在 11 秒内生成 3 分 28 秒的音频(视硬件性能而定)。
- 同步字幕:支持按句子、单词等方式生成字幕,格式包括 SRT 和 ASS。
- 语音定制:通过语音混合器(Voice Mixer)创建个性化语音,支持多种语言和男女声。
- 批量处理:支持队列模式,批量转换多个文件。
- 章节管理:支持从 ePub 或 PDF 中提取章节,单独或合并保存音频。
- 元数据支持:为 M4B 文件添加标题、作者等元数据,优化有声书体验。
安装方法
Windows
- 安装 espeak-ng:从 espeak-ng 最新发布 下载并运行 *.msi 文件。
- 选项 1:使用脚本安装
- 下载 Abogen 仓库并解压。
- 双击运行 WINDOWS_INSTALL.bat,脚本会自动安装所有依赖(包括 CUDA),无需单独安装 Python。
- 选项 2:使用 pip 安装
bashmkdir abogen && cd abogenpython -m venv venvvenv\Scripts\activatepip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128pip install abogen
Mac
bash
# 安装 espeak-ng
brew install espeak-ng
# 创建虚拟环境
mkdir abogen && cd abogen
python3 -m venv venv
source venv/bin/activate
# 安装 Abogen
pip3 install abogen
Linux
bash
# 安装 espeak-ng
sudo apt install espeak-ng # Ubuntu/Debian
sudo pacman -S espeak-ng # Arch Linux
sudo dnf install espeak-ng # Fedora
# 创建虚拟环境
mkdir abogen && cd abogen
python3 -m venv venv
source venv/bin/activate
# 安装 Abogen
pip3 install abogen
# AMD GPU 用户
pip3 uninstall torch
pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/rocm6.4
提示:若遇到路径问题,可将 /home/$USER/.local/bin 添加到 PATH:
bash
echo "export PATH=\"/home/$USER/.local/bin:\$PATH\"" >> ~/.bashrc && source ~/.bashrc
使用方法
- 输入文件:拖放 ePub、PDF 或文本文件,或使用内置编辑器输入文本。
- 配置设置:
- 调整语音速度(0.1x 至 2.0x)。
- 选择语音(支持多语言,如美式英语、英式英语、西班牙语等)。
- 设置字幕样式(按句子、单词等)。
- 选择输出格式(WAV、FLAC、MP3、OPUS、M4B)。
- 指定保存路径。
- 开始转换:点击“开始”按钮,生成音频和字幕。
支持的语言
- 🇺🇸 美式英语 (a)
- 🇬🇧 英式英语 (b)
- 🇪🇸 西班牙语 (e)
- 🇫🇷 法语 (f)
- 🇮🇳 印地语 (h)
- 🇮🇹 意大利语 (i)
- 🇯🇵 日语 (j,需安装 misaki[ja])
- 🇧🇷 巴西葡萄牙语 (p)
- 🇨🇳 普通话 (z,需安装 misaki[zh])
更多语言和语音样例见 Kokoro 的 VOICES.md 和 SAMPLES.md。
高级功能
- 语音混合器:通过调整不同语音模型的权重创建自定义语音,并保存为配置文件。
- 队列模式:支持批量处理多个文件,每个文件可独立配置。
- 章节标记:自动或手动添加章节标记(<<CHAPTER_MARKER:标题>>),支持单独保存或合并章节。
- 元数据标签:为 M4B 文件添加标题、作者、年份等元数据(<<METADATA_TITLE:标题>> 等)。
地址:https://github.com/denizsafak/abogen