您当前的位置：首页 > 电脑百科 > 软件技术 > 应用软件

5秒内克隆你的声音，并生成任何内容，这个开源工具细思极恐

时间：2021-09-01 14:05:32 来源：作者：程序员吖

+ 加入收藏

开源前线（ID：OpenSourceTop）猿妹整编

综合自：https://github.com/babysor/MockingBird

大家应该都知道声音克隆技术，通俗的来说就是借助深度学习算法，可以完全模拟某个人的声音，而且由机器合成的语音连情绪都能够完美表达出来，基本可以以假乱真，只要不见面，你根本就察觉不出来向你发出声音的知识一个机器。

语音克隆最大的创新之一是减少创建语音所需的原始数据量。过去，该系统需要数十甚至数百小时的音频。但是，今天猿妹要和大家分享的这个工具5秒钟就可以克隆成功，这个工具名叫——MockingBird。

MockingBird已经登上Github热榜，收获3.5K的Star，累计分支 303（Github地址：https://github.com/babysor/MockingBird）

MockingBird具有如下特性：

支持普通话并使用多种中文数据集进行测试
适用于 pytorch，已在 1.9.0 版本（最新于 2021 年 8 月）中测试，GPU Tesla T4 和 GTX 2060
支持 windows + linux
仅使用新训练的合成器（synthesizer）就有良好效果，复用预训练的编码器/声码器

MockingBird如何使用

MockingBird的安装要求如下：

首先，MockingBird需要Python 3.7 或更高版本
安装 PyTorch
安装 ffmpeg。
运行pip install -r requirements.txt 来安装剩余的必要包。
安装 webrtcvad 用 pip install webrtcvad-wheels。

接着，你需要使用数据集训练合成器：

下载数据集并解压：确保您可以访问 train 文件夹中的所有音频文件（如.wav）
使用音频和梅尔频谱图进行预处理：python synthesizer_preprocess_audio.py <datasets_root> 可以传入参数 --dataset {dataset} 支持 adatatang_200zh, magicdata, aishell3
预处理嵌入：python synthesizer_preprocess_embeds.py <datasets_root>/SV2TTS/synthesizer
训练合成器：python synthesizer_train.py mandarin <datasets_root>/SV2TTS/synthesizer
当你在训练文件夹 synthesizer/saved_models/ 中看到注意线显示和损失满足您的需要时，请转到下一步。

使用预先训练好的合成器，如果没有设备或者不想慢慢调试，可以使用网友贡献的模型。

训练声码器

预处理数据: python vocoder_preprocess.py <datasets_root>
训练声码器: python vocoder_train.py mandarin <datasets_root>

启动工具箱

然后你可以尝试使用工具箱：python demo_toolbox.py -d <datasets_root>

Tags：克隆声音点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

5秒内克隆你的声音，并生成任何内容，这个开源工具细思极恐

开源前线（ID：OpenSourceTop）猿妹整编综合自：https://github.com/babysor/MockingBird 大家应该都知道声音克隆技术，通俗的来说就是借助深度学习算法，可以完全模拟某个人的声音，而...【详细内容】

2021-09-01　　Tags: 克隆声音点击:(151)　　评论:(0)　　加入收藏

▌简易百科推荐

ACDSee 最好用的版本

ACDSee Pro 2.5 和ACDSee 2009（也就是 ACDSee 11）这两个版本，虽然图标最丑，但却是最适合目前使用的版本。（以前的ACDSee 3.1是第三方改装版，现在出现不稳定了，经常提示插件错误，虽...【详细内容】

2021-12-27　　周星骋Cheng　　　　Tags:ACDSee 　点击:(2)　　评论:(0)　　加入收藏

百度地图第二代车道级导航上线：北斗 + 5G 覆盖全国高快速路段

IT之家 12 月 23 日消息，百度地图今日宣布，第二代车道级导航正式上线。据介绍，百度地图第二代车道借助北斗 + 5G，在实现全程车道级导航效果的基础上，全面升级最优车道推荐、全 /...【详细内容】

2021-12-24　　IT之家　　　　Tags:百度地图　点击:(10)　　评论:(0)　　加入收藏

推荐12款用了离不开的神仙软件，不用安装免费用

推荐12款不用安装就能免费用的神仙软件，每一款都是百里挑一！一、文件存储与传输1.不限量网盘地址：https://transferkit.io/一个在线云存储网盘，它提供了不限量的云存储空间，单文...【详细内容】

2021-12-17　　牛片网　　　　Tags:软件　点击:(15)　　评论:(0)　　加入收藏

高效工作表格模板汇总：日计划、周计划、月计划、年计划表格模板

古人说：凡事预则立不预则废，对于我们当代人来说，做好工作计划，更是职场人高效工作的第一步，所以计划对于我们的重要性不言而喻…… 工作表格模板汇总正是因为有了工...【详细内容】

2021-12-15　　吴六柒　　　　Tags:工作表格　点击:(32)　　评论:(0)　　加入收藏

浏览器的脚本工具箱Tampermonkey（黑油猴）

当我们浏览知乎、Youtube、贴吧、CSDN等等，总会遇到服务商一些广告；复制文章的时候，剪切板总是自带一些版权信息；还有一些网页配色很亮，眼睛看着很不舒服。反正就是各种不爽。给...【详细内容】

2021-12-08　　小皮虾Pro　　　　Tags:浏览器　点击:(27)　　评论:(0)　　加入收藏

厉害了！推荐一个 Web 端自动化神器 - Automa

来源：AirPython作者：星安果 1. 前言大家好，我是安果！之前推荐过很多优秀的 Web 自动化工具，比如：Selenium、Helium、Cypress、Pyppeteer 等利用它们实现自动化的前提是必须安装依...【详细内容】

2021-11-30　　CDA数据分析师　　　　Tags:Automa 　点击:(30)　　评论:(0)　　加入收藏

轻量级BI工具Superset1.0

概述superset是由Airbnb开源的轻量级BI分析工具。主要有三大功能：使用数据可视化来探索你的数据，通过交互式的Dashboard来查看你的数据，通过Sql Lab来编写sql查询你的数据。特...【详细内容】

2021-11-30　　新视像　　　　Tags:Superset 　点击:(21)　　评论:(0)　　加入收藏

爷青回！经典老牌音乐播放器Winamp宣布回归

媒体爆料称：近期，老牌音乐播放器Winamp宣布回归，官方网站也大改后重新上线。官方表示：不只是简单更新而是全面重制。新的Winamp 将推出适用于 Windows、macOS 和移动平台的多合...【详细内容】

2021-11-26　　　　中关村在线　　Tags:Winamp 　点击:(23)　　评论:(0)　　加入收藏

如何使用高德地图ADAS预警导航？

新版高德地图上线 ADAS 预警导航功能，借助视觉 AI 技术，可智能识别前方车辆、行人，并提供碰撞预警、车道偏离等多种安全提醒，防止风险的发生。在小联的调研中，只有6%的车机体验...【详细内容】

2021-11-23　　手机互联　　　　Tags:高德地图　点击:(143)　　评论:(0)　　加入收藏

好用的企业邮箱怎么选择？可用邮箱大全

朋友委托我帮忙看看可用邮箱大全有哪些？好用的企业邮箱是多少？他公司要开通企业邮箱。相信很多公司在考虑开通企业邮箱时，都会遇到这样的问题，企业邮箱哪个好？怎样选择合适的企业...【详细内容】

2021-11-11　　超级打工人　　　　Tags:企业邮箱　点击:(30)　　评论:(0)　　加入收藏

推荐资讯

远程软件发展迅猛，ToDe	倒计时！企业QQ即将下架
极简Windows11与iPhon	iPhone信号问题，花10元
惊人数据：App Store中4	个人所得税递延纳税报
非常实用的 Python 库	等离子电视技术先进，为

无相关信息