澳门桌上舞,Bet娱乐场官网网络赌博,荣胜国际赌球网址(中国)·官方网站

大家應該都知道聲音克隆技術(shù)，通俗的來說就是借助深度學習算法，可以完全模擬某個人的聲音，而且由機器合成的語音連情緒都能夠完美表達出來，基本可以以假亂真，只要不見面，你根本就察覺不出來向你發(fā)出聲音的知識一個機器。

語音克隆最大的創(chuàng)新之一是減少創(chuàng)建語音所需的原始數(shù)據(jù)量。過去，該系統(tǒng)需要數(shù)十甚至數(shù)百小時的音頻。但是，今天猿妹要和大家分享的這個工具5秒鐘就可以克隆成功，這個工具名叫——MockingBird。

MockingBird已經(jīng)登上Github熱榜，收獲3.5K的Star，累計分支 303（Github地址：https://github.com/babysor/MockingBird）

MockingBird具有如下特性：

支持普通話并使用多種中文數(shù)據(jù)集進行測試

適用于 pytorch，已在 1.9.0 版本（最新于 2021 年 8 月）中測試，GPU Tesla T4 和 GTX 2060

支持 Windows + Linux

僅使用新訓練的合成器（synthesizer）就有良好效果，復用預訓練的編碼器/聲碼器

MockingBird如何使用

MockingBird的安裝要求如下：

首先，MockingBird需要Python 3.7 或更高版本

安裝 PyTorch

安裝 ffmpeg。

運行pip install -r requirements.txt 來安裝剩余的必要包。

安裝 webrtcvad 用 pip install webrtcvad-wheels。

接著，你需要使用數(shù)據(jù)集訓練合成器：

下載數(shù)據(jù)集并解壓：確保您可以訪問 train 文件夾中的所有音頻文件（如.wav）

使用音頻和梅爾頻譜圖進行預處理：python synthesizer_preprocess_audio.py 《datasets_root》可以傳入參數(shù) --dataset {dataset} 支持 adatatang_200zh， magicdata， aishell3

預處理嵌入：python synthesizer_preprocess_embeds.py 《datasets_root》/SV2TTS/synthesizer

訓練合成器：python synthesizer_train.py mandarin 《datasets_root》/SV2TTS/synthesizer

當你在訓練文件夾 synthesizer/saved_models/ 中看到注意線顯示和損失滿足您的需要時，請轉(zhuǎn)到下一步。

使用預先訓練好的合成器，如果沒有設備或者不想慢慢調(diào)試，可以使用網(wǎng)友貢獻的模型。

訓練聲碼器

預處理數(shù)據(jù)： python vocoder_preprocess.py 《datasets_root》

訓練聲碼器： python vocoder_train.py mandarin 《datasets_root》

啟動工具箱

然后你可以嘗試使用工具箱：python demo_toolbox.py -d 《datasets_root》

責任編輯：haq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

開源

開源

+關注

關注
3

文章
3402

瀏覽量
42712
克隆

克隆

+關注

關注
0

文章
22

瀏覽量
7825
深度學習

深度學習

+關注

關注
73

文章
5513

瀏覽量
121551

原文標題：5秒內(nèi)克隆你的聲音，并生成任何內(nèi)容，這個工具細思極恐...還特么的開源~

文章出處：【微信號：AndroidPush，微信公眾號：Android編程精選】歡迎添加關注！文章轉(zhuǎn)載請注明出處。

NPU與機器學習算法的關系

在人工智能領域，機器學習算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復雜度的提升，對計算資源的需求也在不斷增長。NPU作為一種專門為深度

發(fā)表于 11-15 09:19 ?600次閱讀

NPU在深度學習中的應用

設計的硬件加速器，它在深度學習中的應用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學習算法優(yōu)化的處理器，它與傳統(tǒng)的CPU和G

發(fā)表于 11-14 15:17 ?888次閱讀

AI大模型與深度學習的關系

人類的學習過程，實現(xiàn)對復雜數(shù)據(jù)的學習和識別。AI大模型則是指模型的參數(shù)數(shù)量巨大，需要龐大的計算資源來進行訓練和推理。深度學習

發(fā)表于 10-23 15:25 ?1264次閱讀

用TPA3112設計的一個音頻功放電路，上電1-3秒后就沒有聲音輸出了，怎么解決？

用TPA3112設計的一個音頻功放電路輸入采用差分的，后來把1個輸入接地，變成了單端的了問題很奇怪接信號發(fā)生器，上電后，1-3秒內(nèi)有音頻輸出，能夠聽到聲音然后就沒有聲音了 FAULT輸出低折騰了很久，望高手指點一二

發(fā)表于 10-12 07:17

FPGA做深度學習能走多遠？

。FPGA的優(yōu)勢就是可編程可配置，邏輯資源多，功耗低，而且賽靈思等都在極力推廣。不知道用FPGA做深度學習未來會怎樣發(fā)展，能走多遠，你怎么看。 A：FPGA 在深度

發(fā)表于 09-27 20:53

深度識別算法包括哪些內(nèi)容

：CNN是深度學習中處理圖像和視頻等具有網(wǎng)格結(jié)構(gòu)數(shù)據(jù)的主要算法。它通過卷積層、池化層和全連接層等組件，實現(xiàn)對圖像特征的自動提取和識別。應用領域：CNN在圖像識別、目標檢測、視頻分

發(fā)表于 09-10 15:28 ?473次閱讀

基于大數(shù)據(jù)與深度學習的穿戴式運動心率算法

性能的關鍵手段。然而，在復雜多變的運動環(huán)境中，準確測量心率數(shù)據(jù)對于傳統(tǒng)算法而言具有較大的技術(shù)瓶頂。本文將探討如何運用大數(shù)據(jù)和深度學習技術(shù)來開發(fā)創(chuàng)新的穿戴式運動心率算

發(fā)表于 09-10 08:03 ?319次閱讀

基于大數(shù)據(jù)與<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的穿戴式運動心率<b class='flag-5'>算法</b>

深度學習算法在嵌入式平臺上的部署

隨著人工智能技術(shù)的飛速發(fā)展，深度學習算法在各個領域的應用日益廣泛。然而，將深度學習算法部署到資源

發(fā)表于 07-15 10:03 ?1690次閱讀

深度學習算法在集成電路測試中的應用

隨著半導體技術(shù)的快速發(fā)展，集成電路（IC）的復雜性和集成度不斷提高，對測試技術(shù)的要求也日益增加。深度學習算法作為一種強大的數(shù)據(jù)處理和模式識別工具，在集成電路測試領域展現(xiàn)出了巨大的應用潛力。本文將從

發(fā)表于 07-15 09:48 ?1172次閱讀

利用Matlab函數(shù)實現(xiàn)深度學習算法

在Matlab中實現(xiàn)深度學習算法是一個復雜但強大的過程，可以應用于各種領域，如圖像識別、自然語言處理、時間序列預測等。這里，我將概述一個基本的流程，包括環(huán)境設置、數(shù)據(jù)準備、模型設計、訓

發(fā)表于 07-14 14:21 ?2447次閱讀

深度學習中的無監(jiān)督學習方法綜述

應用中往往難以實現(xiàn)。因此，無監(jiān)督學習在深度學習中扮演著越來越重要的角色。本文旨在綜述深度學習中的

發(fā)表于 07-09 10:50 ?944次閱讀

深度學習的基本原理與核心算法

處理、語音識別等領域取得了革命性的突破。本文將詳細闡述深度學習的原理、核心算法以及實現(xiàn)方式，并通過一個具體的代碼實例進行說明。

發(fā)表于 07-04 11:44 ?2475次閱讀

深度學習模型訓練過程詳解

深度學習模型訓練是一個復雜且關鍵的過程，它涉及大量的數(shù)據(jù)、計算資源和精心設計的算法。訓練一個深度學習模型，本質(zhì)上是通過優(yōu)化

發(fā)表于 07-01 16:13 ?1503次閱讀

基于深度學習的鳥類聲音識別系統(tǒng)

具體的軟硬件實現(xiàn)點擊http://mcu-ai.com/MCU-AI技術(shù)網(wǎng)頁_MCU-AI 鳥叫聲識別在鳥類保護中具有重要意義。通過適當?shù)?b class='flag-5'>聲音分類，研究可以自動預測該地區(qū)的生活質(zhì)量。如今，深度

發(fā)表于 05-30 20:30

深度解析深度學習下的語義SLAM

隨著深度學習技術(shù)的興起，計算機視覺的許多傳統(tǒng)領域都取得了突破性進展，例如目標的檢測、識別和分類等領域。近年來，研究人員開始在視覺SLAM算法中引入深度

發(fā)表于 04-23 17:18 ?1380次閱讀

那曲檬骨新材料有限公司

搜索歷史

借助深度學習算法實現(xiàn)5秒內(nèi)克隆你的聲音

評論