地球最強伴奏製造軟體-1 讓你的伴奏還能保留和聲的Ultimate Vocal Remover

地球最強伴奏製造軟體-1 讓你的伴奏還能保留和聲的Ultimate Vocal Remover

這次要來介紹的是一個比izotope rx更強的伴奏分離軟體Ultimate Vocal Remover,
後面的內容我會將其簡稱為uvr,這也是軟體在電腦裡啟動時所顯示的簡稱,
uvr是一款在github上開源的軟體,具有非常多豐富的算法和模型,
每個模型都是透過AI學習訓練出來的,因此它的未來非常值得期待,
針對不同的音樂,你可以嘗試使用不同的算法,達到最理想的分離目的,
並且uvr最讓我驚訝的是,它有一個卡拉ok模型,處理過後的音樂能夠保留音樂中的和聲,這是目前所有已知的分離軟體都做不到的壯舉,
但如果想要最完美的伴奏,還是得拋棄和聲,不過分離出的伴奏效果也是非常讓我驚訝的,
軟體也支援線上更新,在軟體、算法模型有更新時,你都能從軟體內直接進行更新,享受最新的技術成果,
ok! 開始前,你可以先聽聽我用uvr分離後的音樂效果!
目前uvr我也仍在探索中,現在你所聽到的,並非uvr能做到的極限!
p.s 目前最新版本為5.5,如果你使用的是最新版,此篇可能不是用,但仍可參考,
想閱讀新版本操作技巧可看這篇→
地球最強伴奏製造軟體-4 uvr大更新,5.5版新功能詳解

伴奏和人聲效果試聽

下載和必備工具

如若下載太慢,可以用idm下載工具來加速→
點我從gaga下載idm下載工具

安裝

  1. 打開下載好的.exe檔案,例如我寫這篇文章時的最新版是
    UVR_v5.4_setup.exe
  2. 第一步需要同意條款,可以直接按
    alt+a,接著找
    next
  3. 第二步需要找這個選項按空格勾選,這樣才能在桌面建立捷徑
    Create a &desktop shortcut核取方塊沒勾選
  4. 之後一路按next、install、finish即可安裝完成

讓uvr能調用更多的算法模型

預設情況下,uvr的安裝包只會有幾個比較精華的算法模型,
想用更多的模型,你需要將下載回來的擴展模型包解壓縮,並且將裡面的檔案貼到以下路徑→
C:\Users\Administrator\AppData\Local\Programs\Ultimate Vocal Remover\models\Main_Models
其中(administrator)是登入系統的帳戶名,你的有可能跟我不一樣。
如果你懶得找路徑,你也可以按
win+r
在裡面直接貼上這串路徑按enter也能打開資料夾→
C:\Users\%username%\AppData\Local\Programs\Ultimate Vocal Remover\models\Main_Models

uvr的軟體介面介紹

接下來你就可以打開uvr,在桌面上找到
Ultimate Vocal Remover
打開,並ocr識別視窗,你會看到這些內容→

  1. Select input
    點擊後會彈出一個對話框,從中選擇你要處理的檔案,可以多選
  2. Select output
    點擊後會彈出一個對話框,從中選擇你要儲存的資料夾位置
  3. O WAV
    O FLAC
    O MP3
    這三個是單選框,其中的O應該是單選框旁邊用來勾選的圈圈,
    點擊一個你想要用來儲存的格式
  4. MDX-Net
    這是用來選擇算法的地方,會因應你所選的算法而有所不同,預設就是使用MDX-Net,
    點擊後會有四個算法,分別是→
    VR Architecture
    MDX-Net
    Demucs v3
    Ensemble Mode
  5. Auto
    只有在選擇MDX-Net或Ensemble Mode算法時才會有這個選項,這是用來控制要使用多少電腦性能的選項,
    點擊後會彈出一個選單,按上下可以選擇,
    預設為auto,要榨乾電腦性能可以選Full,但容易因為性能不足而產生錯誤訊息,因此最高建議選90
  6. 512
    只有在選擇VR Architecture或Ensemble Mode算法時才會有這個選項,預設是512,
    點擊後會彈出一個選單,數值越低處理越慢,但效果越好,數值越大則反之
  7. UVR-MDX-NET 1
    這個是選擇算法下的各種模型,當你選擇不同的算法時,所看到的預設模型也是不同的,
    點擊後會彈出選單,有各種模型可選,
  8. Save Vocals Only
    處理後只儲存人聲,建議不要點擊,因為比較難確認選項是否被勾選
    Save Noisey Output
    處理後只儲存噪聲,建議不要點擊,因為比較難確認選項是否被勾選
    Save Instrumental Only
    處理後只儲存樂器的聲音,建議不要點擊,因為比較難確認選項是否被勾選
  9. Start Processing
    選項設置完成後,點擊這裡就會開始處理

爭渡讀屏在軟體內的操作提示

使用爭渡讀屏的用戶,你可以用小鍵盤4、6鍵來操作uvr的一些基礎功能,下面是提示→

  • 3客戶端
    選擇要處理的檔案
  • 9客戶端
    選擇要輸出的資料夾位置
  • 10、11、12客戶端
    分別是wav、flac和mp3格式
  • 17客戶端
    選擇算法
  • 18客戶端
    參數選單,會根據所選算法而有所不同
  • 19客戶端
    參數選單,會根據所選算法而有所不同
  • 25客戶端
    選擇模型
  • 28客戶端
    打開軟體的設定頁面
  • 29客戶端
    開始處理

四種算法

接下來,我來介紹四種算法的特性,每種算法都有一些獨立的選項,以及不同的模型,需要在選擇該算法後才會出現,
因此要記得選擇的是什麼算法,不然理解錯了可能處理後的效果會不如預期喔!

VR Architecture

這是最多模型的算法,它有一個獨有參數→
10
點擊後會彈出一個選單,這是調整人聲分離度的選項
數值越小能分離的越乾淨,但對伴奏的損傷會越大,數值越大則反之。
最常用的有這幾個→

  • 提取伴奏較為優異的模型→
    1_HP-UVR.pth
    2_HP-UVR.pth
  • 提取人聲較為優異的模型→
    3_HP-Vocal-UVR.pth
    4_HP-Vocal-UVR.pth
  • 最受歡迎的卡拉ok模型,可以消除人聲只保留和聲→
    5_HP-Karaoke-UVR.pth勾選
    6_HP-Karaoke-UVR.pth
  • 後續還有好幾個模型,粗略測試後發現16模型處理的較好,
    但因為曲風、配器不同,你可以多多嘗試各種模型,找到效果最好的模型

MDX-Net

這個算法可能會消耗大量的電腦資源,
這是uvr5才推出的新算法,
它也有卡拉ok模型,名稱為
UVR-MDX-NET Karaoke

Demucs v3

這個算法可以把音樂分成四個部分,鼓、bass、人聲和其他,分離效果也極佳,
它有幾個獨有的參數

  • All Stems
    這是選擇要分離哪些部分,預設是All Stems,也就是分離成四個部分,
    點擊後,選單裡還有這些可以選→
    Vocals
    Other
    Bass
    Drums
  • 2
    這是調整精度的選項,預設為2,
    點擊後可以調整數值,數值越大效果越好、所需時間也越長,
  • 0.25
    同樣是控制精度的參數,點擊後一樣會彈出選單,
    數值越大精度越高,但處理耗時越長,數值越小則反之

Ensemble Mode

這是組合算法,可以組合VR Architecture和MDX-Net兩種算法的結果,並自動將兩者的結果組合起來,
在選擇這個算法時,只有四個模型,分別是

  • Multi-AI Ensemble
    組合兩種算法,得出最好的結果
  • Basic VR Ensemble
    組合VR Architecture算法的各種模型,得出最好的結果
  • Basic MD Ensemble
    組合MDX-Net算法的各種模型,得出最好的結果
  • Manual Ensemble
    這個模型需要兩個文件,效果仍在探索測試中

開始處理

設定好了相關的選項後,你就能點uvr畫面中的
Start Processing
之後,如果你有安裝查看cpu使用率的nvda附加元件,你會發現cpu占用率會明顯提升,
你也可以在重新識別一下uvr的視窗,在視窗底部會有類似這樣的內容:
File 1/1 Loading the stft of audio source ... Done!
File 1/1 Please Wait ...
File 1/1 Running Inference ...
File 1/1 Processing 351 Slices ... Done!
在處理完成後,最後一行會有處理得耗時統計,像這樣:
Time Elapsed: 00:09:35
這樣你就可以去你設定的儲存路徑,聽聽看處理好的檔案囉!

對於中低配電腦的建議

如果你所使用的電腦硬體配置比較一般,下面是給你的一點建議→

  • 如果你的硬體配置比較低,想製作含和聲的伴奏,你可以用
    MDX-Net
    算法裡面的
    UVR-MDX-NET Karaoke
    模型,並且在OCR的識別結果中找到
    Auto
    這也是預設值,如果電腦性能還是不足可以嘗試調成50以下的數值
  • 如果你的電腦硬體配置尚可,那可以使用
    VR Architecture
    算法中的
    5_HP-Karaoke-UVR.pth
    或是
    6_HP-Karaoke-UVR.pth
    模型
    如果享有更好的效果可以找到512,選擇320,但處理時間會更長

落寞工具箱路標

這是我用落寞工具箱作的路標,你可以導入到你的落寞工具箱中使用,
目前路標已經製作完成,大部分的界面都有路標可以使用。
p.s 如果無法準確地點開選單,請檢察系統的縮放比例,調整成100%

  1. 下載路標
    點我下載路標
  2. 打開落寞工具箱的選單找
    管理路標
    按enter
  3. 在打開的視窗中直接按快顯鍵,也就是大鍵盤上的右鍵,選擇
    導入
    按enter
  4. 找到剛下載的路標enter,就能導入成功了
  5. 記得去落寞工具箱選單的設置熱鍵,設定自己喜歡的快速鍵,
    例如我會把切換路標設定成
    shift+win+alt+左或右
    切換路標方案設定成
    shift+win+alt+上或下
    設定複雜一點的熱鍵,會比較不會跟其他軟體衝突

更新

使用我做的路標,可以點開軟體設定→檢查更新,來更新軟體,
如果有更新,在更新前還會有一個詢問你是否更新的選項,
你需要ocr,點yes才能開始下載更新。
p.s 中國用戶有可能無法在軟體裡直接線上更新

補充

因為設定選項特別的多,我會在之後整理uvr的更多進階操作和說明,寫成進階版的uvr操作文章,
當然,你也可以用自己的方式來探索這個好軟體,
例如用OCR,搭配NVDA的NVDA鍵+4或6,以及模擬滑鼠來操作軟體,
另外,uvr可以多開,當你發現設定跑掉調整不回來時,
你可以打開第二個uvr,此時第二個uvr的設定都是預設的狀態,
你可以先關閉第一個uvr,在第二個uvr上操作,之後關閉後就會保存第二個uvr所做的設定囉!