Rehber RVC AI kullanımı

Selam. Konuyu uzatmadan başlayacağım öncelikle bize lazım olan şeyler.
Dipnot: Sitenin güvenilirliği hakkımda bilgim yoktur fakat yapacak olanların yeni hesap açıp öyle yapmalarını öneririm.

Colab linki: Google Colaboratory

Gerekenler:

5-10 dakika arasında temiz ses örneği (isterseniz daha fazla yapabilirsiniz). WAV olarak kaydetmeyi unutmayın (içinde Ö, J, I, ç gibi harfleri bulunduran cümleleri kurmanız daha iyi olacaktır)

Bir şarkının vokalini birçok siteden veya program ile ayırabilirsiniz.

Adım 1
Attığım linkteki colabı açın ve ilk hücreyi başlatın indirmeler bittikten sonra public URL: "burada bir link olur" o linke tıklayarak giriş yapıyoruz.

publicurl.png


Adım 2: GUI kısmına giriş
Linke tıkladıktan sonra karşımıza şöyle bir ekran geliyor ve kırmızı kutucukla işaretlediğim "train" kısmına geçiyoruz.

gui2.png


Colab ekranına geri dönüp -evc- klasörünün içine "dataset" isminde bir klasör açıp içine ses kaydımızı atıyoruz kaydı attıktan sonra train kısmına dönüyoruz.

Adım 3: Modeli trainlemek
Train kısmında ilk olarak "process the dataset" butonuna basıyoruz ve işlem bittiğinde onun altındaki kutucukta endpreprocess yazıcaktır ( işlem bittiğinde 3. satırda endpreprocess yazmalıdır eğer daha uzunsa hata gelmiştir)

gui3.png


Yeşil yer endpreprocess in yazacağı yerdir.
Endpreprocessden sonra 2. buton yani "pitch Extraction'a basıcağız onun altındaki boşlukta all-feature-done yazısını gördüğümüzde 2. işlemde bitmiş demektir.
Geldik trainlemenin son kısımlarına 3. buton "train model"butonuna basmadan önce onun üstündeki epoch kısmını 200'e çekiyoruz (200 genelde en iyi sonucu verir fazla yaparsanız bozulabilir)
Train modele bastığınızda Colab'e geri dönün ve epoch işlemlerinin başladığını göreceksiniz belirlediğiniz epoch'a göre uzun sürer bittiğinde colabde şöyle bir yazı yazar.

gui4.png


Bu da tamamlandığına göre 4. buton yani "train ındex" butonuna basabiliriz bu çok kısa sürecektir bittiğinde şunun gibi bir yazı çıkar.

gui5.png


İsteğe bağlı kısım: eğer siz modelinizi kaydetmek istiyorsanız 5. butona yani "download model" butonuna tıkladıktan sonra.

istek.png


Buna benzer 2 dosya çıkar bu iki dosyayı sağdan "download" tuşuna basıp indiriyoruz ve yeniden kullanmak istiyorsak bu iki dosyayı ZIP haline getirip Google Drive'a yüklüyoruz ve linki kopyalıyoruz.
Ardından GUI ekranından "download model" sekmesine geliyoruz.

istek2.png


En baştaki yere ZIP dosyasının Drive linki 2. kısma koymak istediğiniz isim sonra download tuşuna basıyoruz ve modellerimize gelmiş olacak.

Final
Colab'e dönüp -evc- klasörünün içindeki "audios" klasörünün içine istediğiniz şarkının vokalini atıyoruz ve GUI ekranına geri dönüyoruz.
GUI'daki "ınference" sekmesine gelip "choose your model" yazısının sağındaki "Refresh" butonuna tıklıyoruz yenileme bittikten sonra "choose your modeli" yazısının biraz sağındaki çentiğe tıklayıp oradan sizin ismini belirlediğiniz modelin "modelinismi. Pth" olan halini seçiyorsunuz.

pth.png


Ardından "choose your Audio" yazısının sağındaki Refresh butonuna tıklıyoruz ardından görseldeki çentiğe tıklayıp.

1689194075621.png


Audios klasörüne attığımız şarkının vokalini seçiyoruz.
Son olarak sağ üstten converte tıklamadan önce bir bilgi vereyim eğer kadın senini erkeğe çevirecekseniz convertin solunda kalan 0'ı -12 yapın eğer erkek sesini kadına çevirecekseniz 12 yapın veya erkek sesini erkeğe kadın sesini kadın sesine çevirecekseniz 0 yapın.
Dediğim gibi sağ üstteki "convert" butonuna tıklıyoruz ve bekliyoruz.

1689194225407.png


İşlem bittiğinde Convert'in altında sesimizin oluştuğunu göreceğiz onu sağ üç noktaya tıklayıp indirebilirsiniz.

?hash=85859bce05190f26031c10c73cd6d7de.png


Evet bitti sorunlarınızı yazabilirsiniz çok kötü anlatmış olabilirim kusura bakmayın.

Başlıkta rcv olarak çıkmış ama RVC olacak :D
 

Dosya Ekleri

  • ses.png
    ses.png
    32,1 KB · Görüntüleme: 316
  • 1689194352987.png
    1689194352987.png
    57 KB · Görüntüleme: 251
  • ses.png
    ses.png
    32,1 KB · Görüntüleme: 554
Son düzenleme:
Hocam 10000 yapsak daha iyi sonuca ulaşır mıyız? Ben son derece gerçekçi bir yapay zeka yorumu yapmak istiyorum. Beklemekse konu beklerim ama sonuca değer mi? @shad0ww

O kadarına değmez bence Max 1500 yap onda da ses örneğin 30+ dakika üstüyse falan eğer o kadar uzun değilse 500 veya 1000 yap önerim 500.
 
2. aşamada hata alıyorum gata şu şekilde
['extract_f0_print.py', '/content/-EVC-/logs/My-Voice', '2', 'mangio-crepe', '128']
no-f0-todo
no-f0-todo
['extract_feature_print.py', 'cuda:0', '1', '0', '0', '/content/-EVC-/logs/My-Voice', 'v2']
/content/-EVC-/logs/My-Voice
load model(s) from hubert_base.pt
Error: Extracting is shut down because hubert_base.pt does not exist, you may download it from lj1995/VoiceConversionWebUI at main
 
2. aşamada hata alıyorum gata şu şekilde
['extract_f0_print.py', '/content/-EVC-/logs/My-Voice', '2', 'mangio-crepe', '128']
no-f0-todo
no-f0-todo
['extract_feature_print.py', 'cuda:0', '1', '0', '0', '/content/-EVC-/logs/My-Voice', 'v2']
/content/-EVC-/logs/My-Voice
load model(s) from hubert_base.pt
Error: Extracting is shut down because hubert_base.pt does not exist, you may download it from lj1995/VoiceConversionWebUI at main
Bende de var bunu yükleyip bir dosya dizisinin içine atmalıyız ama hangi dizi bilmiyorum bulursan yazar mısın
 
1. aşamayı tamamlamamışsınız sanırım. 10 dakikadan fazla seslerde endpreprocess yazsa bile 2. kısımda bu hatayı veriyor. En azından benim denemelerimde bu şekilde oldu.
evet sabahleyin denediğimde daha kısa yazılardan sonra bitti dedi ama dün upuzun bir metin vardı sonra bitti diyordu şuan düzgün bende hiç ellemedimde
 
Epoch kısmını kendi sesimde 200 olarak kullandım güzel oldu daha fazla yapsam sıfır kusur mu olur acaba?

İsterseniz 300-350 epoch ile de deneyebilirsiniz.

2. aşamada hata alıyorum gata şu şekilde.
['extract_f0_print.py', '/content/-EVC-/logs/My-Voice', '2', 'mangio-crepe', '128']
NO-F0-todo
NO-F0-todo
['extract_feature_print.py', 'cuda:0', '1', '0', '0', '/content/-EVC-/logs/My-Voice', 'v2']
/content/-EVC-/logs/My-Voice
Load model(s) from hubert_base. Pt.
Error: Extracting is shut down because hubert_base. Pt does not exist, you may download it from lj1995/VoiceConversionWebUI at main

Dün bende bu hatayı aldım 27 dakikalık bir ses örneğinde fakat @fotinix açıklamış durumu yeni colablara bakıyorum eğer daha iyi bir colab bulursam rehberini yapacağım.
 
Hocam sesi kaydediyoruz derken kendi sesimizi kaydetip değil mi koyacağız yoksa bir şarkının vokalini veya ses modelini mi koyacağız.
 

Yeni konular

Geri
Yukarı