呜呜呜呜呜呜呜呜呜呜呜八六呜呜呜呜呜呜呜呜呜呜
听他们说vits的效果比Tacotron2差远了
Tacotron2+HiFiGAN
目前八六的语音只能做到:
示例:こんにちわ。
Hachiroku_Tips:
Hachiroku_Normal:
Hachiroku_H:
是不是感觉还可以?我也感觉还可以,直到句子长一点点或者说不是日语的语言就完全不行了……(我听不下去了全删了所以没示例了:))
voice to voice更是重量级。要一个source speaker的模型转换成output speaker的模型的语音,也就是说,要先用你想要的语音训练一个source speaker,才能转换成你想要的语音:(
而且,关键是听多了ai才感觉还行,一听原配……
感觉就是糟蹋了八六呜。
看看Tacotron2能不能搞吧……现在已经不抱什么希望了。
泪目
VITS真香,嘿。