上期达芬奇同大家分享了几个在线文字转语音的网站,今天达芬奇同大家分享一个免费的线下文字转语音开源软件eSpeak,eSpeak是一款小巧的文字语音同步转换软件(大小仅2.5Mb),如图,eSpeak的下载页,虽然软件小巧但是针对Linux,Mac和windows系统均有不同的软件版本,在此选择Windows系统版本下载:
(下载地址:https://wwc.lanzouw.com/i6U6W0dkz2vc,密码:6y8a)。下面跟达芬奇一起探索吧。
第一步:下载完成后,双击exe文件(达芬奇的版本是:setup_espeak-1.48.04.exe)进行安装,安装过程中,系统会自动检测到系统语言,并进行相应语言的安装,如下图所示,达芬奇系统为汉语系统,软件会自动选择zh(中文),zh f2(中文女声),en(英文,如果不需要也可以删除,建议带上)三种语音文件进行安装。
第二步:安装完成后,点击“开始”windows图标,最近添加里有“TTSApp”软件,对,这个软件就是安装的eSpeak(达芬奇也没搞懂,为何名字还设置不一样呢),点击打开后,就可看到下下图的界面。
第三步:根据下图所示的顺序依次操作:输入要转化语音的文本》选择中文语音(此处选择espeak-ZH)》可视情调整语速(rate)和音量大小(volume)及录音频率和位深》开始语音播放(speak)》保存为wav格式文件(save to wav)。经过以上步骤就可以开始语音朗读,并将语音保存为文件供我们后期使用啦。
第四步:如果你进行了以上步骤,就会发现我们的中文语音听起来有很强的机器声,和自然声差别很大,听着很别扭,所以,eSpeak特地为我们准备有附属的中文普通话及粤语语音包供我们下载使用。下载地址:https://wwc.lanzouw.com/iuOQ40dkz2zg,密码:5g8i
下载完成后,解压文件zh_listx文件,然后将此文件移动到第一步中eSpeak所安装的文件夹下的dictsource文件夹中,然后再次重启TTSAPP,此时就会发现在voice选择中多出一个espeak-ZH_Listx选择项,我们再次试听下,是不是发现这时语音听起来更自然呢?
第五步:你以为就这样完了嘛?不,我们要精益求精,经过第四步后,我们觉得上面的语音已经接近自然声,但是还是不太满意,这时我们就要祭出微软的大杀器了,微软系统的SPAI5包含了广泛的语音库,且声音更自然更流畅,我们是否可以用微软的语音库呢?答案当然是肯定的,达芬奇下期将为大家仔细讲解如何利用微软系统自带的强大语音库。
今天的达芬奇分享就到这里啦,大家有任何疑问都可在下方留言,达芬奇会尽可能为每个疑问者解答。如果对你有帮助也请多多转发分享,让更多人看到,帮助更多人 !
,