sábado, 26 de diciembre de 2015

Pasar texto a voz

Pasar un texto a una voz mas o menos humana...por ejemplo para crear un archivo de audio que podamos añadir a un videotutorial creado por nosotros mismos, se puede hacer de varias formas, bien de forma on line, sin instalar nada, o bien instalando algún tipo de software.

Instalando software:
En la página http://www.comunidadbloggers.com/2013/0 ... uendo.html nos indican cinco programas: eSpeak, Gespeaker, KMouth , Festival y Fala
De estos programas el que he instalado ha sido gespeaker, con varias voces en español con mbrola.

Gespeaker:
1- Instalar desde Synaptic los paquetes gespeaker, mbrola, mbrola-es1 y mbrola-es2

2- Gespeaker si bien detecta que hay un mbrola instalado y tiene la dirección  de la carpeta que contiene los lenguajes instalados, no me habilita la lista de lenguajes para elegir, para solucionarlo:
Ejecutar en la terminal el comando:
sudo ln -s /usr/lib/<architecture>-linux-gnu/espeak-data /usr/share/espeak-data
en mi caso:
sudo ln -s /usr/lib/x86_64-linux-gnu/espeak-data /usr/share/espeak-data
Tras lo cual ya me aparece en gestreamer los idiomas y variantes que he instalado previamente.


Podemos comprobar que el texto se emite con la voz, tono, volumen, velocidad y retraso que queremos y luego grabarla en el disco duro en formato .wav para poder ser usado posteriormente.
Pero sintetiza la voz de forma demasiado robótica por lo menos en español, así mismo no cuenta con la capacidad de realizar diálogos o hacer expresiones
 --------------------
Text to speech Applet:
Desde http://cinnamon-spices.linuxmint.com/applets/view/242  podemos instalar un applet que nos lee el texto de lo último que hayamos copiado en el portapapeles. Por defecto el comando que usa es: espeak -ven+m5 -a 100 -p 50 -s 175  con lo que se lee el texto en inglés, si se quiere que la voz lo haga en español, se cambia -ven por -ves , y también podemos modificar la velocidad de lectura para que lo haga a una velocidad algo menor, yo lo he puesto a 160 palabras por minuto: -s 160 .Para mas detalles, ver el resultado del comando man espeak ejecutado en la terminal
El sonido reproducido por este applet puede ser grabado en el disco duro por otro applet de Cinnamon (http://hatteras-blog.blogspot.com.es/2013/02/cinnamon-grabar-el-escritorio-de-forma.html )

 -------------------------------------------
Sin instalar ningún software:
Como cosa curiosa he encontrado estas dos páginas web a través de las cuales podemos acceder a programas en modo de prueba, pero que lamentablemente no podemos instalar en nuestro sistema favorito

Oddcast:
En  http://www.taringa.net/posts/info/16541 ... -nada.html
explican como conseguirlo a través de una dirección en la web:
http://www.oddcast.com/home/demos/tts/t ... 46875813-0
que nos abre una imagen similar a la siguiente, en la que podemos elegir el personaje e idioma con el que se dirá el texto que escribamos.


La página nos permite oir el texto, pero no nos permite guardar el audio creado en el disco duro del pc; eso tendremos que hacerlo nosotros a mano, por ejemplo con el programa Audio-Recorder.

Es solamente un prueba para enterarse del funcionamiento de su aplicación, demás sería decir que como tal es muy limitada, en cuyas limitaciones las más importante esta la capacidad de caracteres que se podría introducir, unos 180, inservible para hacer un conversación de varias páginas, tampoco hay una forma de exportar en audio para su conversión o edición.

----------------------
Otra posibilidad es usar Loquendo on line: http://www.sodels.com/loquendo.htm
Pruebe a escuchar cualquier texto (máximo 500 caracteres) con las voces de Loquendo. Elija de la lista de idiomas y voces Loquendo, escriba un texto en el idioma seleccionado y pinche en el botón "Play". Escuchará el texto con una música de fondo para evitar uso ilegal de los audios generados, esta música no se oye al comprar la licencia Loquendo TTS.



Esta página sólo es una demostración de voces de Loquendo online. Los audios de Loquendo generados ( en formato .wav al hacer click en el botón Play ) no dan derecho a uso comercial. La distribución y publicación de audios requiere de una licencia. Al igual que la anterior Oddcast no sirve sirve para realizar un trabajo más completo y encima aquí a pesar de exportar el texto en formato wav , se incluye de fondo un sonido de la empresa.



No hay comentarios:

Publicar un comentario en la entrada

A la vez que haces un comentario, por favor da una puntuación al tema: malo, normal, bueno o muy bueno.
Gracias.