Diferencia entre revisiones de «Síntesis de habla»

Contenido eliminado Contenido añadido
m Revertidos los cambios de 190.22.224.155 (disc.) a la última edición de 190.158.6.164
Línea 43:
 
==== Síntesis de difonos ====
La síntesis de difonos usa una base de datos mínima conteniendo todos los [[difono]]s que pueden aparecer en un lenguaje dado. El número de difonos depende de la [[fonotáctica]] del lenguaje: el español tiene unos 800 difonos, el alemán unos 2500. En la síntesis de difonos, la base de datos contiene un sólo ejemplo de cada difono. En tiempo de ejecución, la [[prosodia]] de una oración se sobreimpone a estas unidades mínimas mediante procesamiento digital de señales, como [[codificación lineal predictiva]], [[PSOLA]] o [[MBROLA]].[[loquendo]]
 
La calidad del habla resultante es generalmente peor que la obtenida mediante selección de unidades pero más natural que la obtenida mediante sintetización de formantes. La síntesis difonos adolece de los defectos de la síntesis concatenativa y suena robótica como la síntesis de formantes, y tiene pocas ventajas respecto a estas técnicas aparte del pequeño tamaño de la base de datos, así que su uso en aplicaciones comerciales experimenta un declive, aunque continúa usándose en investigación porque hay unas cuantas implementaciones libres.