Un dífono representa el sonido que abarca desde la mitad de la realización de un fonema hasta la mitad de la realización del fonema siguiente. El propósito de esta unidad de sonido es incorporar a la unidad de síntesis la transición de sonido entre fonemas, hecho que había causado tanta dificultad en los sistemas iniciales. La síntesis consiste, entonces, en la concatenación de segmentos de señal en el tiempo, siendo los segmentos dífonos.