Veamos más ejemplos:
Actuando de forma automática el resultado es:
Se pueden ver los mismos errores que en el primer caso, así que ajustamos el tempo aumentamos el tamaño del segmento a 1000 muestras y el avance a 500.
Se puede apreciar una clara mejoría, con la sola modificación de estos parámetros.
Si modificamos el algoritmo de detección de pitch el resultado es:
que es un poco mejor que la anterior
y, por último, los basados en parámetros temporales:
Otro archivo con el mismo tipo de sonido: