Te contesto a la entrada anterior con una nueva entrada, ya que las respuestas en el blog no permiten el uso de herramientas de edición.
Las presentaciones animadas que conjugan texto, imágenes y voz suelen ser muy efectivas; esa conjugación permite enfatizar más los conceptos que un fondo sonoro exclusivamente musical.
En tu caso particular, al tratarse de un fondo sonoro musical salpicado por conceptos, yo lo haría así:
Elaboro la presentación en Powtoon Anoto los instantes de la timeline general en los que surgen los conceptos clave. Grabo un audio en Audacity con una pista musical suave y otra con dichos conceptos en los instantes marcados para cada uno. (En Preferencias/Grabación , desactivo Reproducción a través del software, escuchar mientras se está grabando ..., voy grabando pista a pista cada expresión y, al final, las corto una a una y las pego en el momento exacto). Sin embargo, lo más común será la mezcla con un fondo sonoro que incluya una narración completa a lo largo del vídeo. En este caso haría lo siguiente:
Grabo en Audacity la narración completa (añado, si quiero, una pista musical de fondo suave). Anoto los momentos en los que debe aparecer cada elementos gráfico. Realizo el vídeo incorporándolos uno a uno según la línea del tiempo. En ambos casos, finalmente, sustituyo el audio que por defecto me ofrece Powtoon por el mp3 creado con Audacity .
Intento explicarlo en este vídeo:
VIDEO