Supprimer le silence des files audio tout en laissant des lacunes

Actuellement, nous utilisons cette command dans un script shell pour supprimer le silence des files audio:

ffmpeg -i $INFILE -af silenceremove=0:0:0:-1:1:${NOISE_TOLERANCE}dB -ac 1 $SILENCED_FILE -y 

Cela fonctionne bien, sauf qu'il supprime tout le silence, ce qui provoque l'audio rest coincé set.

Comment cela peut-il être fait en laissant deux ou trois secondes entre chaque morceau de son?

La solution doit être très efficace car nous allons traiter beaucoup d'audio et utiliser un outil qui peut être installé assez facilement sur Linux et OSX, comme ffmpeg ou sox.

Le meilleur moyen que j'ai vu est d'append le drapeau -l au silence comme suit:

 sox in.wav out6.wav silence -l 1 0.1 1% -1 2.0 1% 

J'ai copié cette command de l'exemple 6 de ce blog très utile appelé The Sox of Silence