Participant : A. Roebel
-
Le modèle « shape invariant » permet le traitement des signaux de parole mono-locuteur. Il a été intégré dans le logiciel SuperVP qui est le vocodeur de phase de l'équipe. Une implémentation en Matlab l'année précédente à montré que l’implémentation dans SuperVP, qui est destinée a être utilisée dans AudioSculpt, nécessitait une amélioration du traitement des zones temps-fréquence non-voisées (voir paragraphe « classification des composantes spectrales » ci-dessus). En comparant les résultats de transformation obtenus avec le modèle « shape invariant » dans le vocodeur de phase et notre implémentation de l'algorithme PSOLA nous avons remarqué que l'algorithme « shape invariant » nous permet d'appliquer des changements plus importants sans que la qualité du résultat soit fortement dégradée. Le plus grande problème pour le modèle « shape invariant » est la transposition vers le bas. Dans cette situation il peut arriver qu’une partie importante de la zone non voisée du son original soit placée dans un zone qui devrait être voisée En conséquence, le résultat sonne trop bruité. Plusieurs pistes d'amélioration sont actuellement en étude.
Ces nouvelles possibilités du traitement de la voix ont été utilisées notamment dans le projet « Talkapillar » et un projet avec le compositeur Joshua Fineberg qui cherchait, pour une composition, à créer plusieurs voix avec des caractéristiques différentes a partir de la voix d'un seul acteur. Pour cette applications, les possibilités de gérer et de mélanger plusieurs enveloppe spectrales ont été largement améliorées.
Dostları ilə paylaş: |