Neuerscheinungen 2013Stand: 2020-01-07 |
Schnellsuche
ISBN/Stichwort/Autor
|
Herderstraße 10 10625 Berlin Tel.: 030 315 714 16 Fax 030 315 714 14 info@buchspektrum.de |
Larbi Mesbahi
Transformation automatique de la parole
Etude des transformations acoustiques
2013. 180 S. 220 mm
Verlag/Jahr: PRESSES ACADÉMIQUES FRANCOPHONES 2013
ISBN: 3-8416-2669-6 (3841626696)
Neue ISBN: 978-3-8416-2669-1 (9783841626691)
Preis und Lieferzeit: Bitte klicken
Le travail effectué s insère dans le cadre de la conversion automatique de la voix. La problématique est de modifier le signal d un énoncé pour qu il soit per‡u comme prononcé par une autre personne. Parmi les applications, on peut noter : l apprentissage des langues étrangères, le contrôle biométrique, la correction des voix pathologiques et le divertissement. Plusieurs techniques sont utilisées tels que les HMMs (Hidden Markov Model), les réseaux de neurones ou les GMMs (Gaussian Mixture Model). Un aspect de ce travail explore différentes stratégies d apprentissage des fonctions de conversion. La première piste suivie est la réduction du nombre des paramètres libres de la fonction de conversion par GMM. La deuxième propose une alternative aux fonctions de conversion linéaires basées sur les GMMs en recourant aux modèles de transformation non-linéaire à base de réseaux de neurones (RBF, Radial Basis Functions). Une partie du travail est consacrée à l´alignement des données utilisées pour apprendre les modèles de voix et les transformations. En dernier, la prise en compte de l aspect phonétique s avère une solution efficace pour l amélioration des systèmes de conversion de voix.