Groupe Audio Acoustique

Wiki du groupe de recherche en audio et acoustique du LIMSI

Outils pour utilisateurs

Outils du site


projets:pade:start

Projet ANR PADE

Le projet PADE – pour Prosodie, Accents, Dialectes, Expressivité – est un projet scientifique soutenu par le programme JCJC de l'Agence Nationale de la Recherche (ANR) au titre de la programmation 2010.

Logo ANR

Ce projet, prévu pour une durée de quatre ans, a duré de janvier 2011 à décembre 2014.


Résumé scientifique

Ce projet se propose, dans le cadre de la description de la variabilité prosodique, d'évaluer un ensemble de mesures de distances prosodiques destinées à la comparaison d’énoncés. La variabilité prosodique est comprise dans une approche fonctionnelle incluant les réalisations linguistiques (segmentation, variations diatopiques) autant que les caractéristiques paralinguistiques (stylistique, accents régionaux et étrangers). En outre, l’importante variabilité liée aux transferts prosodiques que peuvent induire des contacts entre langue maternelle et seconde, ou la cohabitation entre langues standard et variétés régionales, voir encore la variabilité interculturelle liée aux affects sociaux doit aussi être envisagée. Ces distances devront être à même de rendre compte de situations et de contraintes très diverses. Mais parce qu’il s’agit d’un seul et même objet, médiatisé dans le même matériau acoustique voir multimodal, une approche holistique de la question peut permettre une meilleure compréhension de cette variation.

L’évaluation perceptive de ces distances sera un point crucial et un garant de leur utilité. Pour cela, les paradigmes d’évaluation devront être affinés afin de correspondre au mieux aux tâches perceptives. Il sera aussi important de confronter les résultats de ces distances aux descriptions de la littérature. Ainsi les modèles prosodiques, largement documentés, serviront de référence objective à la pertinence des mesures. D’une autre manière, les atlas dialectaux existants pourront fournir une référence en terme de proximité inter-dialectale. Il faudra faire progresser les méthodes d’analyse des paramètres physiques de la prosodie afin de disposer de données fiables. En effet, ce préalable à toute stylisation de la variation prosodique connaît encore de nombreux défauts. Mis à part l’extraction de la fréquence fondamentale et de l’intensité, les paramètres prosodiques, et en particulier la qualité de voix, posent tous des difficultés spécifiques. Des travaux menés au laboratoire devraient permettre l’extraction d’un certain nombre de paramètres à prendre en compte dans les distances prosodiques puis à valider grâce à une procédure de synthèse et d’évaluation perceptive comparée. Un autre défi sera posé par l’intégration de paramètres multimodaux à des distances prosodiques : la variabilité des dynamiques et des échelles de mesures de ces paramètres, ainsi que leur relative importance perceptive et leur temporalité devront pouvoir être prises en compte pour obtenir des résultats convaincants. L’utilisation de méthodes d’apprentissage automatique permettrait de pondérer l’importance des caractéristiques et de donner à cette approche holistique toute sa raison d’être.

Les principales avancées scientifiques attendues tournent autour de ces mesures étalonnées. En particulier pour la modélisation prosodique, ce projet devrait permettre la mise en place d’atlas dialectaux prosodiques ; une meilleure description de l’évolution diachronique des styles ; une description acoustique et multimodale des affects sociaux dans leur temporalité. Au delà des retombées de ces mesures, nous nous proposons de mieux décrire les paramètres acoustiques de la qualité de voix, ce qui constitue l’une des principales difficultés à la compréhension des affects. Enfin, il s’agira de décrire les rapports entre modalités audio et vidéo pour l’expressivité prosodique. Une meilleure description des cooccurrences intermodales ainsi que des liens entre variations prosodiques et structure linguistique des énoncés pourrait faire avancer la compréhension de la différence entre attitudes et émotions.

La réalisation de ce projet demande de répondre à des questions fondamentales. La première d’entre elles concerne les distances prosodiques : il faudra formaliser, sur la base de méthodes reconnues, la prise en compte d’informations de différentes granularités temporelles, natures mathématiques et dans les modalités audio et vidéo.

Partenaires


projets/pade/start.txt · Dernière modification: 2015/12/11 11:13 par Laurent Pointal