L’analyse de la parole - De la prosodie à l'analyse à base de modèles pré-entraînés

Résumé : Au cours des dix dernières années, l'émergence des approches en apprentissage profond ainsi que les modèles pré-entraînés (e.g. Wav2Vec 2.0, Whisper) ont permis d'atteindre des performances impressionnantes sur une variété de tâches. Néanmoins, les méthodes basées sur la théorie linguistique restent pertinentes, notamment pour leur explicabilité. Cet atelier proposera un aperçu des outils disponibles pour les tâches de traitement de la parole, ainsi qu'une introduction à leur utilisation.

L'atelier débutera avec une brève introduction sur le traitement du son. Ensuite nous analyserons un ensemble de données audios en commençant par des analyses prosodiques avec les outils Praat et Prosogram. Enfin, nous utiliserons ces mêmes données pour explorer des modèles pré-entraînés en accès libre (Wav2Vec et Whisper), afin de comprendre leur fonctionnement et d'évaluer leurs performances.

Public concerné : Débutants en traitement de la parole avec des connaissances en TAL

Pré-requis : ordinateur portable, connexion internet, Praat installé, scripts Prosogram téléchargés, accès Google Colab

Début

jeu 07/11/2024 - 14:00

Fin

jeu 07/11/2024 - 18:00

Lieu

Campus Pierre et Marie Curie - SCAI Seminar Room

S'inscire

Formation assurée par

ObTIC - Observatoire des textes, des idées et des corpus

Les ateliers numériques de l'ObTIC