Résumé : Au cours des dix dernières années, l'émergence des approches en apprentissage profond ainsi que les modèles pré-entraînés (e.g. Wav2Vec 2.0, Whisper) ont permis d'atteindre des performances impressionnantes sur une variété de tâches. Néanmoins, les méthodes basées sur la théorie linguistique restent pertinentes, notamment pour leur explicabilité. Cet atelier proposera un aperçu des outils disponibles pour les tâches de traitement de la parole, ainsi qu'une introduction à leur utilisation.
L'atelier débutera avec une brève introduction sur le traitement du son. Ensuite nous analyserons un ensemble de données audios en commençant par des analyses prosodiques avec les outils Praat et Prosogram. Enfin, nous utiliserons ces mêmes données pour explorer des modèles pré-entraînés en accès libre (Wav2Vec et Whisper), afin de comprendre leur fonctionnement et d'évaluer leurs performances.
Public concerné : Débutants en traitement de la parole avec des connaissances en TAL
Pré-requis : ordinateur portable, connexion internet, Praat installé, scripts Prosogram téléchargés, accès Google Colab