Hostname: page-component-89b8bd64d-x2lbr Total loading time: 0 Render date: 2026-05-08T20:35:20.258Z Has data issue: false hasContentIssue false

L’apport des données participatives pour l’étude linguistique des français du monde : le cas de l’opposition /a∼ɑ/

Published online by Cambridge University Press:  24 August 2023

Mathilde Hutin*
Affiliation:
F.R.S.-FNRS, Université Catholique de Louvain, Louvain-la-Neuve, Belgique
Marc Allassonnière-Tang*
Affiliation:
CNRS, MNHN, EA (UMR 7206), Paris, France
Rights & Permissions [Opens in a new window]

Résumé

Le français est une langue parlée par plusieurs centaines de millions de locuteurs en Europe, en Afrique et en Amérique. Une telle dispersion favorise la variation, mais de grands corpus unifiés permettant de rendre compte de cette variation à l’échelle mondiale restent rares, et dans tous les cas nécessitent des efforts financiers et humains non négligeables, à l’instar du projet de Phonologie du Français Contemporain. Dans cet article, nous présentons une alternative possible : les données participatives. Pour ce faire, nous présentons Lingua Libre, la médiathèque linguistique participative de Wikimédia France, et l’utilisons pour décrire la variation sur une opposition phonémique entre deux voyelles ouvertes, /a/ et /ɑ/, dans de nombreuses variétés de français. Les données de 38 locuteurs provenant de 26 points d’enquête sont traitées automatiquement et comparées aux mesures présentées dans la littérature passée. Les résultats montrent que la plateforme a le potentiel de donner des résultats conformes à ceux des études de terrain professionnelles. L’article conclut sur les avantages et les limites de la plateforme, tout en proposant des pistes d’amélioration.

Abstract

ABSTRACT

French is a language spoken by hundreds of millions of speakers in Europe, Africa, and America. Such widespread use favours variation, yet large homogeneous corpora allowing to account for this variation worldwide are scarce and would in any case necessitate non-negligeable financial and human resources, as did for instance the project Phonologie du Français Contemporain. In this study, we present a possible alternative – crowdsourcing. We introduce Lingua Libre, Wikimedia’s open linguistic library, and use it to describe the variation of a phonemic opposition between two low vowels, /a/ and /ɑ/, in several varieties of French. The recordings of 38 speakers from 26 survey points are processed automatically and compared to values from past research. Results show that the platform has the potential to provide results mostly congruent with those of professional field recordings. The study concludes on the advantages and limitations of the platform and proposes suggestions for its improvement.

Information

Type
Research Note
Creative Commons
Creative Common License - CCCreative Common License - BY
This is an Open Access article, distributed under the terms of the Creative Commons Attribution licence (http://creativecommons.org/licenses/by/4.0/), which permits unrestricted re-use, distribution and reproduction, provided the original article is properly cited.
Copyright
© The Author(s), 2023. Published by Cambridge University Press
Figure 0

Figure 1. Réalisations possibles de /a/ et /ɑ/ en français de France dans la deuxième moitié du XXe siècle : dans les années 1960 à Paris (Martinet 1969), 1970 en région parisienne (François 1974, Lennig 1978, Mettas 1979), 1980 à Saint-Rémy-de-Provence dans les Bouches-du-Rhône (Hilt 1986), 1990 à Paris (Fougeron & Smith 1999), en Normandie (Hauchecorne & Ball 1997) et dans l’est de la France (Armstrong 1993), 2000 dans le Nord et l’Alsace (Woehrling 2009), en Lorraine et en Bretagne (Boughton 2005), à Paris (Hansen 2012), à Saint-Claude dans le Haut-Jura (Arnaud 2006) et à Marseille (Coquillon & Turcsan 2012). Les voyelles orales mi-ouvertes du français sont indiquées en gris à titre de repère. Les encarts spécifient pour chaque réalisation la variété où elle a été observée : les variantes entre parenthèses sont des variantes rares, les variantes avec * ont été observées essentiellement en syllabe fermée et les variantes avec ° ont été observées essentiellement après /w/.

Figure 1

Tableau 1. Items-tests répartis selon la voyelle sous-jacente /a/ ou /ɑ/

Figure 2

Tableau 2. Un exemple des données extraites et compilées de Lingua Libre. Les rangées représentent les occurrences des voyelles /a/ et /ɑ/

Figure 3

Tableau 3. Nombre d’items répartis par voyelle sous-jacente /a/ ou /ɑ/ et par région d’origine des locuteurs et locutrices

Figure 4

Figure 2. Différence de réalisations entre /a/ et /ɑ/ en fonction de la durée du segment (en secondes) et de F1 et F2 (en Hertz) toutes variétés confondues. Les valeurs statistiques indiquent le résultat d’un t-test. Les comparaisons sans symboles relatifs à la valeur p indiquent des différences non significatives.

Figure 5

Figure 3. Visualisation par région et syllabe ouverte/fermée de la différence de réalisation entre /a/ et /ɑ/ en fonction de la durée du segment (en seconde) et de F1 et F2 (en Hertz). Les valeurs statistiques indiquent le résultat d’un t-test avec correction de Bonferroni. Les comparaisons sans symboles relatifs à la valeur p indiquent des différences non significatives. Les comparaisons sans accolades indiquent des comparaisons non réalisées suite au manque de données.

Figure 6

Tableau 4. Valeurs moyennes de F1 et F2 (en Hertz) et de durée (en secondes) pour les réalisations de /a/ et de /ɑ/ par régions d’origine des locuteurs

Figure 7

Figure 4. Visualisation des valeurs de durée, de premier formant (F1) et de deuxième formant (F2) au Centre (colonne gauche) et au Nord-Est (colonne droite) entre les femmes (boîtes roses) et les hommes (boîtes bleues).