Fabriquer des outils pour car­to­gra­phier et com­prendre l'usage local des mots

Clément Chagnaud, doc­to­rant au Laboratoire d’informatique de Grenoble, n’a pas peur de s’attaquer à un sujet hau­te­ment explo­sif : est-​ce qu’on dit « pain au cho­co­lat » ou « cho­co­la­tine » ? Ingénieur, il fabrique des outils pour aider les lin­guistes à car­to­gra­phier et à com­prendre l’usage local des mots. 

impression 1
© Clément Gicquel 

Causette : Comment un infor­ma­ti­cien s’est-il retrou­vé à faire une thèse autour de la lin­guis­tique ?
Clément Chagnaud : J’ai répon­du à un appel à doc­to­rants sur un sujet qui avait déjà été éta­bli. Il por­tait sur la géo­lin­guis­tique, c’est-à-dire l’intérêt que les lin­guistes ont pour la répar­ti­tion géo­gra­phique des mots. Ils partent du pos­tu­lat que les dif­fé­rences de dia­lectes, de langues, sont pré­sentes du fait de leur posi­tion­ne­ment dans l’espace. Cette dis­ci­pline ne béné­fi­cie pas encore de moyens tech­niques, disons en phase avec les avan­cées tech­no­lo­giques. L’informatique était un moyen de don­ner à ces experts des outils pour visua­li­ser leurs don­nées sur des cartes numé­riques. Jusqu’à pré­sent, les meilleurs d’entre eux fai­saient des cartes sur Word ou sur Photoshop !

Par quoi commence-​t-​on un chan­tier comme celui-​ci ?
C. C. : Au début, j’ai dû absor­ber énor­mé­ment de connais­sances sur cette dis­ci­pline et com­prendre com­ment les experts menaient leurs recherches en géo­lin­guis­tique. Aujourd’hui, cer­tains partent enquê­ter sur le ter­rain et inter­rogent les gens sur ­l’utilisation des mots et leur pro­non­cia­tion, mais la majo­ri­té tra­vaille sur des don­nées anciennes, recueillies dans des atlas lin­guis­tiques. À par­tir de ces ­don­nées, ils inter­prètent tout un tas de choses : par exemple, ils vont pou­voir retrou­ver l’étymologie des mots comme celle de « tata­ragne », une arai­gnée dans le Sud-​Ouest, qui pro­vient de l’occitan. Ils réa­lisent aus­si des études lexi­cales pour voir pour­quoi des termes dif­fé­rents sont uti­li­sés pour décrire une même chose, comme « tomate » et « pomme d’amour », qui étaient employées pour dési­gner ce même fruit. Certains, éga­le­ment, font des études pho­né­tiques pour voir les dif­fé­rences de pro­non­cia­tions des mots en fonc­tion de l’emplacement sur le ter­ri­toire. J’ai même tra­vaillé avec une lin­guiste qui s’intéresse à la moti­va­tion séman­tique, c’est-à-dire aux élé­ments qui ont moti­vé les humains à dénom­mer un objet de la sorte. Le meilleur exemple vient du mot « cham­pi­gnon » qui a ­quarante-​cinq manières dif­fé­rentes de se dire, cer­taines en fonc­tion de sa forme (« cou­le­melle ») ou de sa toxi­ci­té (« cha­peau de sor­cière »). L’enjeu de cette thèse n’était pas seule­ment de pro­po­ser un outillage ­logi­ciel pour faire des cartes, c’était aus­si d’essayer d’établir des liens entre des phé­no­mènes lin­guis­tiques dont on constate une spatialisation.

C’est-à-dire ? 
C. C. : Par exemple, une chaîne de mon­tagnes qui aurait joué un rôle dans la répar­ti­tion des phé­no­mènes lin­guis­tiques en empê­chant la dif­fu­sion d’un mot d’un ver­sant à l’autre. Ou bien, au contraire, le rôle d’un fleuve qui aurait per­mis sa dif­fu­sion. Ainsi, les monts du Forez, dans le Massif cen­tral, auraient empê­ché la dif­fu­sion du dia­lecte franco-​­provençal. Avec les outils infor­ma­tiques, on peut émettre ce type d’hypothèses et les confir­mer ou non.

Pour cela, vous vous êtes appuyé sur un ouvrage de réfé­rence : l’Atlas lin­guis­tique de la France. Pourquoi ?
C. C. : Cet ouvrage a été réa­li­sé à la fin du XIXe siècle par deux lin­guistes fran­co­phones, Jules Gilliéron et Edmond Edmont. Ils ont entre­pris de ­recen­ser les dia­lectes gallo-​romans de la France. Edmond Edmont est allé sur le ter­rain en tant qu’oreille, et Jules Gilliéron ana­ly­sait les don­nées à Paris. Le pre­mier se ren­dait dans des loca­li­tés pré­cises, tou­jours les mêmes, et inter­ro­geait un infor­ma­teur sur la manière de pro­non­cer tel ou tel mot. Dans l’Atlas, chaque carte repré­sente un mot, comme « canard » ou « ­tou­pie », sa pro­non­cia­tion, sa variante. Il y en a mille neuf cents en tout. Jules Gilliéron était un pré­cur­seur de la géo­lin­guis­tique. Il disait que si on s’inté­ressait aux cartes, on allait pou­voir mieux com­prendre l’évolution des langues et des langages. 

Avez-​vous un exemple ?
C. C. : Prenons la carte du mot « chaise ». En fonc­tion des régions, le mot peut se pro­non­cer « quaise » ou bien « chaise » par exemple. Les géo­lin­guistes sont capables de mon­trer com­ment le mot a évo­lué et quel mot est arri­vé avant l’autre. Ici le son « k » s’est pro­gres­si­ve­ment trans­for­mé en « ch » grâce à une trans­for­ma­tion de notre larynx !

À quoi res­semblent vos outils ?
C. C. : Pendant mes tra­vaux, j’étais en constante col­la­bo­ra­tion avec les experts. Cela m’a per­mis d’établir des cartes com­pre­nant des zones où le même mot est employé à l’époque de l’Atlas lin­guis­tique. Ensuite, grâce à des algo­rithmes les plus géné­ra­listes pos­sible, les lin­guistes peuvent étu­dier cette répar­ti­tion et com­prendre pour­quoi elle s’est faite ain­si. Par exemple, si l’on prend le mot « abeille », ils peuvent réflé­chir à pour­quoi, au début du XXe siècle, on appe­lait une abeille une « mouche à miel » dans le nord de la France et une « abeille » dans le Sud. Je leur ai aus­si per­mis de feuille­ter un grand nombre de cartes pour voir s’il y avait des zones où des varia­tions lin­guis­tiques se pro­dui­saient pour beau­coup de mots. Le but est d’expliquer pour­quoi un tel phé­no­mène se retrouve à chaque fois dans une ville ou une région pré­cise. C’est le cas par exemple dans les Pays de Savoie, où il existe encore des par­ti­cu­la­rismes lin­guis­tiques très marqués.

Malgré des dif­fé­rences moindres aujourd’hui entre les dia­lectes,
le sujet pas­sionne tou­jours autant. Avez-​vous réus­si à com­prendre pour­quoi ?

C. C. : Le lan­gage touche tout le monde. J’ai pris conscience que cha­cun avait son mot à dire sur le sujet. La langue est vivante, elle évo­lue avec les gens, les géné­ra­tions. Il ne faut pas fus­ti­ger telle façon de par­ler, il faut embras­ser la diver­si­té et la favo­ri­ser. La richesse de notre langue, ce sont toutes ces sub­ti­li­tés, ces petites varia­tions, dans cer­taines expres­sions, dans cer­tains mots. Ce sont les ves­tiges des don­nées que je mani­pule. Maintenant, je n’ai plus envie de tran­cher pour savoir si on dit « pain au cho­co­lat » ou « cho­co­la­tine », je trouve génial qu’il y ait encore deux façons de dénom­mer une même chose et d’aider à com­prendre pour­quoi elles sont répar­ties ain­si sur le territoire.

Partager
Articles liés

Inverted wid­get

Turn on the "Inverted back­ground" option for any wid­get, to get an alter­na­tive sty­ling like this.

Accent wid­get

Turn on the "Accent back­ground" option for any wid­get, to get an alter­na­tive sty­ling like this.