Regards croisés : le DMF, un dictionnaire de bien plus de vingt ans d’histoire …
Tout au long de 2021, l’ATILF a fêté ses 20 ans. Nous ne pouvions pas clore cet évènement sans évoquer le DMF | Dictionnaire du moyen français, qui doit sa pérennité à l’ATILF. Non pas que le laboratoire soit à son origine ; celle-ci remonte à 1980, et le projet était même bien avancé au moment où l’INaLF (Institut national de la langue française devenu ATILF en 2001) a été conduit à sa fin. Mais en 2001, une idée nouvelle s’est imposée, celle d’une « lexicographie évolutive » : le DMF s’est ainsi construit à l’ATILF par une suite d’étapes dont chacune a marqué un incontestable progrès.
Lire l’article dans son intégralité de Robert Martin | septembre 2021
Lire l’article dans son intégralité de Sylvie Bazin-Tacchella et Gilles Souvay | novembre 2021
Nous avons donc saisi l’opportunité de croiser les regards de Robert Martin et de Sylvie Bazin-Tacchella et Gilles Souvay.
Naissance du projet – Mise en place d’une collaboration internationale
La naissance du projet DMF se situe en 1980, lors du 3e colloque international sur le moyen français qui s’est tenu à Düsseldorf (Allemagne). À la demande de l’organisateur du colloque, Peter Wunderli, et avec l’appui chaleureux de Paul Imbs, Robert Martin a pu, dans un exposé liminaire, esquisser les finalités d’un Dictionnaire du Moyen Français et en tracer les options fondatrices, illustrées par un premier article-témoin, celui du verbe mander ; cet exposé a donné lieu à un large débat, aussi encourageant que fructueux. Dès le démarrage, le DMF s’est placé dans le sillage du TLF : il serait dans l’idéal pour le moyen français ce que le TLF devait être pour le français des 19e et 20e siècles. Le projet avait ainsi trouvé ses premiers contours. Grâce à une subvention spécifique allouée par la commission compétente du CNRS, quelques éditions de textes de moyen français ont pu être saisies dès cette date à l’ILF | Institut de la Langue française à Nancy (devenu ensuite INaLF puis ATILF).
L’ATILF, le sauveteur du DMF
Dès la création de l’ATILF, avec l’accord de son directeur Jean-Marie Pierrel associé à Bernard Combettes et Robert Martin ont pu, le 31 mai et le 1er juin 2001, organiser une table ronde afin de redonner une place au DMF. Des interventions solidement argumentées, notamment celles de Jean-Pierre Chambon et de Frankwalt Möhren, ont fait renaître l’espoir. Tout portait à croire que le DMF se poursuivrait.
À partir de 2001, la rédaction du Dictionnaire du Moyen Français a pu se poursuivre grâce au travail de longue haleine de Robert Martin et des principaux collaborateurs en poste, mais également grâce au soutien du laboratoire.
Sept nouvelles versions du Dictionnaire du Moyen Français ont vu le jour depuis lors (2002, 2007, 2009, 2010, 2012, 2015, 2020). Robert Martin, dans son témoignage, en indique les principales caractéristiques. Il est important de souligner également le travail souterrain de montage des articles et l’évolution de l’interface lors des différentes versions du Dictionnaire du Moyen Français. Mais, au-delà de la continuité de ce grand projet scientifique, que l’ATILF a toujours défendu, le laboratoire attendait l’émergence d’un nouveau projet scientifique.
De 2001 à 2021, le DMF a acquis un degré de maturité apprécié par les utilisateurs à en juger par le nombre moyen de consultations quotidiennes ; environs 450 depuis la France et aussi l’étranger. Des liens hypertextuels permettent un accès commode aux ouvrages de référence. Il semblerait, en raison de toutes sortes de contraintes, que le DMF version 2020 soit à considérer comme la version ultime de référence. Dans un dessein de pérennité informatique du DMF, la plate-forme technique doit être adaptée aux normes informatiques les plus récentes et durables.
Créé par Gilles Souvay (2), Ingénieur de recherche CNRS, spécialisé dans le TAL | Traitement automatique des langues pour répondre à la difficulté de la variation graphique, tant dans l’élaboration que dans la consultation des articles du Dictionnaire, le lemmatiseur LGeRM a été constamment repris et amélioré au fil de ces années. Il a élargi son champ d’intervention grâce à toute une série de collaborations scientifiques et a participé à la production de nouvelles ressources : il est le cœur désormais d’une plate-forme de lemmatisation accessible sur la page d’accueil du DMF.
De l’outil-glossaire à la plate-forme de lemmatisation (2007-2021)
Dans le prolongement de cette collaboration, tous les ans depuis 2011, le texte médiéval au programme des agrégations de lettres et de grammaire est lemmatisé et traité avec les outils du DMF, ce qui permet d’offrir à la consultation une édition numérisée et d’interroger le texte par forme et par lemme, avec des liens vers les articles du DMF. Depuis 2021, l’interrogation peut également se faire par étiquette morphosyntaxique.
Tous ces développements se greffent sur un projet initial, celui du DMF, qui a su prendre le tournant d’une lexicographie véritablement évolutive, en dépassant la construction lettre par lettre du dictionnaire au profit d’une construction globale par étape, mais aussi en faisant éclater les limites traditionnelles de la consultation, grâce au balisage des données et aux liens hypertextuels. Au cœur du dispositif, le dictionnaire proprement dit demeure la source et la référence, à travers des versions datées qui sont archivées et une dernière version, directement disponible en ligne, qui reprend, corrige et enrichit la précédente. Cependant, en rappelant l’importance du lemmatiseur LGeRM et les développements qu’il a permis, nous évoquons un chantier de recherche encore en cours, qui progresse comme un chantier de fouille à partir de nouveaux sondages et de nouvelles campagnes liées à de nouveaux partenariats avec des éditeurs de textes anciens ou d’autres projets de recherche.
L’adaptation d’un tel outil à la langue et aux textes du moyen français, puis l’élargissement de son domaine d’intervention s’inscrivent bien dans le dynamisme et le réalisme d’une lexicographie évolutive qui n’abandonne pas les projets ambitieux, mais choisit de les faire avancer par étape, à la fois dans et pour une communauté de recherche, avec une ouverture vers un public élargi. LGeRM, accessible en ligne, documenté et illustré par des exemples, permet d’analyser des formes, de lemmatiser un extrait ou un texte complet, de construire un index lemmatisé, voire de réaliser un glossaire électronique de manière assistée. L’utilisateur, selon ses besoins, choisit le mode de collaboration, plus ou moins libre ou étroite. Ainsi notre ambition a-t-elle été de construire, sans toucher au noyau lexicographique – le Dictionnaire du Moyen français conçu et dirigé par Robert Martin – une plate-forme de lemmatisation, véritable espace en ligne de recherche au service des textes de moyen français, compris au sens large (et non plus au sens restreint des limites chronologiques 1330-1500).
Les témoignages des chercheurs rencontrés montrent qu’ils ne s’arrêtent pas à ces bornes, que la consultation du DMF comme l’utilisation de la plate-forme de lemmatisation concernent également les spécialistes d’ancien français comme ceux du 16e siècle, sans parler aussi d’utilisateurs non spécialistes qui cherchent à comprendre les textes du passé. Le nombre des utilisateurs réguliers et celles des collaborations effectives nous confortent dans l’idée de faire une œuvre utile.
En conclusion
Comme les médiévistes aiment à le dire, nous sommes des « enfants sur des épaules de géants », nous espérons grâce aux matériaux patiemment rassemblés et mis en forme par nos devanciers, et avec les convictions que nous nous sommes forgées, contribuer modestement à faire découvrir les textes anciens, à mieux les comprendre et à mieux les exploiter linguistiquement.
Complément d’informations
Consulter la page personnelle de Sylvie Bazin-Tacchella
Consulter la page personnelle de Gilles Souvay
Lire l’article Première version du Dictionnaire du Moyen Français, rubrique les faits marquants de l’ATILF, en 2003
Consulter la ressource DMF
Contact : dmf [at] atilf.fr
Repère : Parcourir la frise « Histoire du français » pour visualiser de manière chronologique l’évolution du français
(2) Gilles Souvay est responsable pour chacun de ces textes du traitement automatique et ses adaptations, Sylvie Bazin de la relecture et de la correction de la lemmatisation automatique, à l’exception du texte de Chrétien de Troyes traité en collaboration avec Pierre Kunstmann et adossé non pas au DMF mais au DeCT | Dictionnaire électronique de Chrétien de Troyes et des deux derniers Les Poésies de François Villon, La Mort du Roi Arthur, produits en collaboration avec Jean-Michel Jézéquel et pour le dernier, également avec Corinne Denoyelle, de l’Université Grenoble Alpes.