L’ATILF en 20 ans | 2007

 
 

Présentation officielle du Dictionnaire électronique de Chrétien de Troyes

Le Dictionnaire Électronique de Chrétien de Troyes (DÉCT) constitue à la fois un lexique complet de cet écrivain du XIIe siècle et une base textuelle qui permet de lire ou d’interroger les transcriptions de ses cinq romans (Érec, Cligès, Lancelot ou le Chevalier à la Charrette, Yvain ou le Chevalier au Lion, Perceval ou le Conte du Graal).

Le DÉCT résulte de la collaboration d’un groupe de chercheurs : Pierre Kunstmann (Laboratoire de Français Ancien, Université d’Ottawa), qui en assume la direction et rédige les articles ; Hiltrud Gerner (ATILF, CNRS & Université de Lorraine) et May Plouzeau (Université de Provence), qui révisent les articles ; Ineke Hardy (LFA, Université d’Ottawa) pour la correction de la version anglaise. Gilles Souvay (ATILF, CNRS & Université de Lorraine) a la responsabilité des développements informatiques.

Le DÉCT s’adresse à un large public : il peut intéresser le lycéen ou l’amateur éclairé aussi bien que le spécialiste de l’ancienne langue.

Le DÉCT est présenté officiellement le jeudi 31 mai 2007, en salle Imbs à l’ATILF.

Accéder au Dictionnaire électronique de Chrétien de Troyes

Voir l’affiche de la présentation

Voir l’invitation et le programme de la présentation

Voir la plaquette 2007 du DÉCT

 

L’historique du Dictionnaire Électronique de Chrétien de Troyes à travers différentes manifestations et publications

Revue Perspectives Médiévales 34, 2012

Extrait de « L’électronique à l’aide de l’éditeur : miracle ou mirage ? Bilan de quatorze années de travaux au LFA » de Pierre Kunstmann.
Dans Perspectives Médiévales 34, 2012

Le Dictionnaire Électronique de Chrétien de Troyes (DÉCT) : base bilingue (français / anglais) permettant une navigation, avec fonctions multiples, entre la transcription semi-diplomatique de la copie de Guiot (avec images des folios du manuscrit) pour les 5 romans et les articles du lexique. L’équipe de chercheurs se constitue actuellement de P. Kunstmann, qui en assume la direction et rédige les articles ; de Hiltrud Gerner (ATILF) et M. Plouzeau (Université de Provence), qui révisent les articles ; d’I. Hardy (LFA) pour la correction de la version anglaise, et de G.Souvay (ATILF), qui a la responsabilité des développements informatiques.
La dernière mise à jour effectuée en mars 2011 présente une version révisée des lettres A à E et l’ajout des lettres F à K. C’est un travail en cours, de longue haleine, avec tous les mauvais côtés de la chose : incomplet, lacunaire, toujours à revoir (pour supprimer les bogues), à réviser, à redresser. Côté dangereux de l’informatique : une mauvaise manipulation a parfois des effets inattendus et très contrariants ; on n’est plus tout à fait maître de l’entreprise…
Il arrive que nous regrettions de l’avoir rendu public si tôt. Mais nous avons voulu le faire d’une part pour le rendre tout de suite utile (il est effectivement déjà utilisable tel quel pour les étudiants et les chercheurs), par souci de collégialité aussi (pour avoir l’avis de nos collègues et infléchir le projet, le cas échéant, dans tel ou tel sens), enfin pour présenter, sans attendre trop longtemps, à d’autres un exemple de ce qu’on peut faire dans ce domaine.
Mais un travail en cours, c’est aussi plus positivement « a work in progress », en progression, qui a pris d’ailleurs une ampleur que nous ne soupçonnions pas tout à fait au début ; en fin de compte, un travail qu’il vaut mieux probablement laisser ouvert, même après l’achèvement de la deuxième phase, et qui, comme on nous l’a suggéré, pourrait servir de noyau, de pivot, de hub au centre d’un réseau, pour une étude plus générale du vocabulaire du roman courtois de cette période.

Lire l’article complet

XXVIIe Congrès international de linguistique et de philologie romanes, 2013

Colloque international Éditions électroniques, études de corpus et bases textuelles dans les études médiévales, 2015

Colloque Société de Langue et de Littérature médiévales d’Oc et d’Oïl : Éditions électroniques, études de corpus et bases textuelles dans les études médiévales | ATILF, Nancy, 16 et 17 janvier 2015.

Lire l’article D’une phase à l’autre, le Dictionnaire Électronique de Chrétien de Troyes (DÉCT) : achèvement et élargissement de Pierre Kunstmann et Gilles Souvay

Programme du Colloque Éditions électroniques, études de corpus et bases textuelles dans les études médiévales

Publication Autour de Florimont - Approches multidisciplinaires à la complexité textuelle médiévale, 2020

Extrait de « Le Laboratoire de Français Ancien de l’Université d’Ottawa : bilan d’activités et nouvelles perspectives » de Pierre Kunstmann.

À l’occasion du Colloque Autour de Florimont – Textualité médiévale et textualité numérique | Grenoble, 13 et 14 décembre 2018 | Programme du Colloque

 

Il n’est peut-être pas inutile de rappeler ici que le LFA est membre fondateur du Consortium international pour les Corpus de Français Médiéval, créé à l’ATILF en octobre 2004 pour fédérer les « médiévistes ayant constitué des corpus de français médiéval ou les utilisant » et dont le site Web est administré par l’ÉNS de Lyon. Dans la section Corpus de textes figure le DÉCT.

Notre Dossier électronique du Chevalier au Lion a, en effet, changé de taille et de nature, passant d’un roman à cinq, de la présentation de tous les manuscrits du Chevalier au Lion à la constitution d’une base de données consacrée à la seule copie du scribe Guiot et à l’établissement d’un Lexique comprenant tous les mots lexicaux dans le DÉCT1 et avec l’ajout de tous les mots grammaticaux pour le DÉCT2. Ce travail s’est fait et se continue avec une équipe de linguistes bénévoles ; pour la partie informatique, elle est entièrement l’œuvre de Gilles Souvay, ingénieur de l’ATILF, à qui je tiens ici à rendre hommage. Cheville ouvrière du site DMF, il l’est tout autant pour la conception et la gestion de notre site commun. Il n’est pas à Grenoble aujourd’hui pour nous faire son habituelle ‘démo’ ; mais le maniement de cet outil est probablement assez familier à bon nombre de médiévistes français et nous ferons l’économie d’une démonstration. Nous pouvons d’ailleurs, depuis un an, grâce à un rapport quotidien, constater avec une grande précision l’utilisation de la base ; ainsi pour le mardi 30 octobre 2018 (Tableau 1). Pour satisfaire une curiosité bien innocente, tenant à savoir la taille approximative du lexique du DÉCT, nous en avons imprimé en 2014, sous forme de volumes traditionnels, la version française au format PDF en dix exemplaires : trois tomes, pour un total de 1.172 pages. Mais il s’agissait aussi, plus sérieusement, d’avoir sous la main, en plusieurs lieux différents, des textes de secours en cas de panne ou de désastre informatique. D’ailleurs, le chercheur qui veut en acquérir une copie personnelle, peut le faire (à ses frais d’encre et de papier ou en sauvegardant le tout dans un fichier) en la téléchargeant aux adresses suivantes :

Les cinq textes du corpus sont téléchargeables au format XML, suivant les recommandations de la TEI.

L’annonce de la nouvelle de l’achèvement du DÉCT1 s’est faite lors du XXVIIe Congrès International de Linguistique et de Philologie Romane, en 2013 à Nancy, dans une communication intitulée Dictionnaire Électronique de Chrétien de Troyes (DÉCT) : fin et suite… . Expression sibylline, mais juste : nous venions de terminer la première phase, essentielle, de nos travaux et nous allions en entamer la seconde (DÉCT2), à proprement parler la première section (l’ajout des mots grammaticaux, plus de 500 lemmes) de cette seconde phase; c’en était, en quelque sorte le prolongement obligé. Nous avions prévu trois autres éléments nouveaux, mais qu’il ne nous paraît plus réaliste d’effectuer, du moins dans les conditions actuelles. L’équipe de rédaction se réduit à deux personnes : je rédige les articles et May Plouzeau d’Aix-en-Provence, qui collabore avec nous depuis bien longtemps, en fait une très minutieuse révision ; son apport est vraiment essentiel à la qualité de l’ouvrage. Ce travail permet de corriger souvent ou d’améliorer textes (lecture, ponctuation, étiquetage grammatical, etc.) et articles du DÉCT1. Les mots grammaticaux ont parfois de très hautes fréquences : plus de 10.000 occurrences pour l’article défini ou le pronom de la troisième personne ; d’où le nombre d’erreurs d’encodage. Cela se corrige au fur et à mesure de la rédaction des articles ou par la confrontation des listes d’étiquettes de deux équipes de chercheurs ayant travaillé sur les mêmes textes. Ce qui nous est arrivé en mai-juin 2017 avec la BFM, qui avait déjà encodé nos cinq transcriptions ; à la demande de Jean-Baptiste Camps et avec l’aide d’Alexei Lavrentiev, qui nous avait préparé un fichier comparatif, nous avons pu corriger de nombreuses erreurs, des deux côtés et j’ai pu remettre ensuite à Gilles Souvay un texte à encodage beaucoup plus sûr, qu’il a pu afficher sur le site de l’ATILF pour le concours d’agrégation de l’an dernier.

Lire la publication complète Autour du Roman de Florimont. Approches multidisciplinaires à la complexité textuelle médiévale

 
 

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *

 
 

Mise en ligne de la base des mots fantômes

La Base des mots fantômes se propose de recenser les pseudo-lexèmes disposant à tort d’un statut lexicographique, les sens fantômes ainsi que les lemmatisations erronées, qui se trouvent dans les ouvrages lexicographiques canoniques, prioritairement dans le Dictionnaire de l’ancienne langue française et de tous ses dialectes du IXe au XVe siècle par Frédéric Godefroy, 1880-1902 (Gdf/GdfC) et/ou le Französisches Etymologisches Wörterbuch (FEW) de Walther von Wartburg, 1922-2002. Leur correction est souvent le résultat des recherches menées par les équipes DMF, FEW et TLF-Étym qui sont trois des composantes de l’action de recherche « Linguistique historique française et romane » de l’ATILF.

Pourquoi une base des mots fantômes ?

Trois constats ont motivé la création de cette base :

Le premier est l’existence, dans la nomenclature de plusieurs dictionnaires, de pseudo-lexèmes. Cette situation, due à des lectures fautives, a été notée dès 1881 par Arsène Darmesteter qui, lors de la parution des 8 premiers fascicules du Dictionnaire de Frédéric Godefroy (qui couvrent la tranche alphabétique A à Besitre), s’exprimait en ces termes : « il est des mots qui n’ont d’autre autorité que des fautes de copiste, ou des erreurs d’éditeurs ou d’auteurs de dictionnaires » (Romania 10, 1881, 427). Depuis lors, de nombreux lexicographes se sont encore penchés sur le problème de ces mots fantômes, mais on regrette que les informations concernant ces mots soient dispersées dans divers ouvrages ; bien souvent elles sont données à l’occasion d’une étude plus générale, les articles exclusivement consacrés au sujet étant plus rares (Claude Buridant, communications présentées lors du Colloque sur le moyen français à Strasbourg en 1997 et à nouveau au Colloque Godefroy à Metz en 2002 ; cf. aussi la synthèse pour les travaux de Chambon, Baldinger et Buridant dans Carles (H.), Dallas (M.), Glessgen (M.), Thibault (A.), Guide d’utilisation du FEW, Strasbourg, 2019, ÉLiPhi/SLR, 126 sq.). Le but de cette base est donc de recueillir et de centraliser ces vocables qui posent problème et de remédier ainsi à la dissémination des informations qui y sont afférentes.

Le deuxième constat est en rapport avec le fait que le Dictionnaire de Frédéric Godefroy (1880-1902), pierre angulaire de la lexicographie du français médiéval, bien qu’il s’agisse d’un dictionnaire âgé de plus d’un siècle, ne fera jamais l’objet d’une refonte : il reste et restera sans doute définitivement un instrument de travail indispensable pour l’étude du français médiéval. La base a pour objectif prioritaire d’éliminer les mots fantômes du Godefroy, en proposant des rectifications raisonnées s’appuyant sur une documentation sûre. L’ensemble des rectifications constituera un complément au Godefroy, disponible sur le site de l’ATILF, qui pourrait être, en permanence, complété par des éléments proposés par un réseau de lexicologues spécialistes de la langue ancienne. L’ATILF propose ainsi aux médiévistes un outil de travail destiné à faciliter la tâche des lecteurs du Godefroy.
La Base des mots fantômes est accessible à travers le portail lexical du CNRTL.

Le troisième constat concerne les possibilités qui s’ouvrent aux médiévistes grâce à l’informatique et aux multiples critères d’interrogation qu’elle offre. Nous avons établi une typologie des différents cas de mots fantômes dont la base fournit un éventail d’exemples permettant de repérer les erreurs les plus fréquentes et de les corriger le cas échéant.

En 2021, on trouve 698 fantômes dans la base.

Accéder à la Base des mots fantômes

 
 

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *

 
 

Autres événements en 2007

Colloque « Des documents authentiques oraux aux corpus : questions d’apprentissage en didactique des langues » | Programme
2e journée ASDIFLE « Méthodologies innovantes et alternatives en didactique des langues » | Programme
Journée d’études « Jacques Roubaud, prosateur et poète » | Programme
5e Rencontres européennes CNRS Jeunes Sciences et Citoyens | Programme