Centre de recherches archéologiques et historiques anciennes et médiévales
UMR 6273 (CNRS/Université de Caen Normandie)





Rechercher

 


 

 

Vient de paraître

 

AM45




CNRS

Accueil > Recherche et activités > Projets scientifiques des thèmes et des axes > Axe transversal A : Érudition et numérique (production de données, exploration de corpus)

Axe transversal A : Érudition et numérique (production de données, exploration de corpus)

par Micael Allainguillaume - publié le

Responsables : M-A. Lucas-Avenel et Grégory Combalbert

En associant, dans un axe qui se veut transversal, les termes érudition et numérique, on veut approfondir les questions liées à l’utilisation, à l’appropriation et à la mise en réseau des données numérisées pour la recherche et l’accès au savoir dans une approche méthodologique et sur les sujets qui intéressent l’équipe. L’axe transversal est conçu comme un lieu d’échanges et de propositions autour des questions méthodologiques et épistémologiques, afin d’approfondir la réflexion sur les problèmes liés aux notions même de corpus (définition, délimitation,...) et de source (textuelle ou archéologique), ou bien encore sur les types de données qu’il convient d’associer à la source dans le nouvel espace démultiplié offert par le numérique. On réfléchira aussi à la manière dont le numérique modifie l’approche que le chercheur ou l’éditeur scientifique a de ses sources, celles-ci devenant en soi des objets qui peuvent être déconstruits, reconstruits et travaillées de multiples manières.
Les travaux de l’axe transversal (voir ci-dessous) viennent soutenir les réflexions sur les corpus, dont l’exploitation scientifique prend place dans les nouveaux thèmes de recherche du Craham et dans lesquels le numérique tient une place importante. Il s’agira ainsi de faciliter la promotion des actions transversales et du travail inter- ou pluridisciplinaire. Dans cette perspective, on étudiera les liens existant entre les différents corpus numériques constitués et étudiés par l’équipe, afin d’aménager des outils qui en faciliteront l’utilisation, l’actualisation ou l’enrichissement par les chercheurs des différentes spécialités.
La plupart des projets numériques du Craham sont menés en partenariat avec le pôle Document numérique de la MRSH (mettre le lien) et sont inscrits au titre des opérations conduites dans le cadre des consortiums du TGIR Huma-Num (Cosme mettre le lien, Cahier mettre le lien, Masa mettre le lien), facilitant l’élaboration de protocoles et l’organisation de journées d’étude.
Les projets de numérisation et d’encodage de sources textuelles et archéologiques font l’objet de conventions ou de programmes ANR avec les collectivités locales et nationales (région Basse-Normandie, ville d’Avranches, DRAC), les Archives départementales, les bibliothèques françaises et étrangères, dont on valorise les collections patrimoniales par leur mise en ligne au sein de publications et d’outils de recherche. Dans le cadre de Zoomathia mettre le lien, porté par le Cepam mettre le lien, le Craham collabore avec 7 autres équipes partenaires et 10 équipes associées, dont l’UMR 7271 mettre le lien, spécialisée en Ingénierie des connaissances et web sémantique.
L’exceptionnelle variété des types de sources sur lesquelles les membres du Craham mènent leurs recherches permet d’envisager des réflexions croisées sur la conception des outils les mieux adaptés.

Numérisation, constitution de bases de données et de corpus numériques
Les sources diplomatiques. La base de données Scripta donnera libre accès aux données déjà validées. Le programme E-Cartae sera poursuivi pour permettre la publication sur double support de tous les corpus des actes des évêques normands du Moyen Âge central (8 corpus prévus).
Biblissima et le programme Bibliothèque virtuelle du Mont Saint-Michel (BVMSM, resp. M. Bisson et C. Jacquemard). Les différents modules numériques déjà expérimentés sous forme de prototypes (catalogue de notices de manuscrits et imprimés, collection de fac-similés numériques, corpus des inventaires et catalogues anciens, édition de sources textuelles, thésaurus de notices d’autorités) seront finalisés et mis en ligne avec accès au public ; en outre, on travaillera à un module complémentaire dédié au traitement des marques de possession, d’inventaire, d’insertion de titres, sommaires...
Les sources littéraires (éditions critiques multimodales d’œuvres littéraires en langue latine avec traductions annotées) :

  • programme Malaterra (resp. M.-A.Lucas-Avenel) Le volume I, qui correspond aux livres 1et 2 de l’Histoire du Grand comte Roger…par Geoffroi Malaterra, est à présent publié sous double support – papier et numérique. L’entreprise se poursuit avec la préparation du volume II, qui contiendra les livres 3 et 4
  • Programme Serlon de Bayeux, Poèmes (resp. M.-A. Lucas-avenel) : programme d’édition critique avec double traduction française et anglaise, mené en collaboration avec Edoardo D’Angelo (Università Suor Orsola Benincasa) et Moreed Arbahzadah (Cambridge).
  • Programme Ichtya (resp. Th. Buquet et B. Gauvin) : mise en ligne d’un corpus de traités latins d’ichtyologie, permettant d’apprécier le contenu du savoir zoologique véhiculé pendant l’antiquité et le Moyen-Age. Travail en cours sur Thomas de Cantimpré, De natura rerum, 6 et 7, et Albert le Grand, De animalibus, 24 : encodage des différents segments de citations, pour faciliter l’analyse de la transmission des savoirs depuis l’Antiquité jusqu’au Moyen Âge.
  • Programme DYRIN (resp. Th. Buquet) : étude de la connaissance de la faune du Grand Nord, de l’époque carolingienne au XVIe siècle, principalement à travers la transmission des savoirs zoologiques. Constitution d’un corpus de textes (extrait de sources) relatifs à cette faune (ours polaire, morse, narval, baleines et autres animaux marins, mais aussi faucons gerfauts, rennes, élans, petits animaux à fourrure, etc) et encodage XML-TEI, pour permettre ensuite son exploitation sous forme de publication (papier et électronique) et son analyse par les outils du web sémantique (analyse textuelle, réseaux, graphes). Les sources monétaires : Base Nummus (resp. P.-M. Guihard). Il s’agit de constituer un répertoire des dépôts de monnaies antiques signalés en Normandie depuis le XVIIIe s. et jamais référencés et de procéder à un catalogage bibliographique complet (un Corpus des trésors monétaires) élargi à la moitié nord de la France. Les sources sigillographiques (resp. C Maneuvirer). Parallèlement à la réflexion menée pour la constitution de bases de données sigillographiques européennes, on évaluera, grâce à un nouvel équipement de la MRSH, l’intérêt scientifique, patrimonial et communicationnel d’une numérisation 3D des sceaux des collections normandes, pour une mise en ligne. Les sources archéologiques. Édition numérique (XML-EAD) du corpus mobilier du village de Saint-Ursin de Courtisigny (resp. C. Hanusse) et du résultat des fouilles du village-rue de Trainecourt à Grentheville (Calvados). Enrichissement et mises à jour des bases de données du laboratoire (base en archéométrie-céramologie ; bases de données anthropologiques et archéothanatologiques, recensement des sites et bases de gestion des collections ; base des photographies pathologiques) ; élargissement du SIG funéraire aux sites en cours d’étude (Thaon et Aizier) ; numérisation des plans de fouille et reconstitution 3D de l’église de Thaon en collaboration avec le Cireve de l’Université de Caen ; constitution et mise en ligne d’une base de données des mesures à grains médiévales et modernes dans l’espace normand. GDRI Zoomathia : sources (textuelles, archéologiques et iconographiques) croisées. Le Craham continue de participer à la constitution d’une base de données antiques et médiévales relatives à la zoologie (thésaurus et corpus ; resp. Th. Buquet et B. Gauvin). Comed. Corpus numérique du mobilier médiéval : objets, textes, images. Les différentes sources seront structurées et encodées pour permettre la constitution progressive des notices, puis, par grands domaines, des éditions papier (resp. Luc Bourgeois).

Réflexion sur les outils les mieux adaptés
Les résultats de nombreux projets seront encodés en XML-EAD : outre Scripta et Nummus, Saint-Ursin de Courtisigny, Trainecourt à Grentheville et Comed. Le choix de l’EAD, largement utilisé pour la description de fonds d’archives, des collections de manuscrits ou d’objets, facilite en effet la coopération avec les services de conservation des fonds, et l’interopérabilité avec les autres corpus structurés en XML, notamment E-Cartae, structuré en XML-TEI. Le nouvel outil « Thésaurus », conçu conjointement par le Craham et le pôle Document numérique de la MRSH, permettant l’indexation de plusieurs éditions de textes (chartes, textes littéraires…), servira à différents corpus ou textes - en premier lieu, une partie des actes de Scripta et les documents édités dans le programme BVMSM. Les œuvres littéraires latines et leur traduction seront structurées en XML-TEI (version P5). On poursuivra la réflexion engagée à propos de l’encodage de l’apparat critique pour la constitution du volume I de Malaterra. Le Craham (avec des recherches ciblées sur les textes latins d’ichtyologie et le traitement des zoonymes) participera aux thésaurus et corpus de Zoomathia : élaboration et application d’un protocole de description systématique de sources zoologiques dans le double objectif de contribuer au web de données ouvertes en publiant les données dans un format standard garantissant leur interopérabilité et facilitant leur réutilisation (XML-TEI), et de permettre leur analyse à l’aide des outils du web sémantique existant.
Pour les bases de données d’analyses archéométriques (analyses chimiques, informations archéologiques, données typologiques et techniques), on mènera une réflexion pour la constitution d’un nouvel outil rassemblant les données sur les céramiques prises en compte dans la construction de la typochronologie régionale.

L’ensemble de ces projets autour du numérique, intégrant une réflexion autour de la constitution d’outils, fera l’objet d’un séminaire et/ou de journées d’études, dans le prolongement des journées méthodologiques déjà organisées sur l’apparat critique ou l’indexation, qui intéressent les trois disciplines du Craham. On mènera une réflexion sur la constitution de glossaires (animaux, objets,...), de concordances, de bases de données lexicographiques, bibliographiques, toponymiques et anthroponymiques, interrogeables, actualisables et réutilisables.
Ces séminaires, ouverts aux doctorants, auront une dimension à la fois méthodologique et scientifique et permettront de renforcer le partenariat avec le pôle Document numérique, qui a développé un important volet formation et un partenariat national et international. De même, l’implication des chercheurs de l’unité dans le Master Pro EMT, les partenariats communs avec les centres de conservations patrimoniaux, l’implication du Craham dans les réseaux IST (Frantiq) et la Bibliothèque des mondes anciens et médiévaux (BMAM) permettront d’intéresser davantage les étudiants du Master aux travaux de l’unité.