Présentation

Le pôle Document numérique au sein de la MRSH de Caen est un point de rencontre et de confrontation des expériences en cours, tant dans le domaine des sciences humaines que des sciences exactes, afin de conforter les dynamiques émergentes.

Les principales opérations menées à ce jour, dans le domaine des SHS et en synergie avec le GREYC, se sont concrétisées par la mise en ligne de corpus littéraires et/ou patrimoniaux, d'informations géographiques (« Pensées » de Montesquieu, Manuscrits du Mont Saint-Michel, Atlas transManche, Fonds anciens des bibliothèques normandes...) pour lesquels, autour du standard XML-TEI, plusieurs versions de diffusion, à destination de publics différenciés et sur des supports variés, ont été produites. Pour chacune d'entre elles un travail spécifique sur les modes de consultation et de circulation dans l'information structurée, suivant des normes strictes, a été effectué (développement d'interfaces, de moteurs de recherche...).

Ces travaux ont donné une première visibilité au regroupement de compétences effectué à Caen et ont permis d'établir des liens et des actions partagées tant avec des structures publiques ou semi-publiques (ENS Lyon, MSH Paris, Association des éditeurs de la recherche et de l'enseignement supérieur, Éditions QUAE – Cemagref, Cirad, Ifremer, Inra –, Scriptorial d'Avranches, CRL Basse-Normandie via Normannia, etc.) que privées (APSED, TEI Council, etc.).

Ils ont également débouché sur des actions en réponse à des demandes de formation ou de conseil (Master EMT (Caen), Master Document (Caen), USJ (Beyrouth), ADERES, QUAE, Masters « Renaissance » et « Archéomatique » (Tours), Presses universitaires de Tours, de Perpignan, IMEC, Presses de l'ENS-Lyon...).

Ils se poursuivent aujourd'hui avec le développement de plusieurs corpus, dont deux soutenus dans le cadre de projets ANR : ProDescartes et Sourcencyme.

Les corpus, proposés au travers des interfaces développées de manière ciblée, pourront intéresser des publics variés : chercheurs, étudiants, professionnels, érudits et amateurs, scolaires, grand public...

Les techniques mises en œuvre peuvent être utiles à tous les acteurs de la chaîne numérique : des institutions en charge de projets de numérisation (travail sur les standards et les interfaces) aux éditeurs et acteurs du pré-presse (imprimeurs confrontés à la mutation numérique de la diffusion des contenus) en charge de la production (procédures de travail et outils de traitement et de mise en forme des flux structurés). Le service à long terme et la conservation des données est bien entendu un souci de fond qui s'inscrit d'ores et déjà dans la mission des CRI universitaires et dans la réflexion des institutions conservatrices de patrimoines numériques (archives, bibliothèques...).

Ces réalisations offrent au public ou aux communautés de chercheurs la possibilité de consulter, sur internet, des documents originaux (textes et images numérisées), des transcriptions savantes, enrichies d'annotations dynamiques et de fonctions facilitant la lecture (moteurs de recherche, glossaires, index...).