21 février 2019

BiNA - Collections patrimoniales numérisées de la BULAC - Le projet de numérisation des manuscrits orientaux

Objectifs du projet
La BULAC a pris la décision de signaler et de numériser les manuscrits proche-orientaux qui constituent le « noyau historique » de la bibliothèque et couvrent la période du XVIe au XIXe siècle. Cette collection, composée de trois fonds (arabe, persan et ottoman) est liée étroitement à l’histoire de l’École des Jeunes de langues1 puis de l’École des langues orientales2.
C’est un riche corpus d’archives consulaires, précieuses pour l’étude des relations commerciales, diplomatiques et politiques ; un ensemble de textes pour analyser et décrire la morphologie des langues, la constitution des lexiques et comprendre l’histoire de l’enseignement des langues du Levant et du Proche-Orient ; une collection de sources sur la philosophie et la médecine et de textes rares relatifs à l’histoire et à la géographie. Ces documents sont donc précieux pour l’ensemble des disciplines des sciences humaines et sociales, les études littéraires et linguistiques.
En numérisant ces documents, la BULAC a pour ambition de diffuser et valoriser sa collection de manuscrits proche-orientaux afin de constituer une bibliothèque numérique de référence dans le domaine. Cette numérisation s'inscrit également dans une logique de conservation, la consultation en ligne offrant le plus souvent une alternative à la consultation de documents papier fragiles et précieux.
Historique du projet
Le projet de signalement et de numérisation des manuscrits proche-orientaux de la BULAC a été entamé fin 2013, grâce au soutien de la Région Île-de-France dans le cadre du dispositif de « soutien à la diffusion des usages, services et contenus pédagogiques et patrimoniaux ».
Le chantier consiste en un traitement systématique du corpus, les manuscrits étant traités par ordre de leur cote avec l'objectif de parvenir à traiter la totalité du corpus. Le plan de travail repose sur un récolement préalable, une reprise des catalogues historiques, une description en ligne sous la forme de notices codicologiques en double écriture (écriture originale du document, transcription en alphabet latin) versées au catalogue collectif des archives et manuscrits de l'enseignement supérieur (Calames), la numérisation puis la mise en ligne des documents et l'archivage pérenne des fichiers numérisés auprès d'un tiers-archiveur. L'intervention de la Région, sous la forme d'une subvention d'investissement, concerne les dernières étapes du chantier : numérisation et archivage numérique pérenne.

État d'avancement du projet

  • Récolement

Les collections de manuscrits proche-orientaux de la BULAC sont organisés en trois sous-collections, correspondant à trois racines de cotes linguistiques (manuscrits persans, turc-ottomans et arabes). Le récolement a fait apparaître un nombre de cotes intermédiaires et de sous-cotes beaucoup plus important qu'escompté. Un grand nombre de fragments non identifiés et non cotés ont également été localisés, rassemblés et identifiés.
En outre, le récolement a permis d'établir une fiche sommaire de l'état de conservation et de dresser une typologie des difficultés à traiter (papiers abîmés, reliures à faible degré d'ouverture, fragiles ou absentes, enluminures et dorures exigeant un traitement numérique spécifique, encres corrosives, ventilation par format des documents, etc.).

  • Signalement

Le travail de signalement au format XML-EAD dans le catalogue collectif des archives et manuscrits de l'enseignement supérieur a fait apparaître des lacunes dans le schéma de données descriptives (Document type definition) pour la nature des documents décrits par la BULAC : absence de prise en compte du caractère multi-lingue et multi-écriture d'un corpus, pas de possibilité de description parallèle du titre, des auteurs et des autorités en écriture originale et en translittération latine, pratiques hétérogènes de translittération du turc-ottoman... Un important travail d'échanges avec l'Agence bibliographique de l'enseignement supérieur (ABES) et avec les bibliothèques conservant des collections similaires ont permis d'effectuer des ajustements dans le manuel de catalogage des manuscrits pour l'enrichir au sujet de ces différents points.
Le signalement en double écriture (écriture originale et transcription latine) est, depuis l'origine du projet BULAC, un axe fort du signalement de nos collections, sur lequel l'établissement joue un rôle pilote. Il permet d'assurer l'intelligibilité du signalement des documents en écriture non latine – les pratiques de transcriptions phonétiques étant limitées à une sphère linguistique et fortement variables dans le temps. La BULAC est ainsi le premier établissement à verser une description codicologique en bi-écriture de manuscrits proche-orientaux dans le catalogue Calames. Par ailleurs, les autorités (noms d'auteur, de copiste, de possesseur, de dédicataire, sujet du document, etc.) sont systématiquement liées avec les index du catalogue collectif SUDOC de l'enseignement supérieur, lui-même connecté aux référentiels nationaux et internationaux (base IDref). Ces autorités sont également traitées en double écriture, un chantier indispensable compte tenu des particularités et des complexités de l'onomastique arabe.

  • Numérisation et diffusion

La phase de numérisation a été entamée en 2016. Compte tenu de l'ampleur du chantier, de son impact dans l'organisation interne de l'établissement et de la complexité du cahier des charges à établir, il a été choisi de lancer un premier marché test sur un nombre limité de documents, sélectionnés en raison de leurs particularités de format et de volumétrie ou de leur état de conservation (papier dégradé par des galeries d'insectes, tâches) ou de réalisation (enluminures).
Des marchés courants ont ensuite été lancés pour permettre la numérisation des manuscrits au fur et à mesure de leur traitement intellectuel. Le prestataire choisi s’installe dans les murs de la bibliothèque ce qui permet un meilleur suivi.
En 2017-2018, 150 manuscrits persans et arabes ont été numérisés.  
En 2018-2019, un premier chantier se tiendra jusqu'au printems et permettra la numérisation du corpus de manuscrits turcs-ottomans dans son intégralité (250 volumes). Un deuxième chantier dont le périmètre est en cours de définition sera organisé du printemps à l'automne 2019.

Communication et actions de valorisation autour du projet

Pour en savoir plus, vous pouvez consulter les différents documents décrivant les collections concernées et les actions menées en amont et en aval de la numérisation :

  • Présentation du programme de numérisation et du soutien de la Région Île-de-France :
  • Formations à la codicologie à partir des collections :

    • L'école d'été euro-arabe de la chaire du dialogue des cultures de l'Université Paris-1, qui organise un parcours de formation pour une sélection d'étudiants internationaux en études arabes choisis sur dossier, a organisé des séances de formation à la codicologie arabe en 2015 et 2016 ;

    • Un atelier annuel de codicologie arabe est organisé depuis 2017 par la la section arabe de l'Institut de recherche sur l'histoire des textes (CNRS et Collège de France) ouvert aux étudiants débutants utilisant le corpus de manuscrits de la BULAC.

Ce programme ambitieux subventionné par la région Ile-De-France complète des numérisations antérieures de manuscrits persans et arabes réalisées grâce à des subventions TIMA (The Islamic Manuscripts Association). Plus...

Posté par : pcassuto à - - Permalien [#]