Entretien

Les difficultés liées au catalogage dans des langues non occidentales

« La variété de langues, de caractères et de traditions éditoriales rencontrée couramment dans les fonds à rétroconvertir représente au final une somme non négligeable de problèmes à résoudre. » Alexandre Asanovic

Certaines écritures sont-elles plus difficiles à rétroconvertir que d'autres ?

Alexandre Asanovic : Absolument. Le fait que les notices soient en bi-écriture, impose évidemment de saisir les caractères dans les deux écritures, latine et originale. Dans un système purement alphabétique tel que le grec, l’arménien, le géorgien, le copte ou le cyrillique, on peut mettre en place un système d'équivalences qui permet grâce à un outil informatique de passer automatiquement de la romanisation aux caractères originaux et vice-versa. C’est beaucoup plus difficile pour l’arabe ou l’hébreu qui ne sont pas des alphabets mais des abjads, c'est-à-dire des écritures notant principalement les consones. Or à la BULAC nous avons aussi des syllabaires, comme les hiragana et katakana japonais, des alphasyllabaires ou abugidas (qui mélangent les caractéristiques de l’alphabet et du syllabaire) comme le devanagari servant à écrire l’hindi et d’autres langues indiennes et bien sûr les sinogrammes de l’écriture han pour le chinois. La bi-écriture implique une équivalence avec l’alphabet latin, donc plus on s’éloigne du système alphabétique, plus il est difficile d’automatiser le processus de saisie. Mais au-delà de cela, d'autres spécificités inhérentes à chacun de ces fonds rendent leur catalogage quelquefois peu évident.

Quelles sont ces spécificités ?

Dans le fonds chinois par exemple, de nombreuses collections sont constituées de multiples sous-ensembles qui demandent au catalogueur d'opérer des arbitrages. Les normes de catalogage occidentales - qui impliquent une ventilation par champs à l'intérieur de la notice et pour lesquelles un livre est égal à un titre, un auteur et un volume -, sont parfois trop rigides au regard de fonds qui relèvent de logiques tellement différentes.

Pour quelles raisons la grille de lecture occidentale n'est-elle plus adaptée ?

C'est souvent dû à la forme du document en elle-même qui peut varier radicalement d'un fonds à l'autre. Dans les collections chinoises de la BULAC, certains ouvrages sont constitués par des boîtes remplies de fascicules. C'est également le cas d'un ensemble d'ouvrages du fonds tibétain qui ne ressemblent pas à des codex (c’est-à-dire un ensemble de pages relié sur une tranche qu’on ouvre toujours de la même façon, qu’on le lise de gauche à droite ou de droite à gauche). En l'occurrence, ce sont de longues plaquettes constituées de pages pliées en accordéon qui indiquent une pratique de la lecture totalement différente de la nôtre.

Quels critères peuvent vous permettent d'arbitrer dans ce type de cas de figure ?

Une des règles de catalogage en France veut qu’à une unité physique corresponde toujours une notice, même s'il y a des exceptions pour lesquelles un ensemble est décrit dans la même notice : un dictionnaire en trois volumes par exemple. Lorsque l'on catalogue des documents tels que ces boîtes de fascicules ou ces plaquettes, on commence par se demander quelle est l’unité physique ? Est-ce le fascicule ? Il comprend en effet des feuilles reliées entre elles, constituant incontestablement une unité assortie d'un contenu intellectuel qui le distingue des autres fascicules de cette boîte. Mais en même temps, celui-ci ne peut exister de façon autonome car il est par son contenu dépendant des autres fascicules. Nous avons donc décidé en l’occurrence que l’unité physique serait la boîte. C'est en répondant à ce type d'interrogations - qui à l’échelle d’un fonds se posent fréquemment - qu'on arrive à dégager des règles d'arbitrage adaptées à tous ces cas particuliers.

Mais comment faites-vous pour que le catalogue ne devienne pas trop disparate à l'arrivée ?

Il faut se tenir sur la marge étroite qui consiste à ne pas dénaturer le document original qu’on est censé répertorier et identifier tout en restant dans la cohérence du catalogue. Car on est dans des logiques de traitement de masse qui imposent d'opérer une standardisation pour ne pas arriver à un catalogue qui ne serait plus qu'un agrégat de cas particuliers. La variété de langues, de caractères et de traditions éditoriales rencontrée couramment dans les fonds à rétroconvertir représente au final une somme non négligeable de problèmes à résoudre. Même si dans la plupart des cas ces différences ne posent heureusement pas de problème insurmontable.

Le chantier de la rétroconversion nécessite donc de faire appel à des personnels possédant des compétences bien spécifiques ?

C'est préférable. De même qu'il vaut mieux avoir « pratiqué » au préalable le fonds à rétroconvertir. Chaque fonds possède en effet sa logique - qui a souvent à voir avec la façon dont il s'est constitué historiquement - qu’il faut superposer à celle du catalogue. Cette connaissance intime du fichier permet de faire les bons arbitrages et surtout d’éviter un certain nombre d’erreurs préjudiciables pour la bonne cohérence du catalogue.

Propos recueillis par Clotilde Monteiro

 
 


Rejoignez-nous


Le Carreau de la BULAC, carnet de recherches sur hypotheses.org

La Croisée de la BULAC, carnet de veille sur hypotheses.org

Pour citer cette page : 🔗 www.bulac.fr/?id=466