Publié : 14/10/2023, mis à jour: 23/04/2024 à 17:29
http://www.bulac.fr/node/3021

Mistara - Onomastique arabe et métadonnées des langues à écriture arabe dans les référentiels en ligne

De juin 2019 à janvier 2021, le projet Mistara visait à faciliter l’accès aux ressources en écriture arabe signalées dans les catalogues en ligne articuler les données d’autorité des référentiels nationaux (noms d’auteur dans les catalogues) avec les bases onomastiques arabes élaborées par la recherche. Soutenu par le groupement d’intérêt scientifique CollEx-Persée dans le cadre des programmes « Services à la recherche », ce projet porté par la BULAC a associé le service commun de la documentation d’Aix-Marseille Université, la section arabe de l’Institut de recherche sur l’histoire des textes (CNRS), l’Institut dominicain d’études orientales du Caire, la bibliothèque de l’Institut du monde arabe et la Maison méditerranéenne des sciences de l’Homme, avec le soutien des agences bibliographiques nationales.

Détail d’une mistara ottomane, tablette de réglure

Détail d’une mistara ottomane, tablette de réglure.

Le projet

La mistara était la tablette de réglure utilisée pour tracer les lignes d’écritures dans les manuscrits du monde islamique. C’est le totem qui a été choisi pour un projet centré autour de l’alignement des noms de personnes en écriture arabe.

En effet, les métadonnées décrivant des ressources en alphabet arabe (langues arabe, persane, ourdou et turque-ottomane principalement) présentent de nombreuses anomalies liées à la complexité du système onomastique, aux divergences phonétiques ou orthographiques entre langues ou à des erreurs de codage des caractères.

Le travail mené vise à faciliter l’accès aux ressources en écriture arabe signalées dans les catalogues en ligne et à articuler les données d’autorité des référentiels nationaux (noms d’auteur dans les catalogues) avec les bases onomastiques arabes élaborées par la recherche, telles que la base al-Kindi de l’IDEO (https://alkindi.ideo-cairo.org) et l’Onomasticom arabicum (https://onomasticon.irht.cnrs.fr/) développé par la section arabe de l’IRHT.

Dans le cadre de projet, les outils d’alignement et de correction des bases d’autorités développés par les agences bibliographiques sont testés sur un corpus de ressources en écriture arabe.

  • Carnet Hypothèses consacré au projet : https://mistara.hypotheses.org/
  • Cécile Gobbo, « Mistara : au croisement des enjeux de la transition bibliographique et de la recherche sur l’onomastique - ou étude des noms - arabo-musulmane », Arabesques [En ligne], 104 | 2022, mis en ligne le 13 janvier 2022, consulté le 14 octobre 2023.

Les résultats

Bilan et présentation du projet aux CollExPro19

Vidéo de présentation du projet aux CollExPro19

Le sultan [du Maroc] regagne son palais à cheval après la cérémonie à la mosquée.

Le projet TariMa (Tārīẖ al-Maghrib - Écrire l’histoire au Maghreb à l’époque moderne et contemporaine) repose sur la valorisation scientifique et le traitement numérique des collections de manuscrits et d’imprimés maghrébins présents dans les bibliothèques françaises, en particulier...

Portrait de Noëmie Lucas

D’octobre 2020 à août 2021, la BULAC a accueilli Noëmie Lucas, post-doctorante auprès du GIS MOMM, pour organiser et animer une série de hackathons et de colloques autour des enjeux de philologie numérique des textes en écriture arabe, et...

Manuscrit arabe

Le domaine arabe constitue un des fonds les plus anciens de la bibliothèque et les plus riches de France. Il couvre un espace géographique compris entre l’Afrique du Nord et le Moyen-Orient et comprend une vingtaine de pays. On estime...

Fanny Mion-Mouton
Chef de l'équipe Signalement et exposition des données de 2012 à 2021