Publié : 01/06/2022, mis à jour: 01/12/2023 à 19:13
http://www.bulac.fr/node/2559

TariMa – Tarih al-Maghrib. Écrire l’histoire au Maghreb à l’époque moderne et contemporaine

Le projet TariMa (Tārīẖ al-Maghrib - Écrire l’histoire au Maghreb à l’époque moderne et contemporaine) repose sur la valorisation scientifique et le traitement numérique des collections de manuscrits et d’imprimés maghrébins présents dans les bibliothèques françaises, en particulier à la BULAC. Il propose d’associer le développement d’un outil de reconnaissance de caractères pour l’écriture maghrébine (ẖaṭṭ maġribī) et l’analyse historique d’un corpus de manuscrits et lithographies du Maghreb (XVIIe-XXe siècles) ainsi que de quelques imprimés.

Le sultan [du Maroc] regagne son palais à cheval après la cérémonie à la mosquée.

Paul Queste. Cérémonie du vendredi. Le sultan [du Maroc] regagne son palais à cheval après la cérémonie à la mosquée. 1916. Médiathèque du patrimoine et de la photographie.

Le projet

Le projet TariMa associe le développement des techniques de reconnaissance des caractères de manuscrits (HTR) et imprimés (OCR) de l’arabe maghrébin et l’exploitation par la recherche des collections d’ouvrages maghrébins conservés dans des bibliothèques françaises. Son but est de mettre à disposition la numérisation au format image et au format texte de ces documents jusqu’à présent peu ou pas exploités. Leur mise en ligne contribuera à la valorisation des sources arabes, au cœur des renouvellements récents de l’histoire du Maghreb. En fédérant une communauté de professionnels, de chercheurs et d’étudiants, il proposera un modèle de numérisation et de visualisation enrichies de l’arabe, reproductible sur d’autres corpus.

Le corpus sélectionné est composé de manuscrits, mais aussi de textes imprimés relevant du genre historique (chroniques, récits de voyage, dictionnaires biographiques, histoire universelle, généalogie, autobiographie...) dans un sens très large, genre négligé dans l’étude des manuscrits arabes au profit des sciences religieuses ou de la linguistique. Après la numérisation et l’extraction de texte, un travail sur l’encodage et la valorisation des manuscrits sera conduit avec des chercheurs et des étudiants au sein de la BULAC. Ce même public sera invité à participer à des stages à Rabat et à Tunis de découverte des collections locales de manuscrits, le projet s’achevant par un colloque international sur les usages numériques des sources arabes. Le projet contribuera ainsi à développer les échanges scientifiques internationaux autour des sources textuelles maghrébines.

Les documents numérisés sont disponibles dans la Bibliothèque numérique aréale. Ils seront prochainement enrichis par les extractions de textes réalisées par OCR/HTR.

Les partenaires

Le projet associe l'Institut de recherche sur les mondes arabes et musulmans (CNRS/AMU) et la médiathèque de la Maison méditerranéenne des sciences de l'homme. Il a bénéficié du relais du Centre Jacques-Berque à Rabat.

Logos de la BULAC et de CollEX-Persée

Philologie numérique et sources maghrébines

Manuscrit arabe

Histoire des Beys d'Oran par Hassān H̱ūǧah (Khodja), copié le 7 juillet 1875. حسان خوجه, تاريخ بايات وهران | Hassān H̱ūǧah (Khodja), Tārīẖ Bāyāt Wahrān. Collections de la BULAC, MS.ARA.417. Document numérisé disponible sur bina.bulac.fr

Séance de hackathon avec l'association Calfa

Séance de hackathon avec l'association Calfa (Maxime Ruscio / BULAC).

Le projet part du constat d’un contraste entre la multiplication de travaux d’histoire du Maghreb fondés sur des sources arabes (travaux encore minoritaires face à l’importance d’une recherche non arabisante sur le Maghreb colonial) et l’usage encore très limité des sources textuelles pour les périodes moderne et contemporaine. Il s’inscrit dans la continuité des expériences de développement de la reconnaissance optique des caractères manuscrits et imprimés (HTR/OCR) de l’arabe maghrébin menées à la BULAC depuis 2021, en partenariat avec le GIS Moyen-Orient et mondes musulmans.

Le moteur d'OCR/HTR développé par l'association Calfa repose sur une technologie propriétaire. Des modèles dérivés, compatibles avec la technologie open-source Kraken, sont toutefois mis à disposition pour que la « vérité terrain » des documents exploités dans le cadre du projet TariMa puissent être exploitée pour entraîner d'autres solutions. Ces modèles d'entraînement viennent enrichir le jeu de données RASAM, élaboré dans le cadre du partenariat conduit en 2021 et 2022 par le GIS MOMM, l'association Calfa et la BULAC.

 

Animation pédagogique et communication scientifique

Formation aux humanités numériques et stage de découverte des collections de manuscrits

Parallèlement au travail de numérisation, un volet pédagogique a donné lieu à des séances de formation aux humanités numériques offertes à un groupe d’étudiants des universités françaises à la BULAC entre février et avril 2023. Elles ont porté sur les outils d’extraction automatique du texte des manuscrits, l’annotation informatique et le traitement automatique des langues appliqués à l’arabe.

Ce même groupe d’étudiants a participé à un stage de découverte des manuscrits à Rabat la semaine du 28 mai 2023. Ce stage, organisé en partenariat entre le Centre Jacques Berque et l’Académie du Royaume, proposait la visite des principales bibliothèques marocaines (Bibliothèque nationale, bibliothèque Hassaniyya du Palais royal, Université de la Qarawiyyīn, Archives du Maroc) agrémentée de communications de chercheurs européens et marocains autour de leur travail sur les manuscrits. Les étudiants des universités françaises ont été rejoints pour l’occasion par un groupe de doctorants des universités marocaines.

Colloque « Écrire l’histoire au Maghreb (VIIe-XXe siècles) : auteurs, textes, manuscrits », les 10 et 11 juin 2024

En se consacrant aux sources et aux genres historiographiques arabes, le projet TariMa s'inscrit dans un renouvellement scientifique et méthodologique de la place accordée aux sources arabes pour écrire l'histoire du Maghreb. La numération et la philologique numérique renouvellent en parallèle les usages savants des sources écrites.

Pour rendre compte de ces renouvellements, le projet TariMa organise au centre Jacques Berque (Rabat) les 10 et 11 juin 2024 un colloque de clôture intitulé « Écrire l’histoire au Maghreb (VIIe-XXe siècles) : auteurs, textes, manuscrits ».

L'appel à communication, ouvert aux contributions en anglais, arabe ou français, est ouvert jusqu'au 31 janvier 2024.

La philologie numérique des textes arabes

D’octobre 2020 à août 2021, la BULAC a accueilli Noëmie Lucas, post-doctorante auprès du GIS MOMM, pour organiser et animer une série de hackathons et de colloques autour des enjeux de philologie numérique des textes en écriture arabe, et...

École de printemps : les manuscrits maghrébins et les humanités numériques
2 mai 2022 > 4 mai 2022

Deux journées de conférences et une journée d'ateliers organisées à la BULAC et au Campus Condorcet par le Groupement d'intérêt scientifique Moyen-Orient et mondes musulmans (GIS MOMM).

(Re)découvrez le domaine arabe

Le domaine arabe constitue un des fonds les plus anciens de la bibliothèque et les plus riches de France. Il couvre un espace géographique compris entre l’Afrique du Nord et le Moyen-Orient et comprend une vingtaine de pays. On estime...

Antoine Perrier
Chargé de recherche au CNRS (IREMAM)