TariMa – Tarih al-Maghrib. Écrire l’histoire au Maghreb à l’époque moderne et contemporaine
Le projet TariMa (Tārīẖ al-Maghrib - Écrire l’histoire au Maghreb à l’époque moderne et contemporaine) repose sur la valorisation scientifique et le traitement numérique des collections de manuscrits et d’imprimés maghrébins présents dans les bibliothèques françaises, en particulier à la BULAC. Il propose d’associer le développement d’un outil de reconnaissance de caractères pour l’écriture maghrébine (ẖaṭṭ maġribī) et l’analyse historique d’un corpus de manuscrits et lithographies du Maghreb (XVIIe-XXe siècles) ainsi que de quelques imprimés.
![Le sultan [du Maroc] regagne son palais à cheval après la cérémonie à la mosquée.](/sites/default/files/styles/page_riche_image_principale_mobile/public/medias/images/2023/01/Palais_du_sultan_-_C%C3%A9r%C3%A9monie_du_vendredi_-_Rabat_-_M%C3%A9diath%C3%A8que_de_l%27architecture_et_du_patrimoine_-_AP62T060878.jpg?itok=c9PwQLQq)
Paul Queste. Cérémonie du vendredi. Le sultan [du Maroc] regagne son palais à cheval après la cérémonie à la mosquée. 1916. Médiathèque du patrimoine et de la photographie.
Le projet
Le projet TariMa associe le développement des techniques de reconnaissance des caractères de manuscrits (HTR) et imprimés (OCR) de l’arabe maghrébin et l’exploitation par la recherche des collections d’ouvrages maghrébins conservés dans des bibliothèques françaises. Son but est de mettre à disposition la numérisation au format image et au format texte de ces documents jusqu’à présent peu ou pas exploités. Leur mise en ligne contribuera à la valorisation des sources arabes, au cœur des renouvellements récents de l’histoire du Maghreb. En fédérant une communauté de professionnels, de chercheurs et d’étudiants, il proposera un modèle de numérisation et de visualisation enrichies de l’arabe, reproductible sur d’autres corpus.
Le corpus sélectionné est composé de manuscrits, mais aussi de textes imprimés relevant du genre historique (chroniques, récits de voyage, dictionnaires biographiques, histoire universelle, généalogie, autobiographie...) dans un sens très large, genre négligé dans l’étude des manuscrits arabes au profit des sciences religieuses ou de la linguistique. Après la numérisation et l’extraction de texte, un travail sur l’encodage et la valorisation des manuscrits sera conduit avec des chercheurs et des étudiants au sein de la BULAC. Ce même public sera invité à participer à des stages à Rabat et à Tunis de découverte des collections locales de manuscrits, le projet s’achevant par un colloque international sur les usages numériques des sources arabes. Le projet contribuera ainsi à développer les échanges scientifiques internationaux autour des sources textuelles maghrébines.
Les documents numérisés sont disponibles dans la Bibliothèque numérique aréale de la BULAC (BiNA), avec l'extraction des textes réalisés par OCR/HTR.
Les partenaires
Le projet associe l'Institut de recherche sur les mondes arabes et musulmans (CNRS/AMU) et la médiathèque de la Maison méditerranéenne des sciences de l'homme. Il a bénéficié du relais du Centre Jacques-Berque à Rabat.
![Logos de la BULAC et de CollEX-Persée](/sites/default/files/styles/full_image_echelle_mobile/public/medias/images/2022/01/BULAC%20CollEX%20Pers%C3%A9e.png?itok=FPY6f3-o)
Philologie numérique et sources maghrébines
![Détail du début du texte : titre à l'encre rouge, filet d'encadrement, écriture maghrébine](/sites/default/files/styles/page_riche_image_principale_mobile/public/medias/images/2022/09/MS_ARA_417_0003-768x964.jpg?itok=0VLq3fU8)
Histoire des Beys d'Oran par Hassān H̱ūǧah (Khodja), copié le 7 juillet 1875. حسان خوجه, تاريخ بايات وهران | Hassān H̱ūǧah (Khodja), Tārīẖ Bāyāt Wahrān. Collections de la BULAC, MS.ARA.417. Document numérisé disponible sur bina.bulac.fr
![Séance de hackathon avec l'association Calfa](/sites/default/files/styles/page_riche_image_principale_mobile/public/medias/images/2021/05/Calfa%20philologie%20num%C3%A9rique%20arabe.jpg?itok=Oxy_RZnM)
Séance de hackathon avec l'association Calfa (Maxime Ruscio / BULAC).
Le projet part du constat d’un contraste entre la multiplication de travaux d’histoire du Maghreb fondés sur des sources arabes (travaux encore minoritaires face à l’importance d’une recherche non arabisante sur le Maghreb colonial) et l’usage encore très limité des sources textuelles pour les périodes moderne et contemporaine. Il s’inscrit dans la continuité des expériences de développement de la reconnaissance optique des caractères manuscrits et imprimés (HTR/OCR) de l’arabe maghrébin menées à la BULAC depuis 2021, en partenariat avec le GIS Moyen-Orient et mondes musulmans.
Le moteur d'OCR/HTR développé par l'association Calfa repose sur une technologie propriétaire. Des modèles dérivés, compatibles avec la technologie open-source Kraken, sont toutefois mis à disposition pour que la « vérité terrain » des documents exploités dans le cadre du projet TariMa puissent être exploitée pour entraîner d'autres solutions. Ces modèles d'entraînement viennent enrichir le jeu de données RASAM, élaboré dans le cadre du partenariat conduit en 2021 et 2022 par le GIS MOMM, l'association Calfa et la BULAC.
Animation pédagogique et communication scientifique
Formation aux humanités numériques et stage de découverte des collections de manuscrits
Parallèlement au travail de numérisation, un volet pédagogique a donné lieu à des séances de formation aux humanités numériques offertes à un groupe d’étudiants des universités françaises à la BULAC entre février et avril 2023. Elles ont porté sur les outils d’extraction automatique du texte des manuscrits, l’annotation informatique et le traitement automatique des langues appliqués à l’arabe.
Ce même groupe d’étudiants a participé à un stage de découverte des manuscrits à Rabat la semaine du 28 mai 2023. Ce stage, organisé en partenariat entre le Centre Jacques Berque et l’Académie du Royaume, proposait la visite des principales bibliothèques marocaines (Bibliothèque nationale, bibliothèque Hassaniyya du Palais royal, Université de la Qarawiyyīn, Archives du Maroc) agrémentée de communications de chercheurs européens et marocains autour de leur travail sur les manuscrits. Les étudiants des universités françaises ont été rejoints pour l’occasion par un groupe de doctorants des universités marocaines.
Colloque « Écrire l’histoire au Maghreb (VIIe-XXe siècles) : auteurs, textes, manuscrits », les 10 et 11 juin 2024
En se consacrant aux sources et aux genres historiographiques arabes, le projet TariMa s'inscrit dans un renouvellement scientifique et méthodologique de la place accordée aux sources arabes pour écrire l'histoire du Maghreb. La numération et la philologique numérique renouvellent en parallèle les usages savants des sources écrites.
Pour rendre compte de ces renouvellements, le projet TariMa organise au centre Jacques Berque (Rabat) les 10 et 11 juin 2024 un colloque de clôture intitulé « Écrire l’histoire au Maghreb (VIIe-XXe siècles) : auteurs, textes, manuscrits ».