2020-2023 | ANR CHAMDOC

Projet coordonné par Anne-Valérie Schweyer

ChamDoc, pour Cham Documentation, est un projet pluridisciplinaire qui vise à préserver le patrimoine culturel du peuple cham au Vietnam. 

Mots clefs : Vietnam, Cham, inscriptions, manuscrits, cham ancien, cham moyen, extraction et analyse de caractères, intelligence artificielle.

Le projet CHAMDOC se cristallise autour d’un constat: au Vietnam, faute de transmission, le patrimoine cham écrit est en voie de disparition, qu’il s’agisse des inscriptions ou des manuscrits les plus anciens. A cause de la rupture culturelle de la seconde moitié du 20e siècle au Vietnam, le pays n’a pas formé de relève scientifique en épigraphie et en paléographie cham et ainsi, la nouvelle génération de chercheurs qui reprend les études historiques est coupée de ce type de sources. Depuis 1832, les Chams sont en cours d’assimilation par l’état vietnamien, dont l’écriture est exclusivement romanisée depuis 1920, et les langues à écriture alpha syllabique comme le cham sont en train de disparaître et, avec elles, tout un pan de l’histoire et de la culture du pays. Pourtant, le peuple cham a connu une histoire riche et mouvementée entre son épanouissement dans des royaumes sur les côtes du Vietnam du début du 1er millénaire à 1471, puis sa contraction dans un petit royaume au Sud du Vietnam jusqu’en 1832, et enfin sa dispersion en diaspora. Chaque étape de son histoire s’est accompagnée de textes reflétant son fonctionnement socio-politico-religieux : des inscriptions en sanskrit et en cham ancien du 6e au 15e siècle ; des manuscrits en cham dit moyen sur feuilles de latanier ou sur papier à partir du 18e siècle ; des manuscrits en cham dit moderne au cours de l’époque coloniale française. 

Le projet se propose d’offrir à l’histoire du Vietnam la possibilité d’avoir accès à ces documents aux langues aujourd’hui disparues : le cham ancien et le cham moyen. Grâce à l’étroite collaboration entre chercheurs en SHS et en Informatique, il devient possible d’inverser cette fatalité et de proposer un projet portant sur la reconnaissance et l’analyse automatiques des caractères et des mots chams dans deux types de documents : des inscriptions et des manuscrits. 

Afin d’éviter la disparition de ces écritures alpha syllabiques, le projet CHAMDOC veut développer des méthodes de traitement, d’analyse et de reconnaissance des images, basées sur des techniques d’intelligence artificielle, pour permettre une lecture automatique des sources (inscriptions en cham ancien et en sanskrit jusqu’au 17ème siècle, manuscrits en cham moyen des Archives royales du Panduranga entre 1702 et 1850), puis leur indexation en vue d’une plus large exploitation. 

Le projet CHAMDOC est un projet pluridisciplinaire, unique et novateur. Son objectif est la conception et le développement de méthodes et d’outils numériques innovants d’extraction et d’analyse des caractères provenant d’anciens documents écrits. Plus précisément, quatre objectifs seront poursuivis : 

- le recueil, l’analyse et l’indexation des documents écrits en cham ancien et cham moyen;

- le développement de méthodes de reconnaissance des formes basées sur des techniques d’intelligence artificielle  pour analyser le contenu des images d’inscription et de manuscrit en cham;

- l’indexation des contenus pour permettre de créer et d’exploiter des liens sémantiques entre les sources documentaires; 

- la sauvegarde pérenne et la mise en valeur d’un patrimoine culturel unique. 

Les partenaires du projet sont des chercheurs en informatique spécialisés en extraction automatique de contenus (L3i et MICA) et en SHS sur les Cham (CASE et LSS); Ensemble ils veulent faire passer le patrimoine Cham écrit à l’ère du numérique et donner une impulsion nouvelle à cette documentation. Le projet se positionne dans le domaine des humanités numériques., alliant SHS et Sciences de l’informatique. Il s’inscrit dans l’axe « Culture, créations, patrimoine ». Il vise à préserver

Les partenaires du projet sont des chercheurs en informatique spécialisés en extraction automatique de contenus (L3i et MICA) et en SHS sur les Cham (CASE et LSS). Ensemble, ils veulent faire passer le patrimoine cham écrit à l’ère du numérique et donner une impulsion nouvelle à cette documentation. Le projet se positionne dans le domaine des humanités numériques, alliant SHS et Sciences de l’informatique. Il s’inscrit dans l’axe «Culture, créations, patrimoine». Il vise à préserver l’histoire et le patrimoine culturel du peuple Cham au Vietnam.