Du 5 au 10 septembre 2021 se tiendra à Lausanne (Suisse) la 16e édition de l'ICDAR, premier événement international pour les scientifiques et les professionnels impliqués dans l'analyse et la reconnaissance de documents, un domaine d'une importance croissante à l'ère actuelle de la transition numérique. La conférence rassemblera plusieurs centaines d'intervenants du monde public et privé pour présenter les dernières avancées en analyse automatique de documents imprimés et manuscrits, et les projets en cours en Humanités Numériques.
Notre équipe sera présente à Lausanne et est très fière d'y présenter 4 articles sur nos derniers développements et projets.
Nous y présenterons avec Noëmie Lucas (GIS MOMM/CNRS) et Clément Salah (Sorbonne Université, Université de Lausanne) nos modèles d'HTR pour les manuscrits en écriture arabe maghrebi. Le workshop sera l'occasion de diffuser le dataset RASAM (Recognition and Analysis of Scripts in Arabic Maghrebi) que nous avons constitué de janvier à avril 2021 et qui permettra à la communauté des chercheurs d'avancer dans le traitement automatique des manuscrits arabes.
Pour en savoir plus (résultats intermédiaires):
1. Chahan Vidal-Gorène, Noëmie Lucas, Clément Salah, Aliénor Decours-Perez, Boris Dupin, "RASAM - A Dataset for the Recognition and Analysis of Scripts in Arabic Maghrebi", Arabic and Derived Script Analysis and Recognition, ICDAR, 2021.
Nous y présenterons deux articles : le premier est en collaboration avec Jean-Baptiste Camps (École Nationale des Chartes-PSL, Centre Jean Mabillon) et Marguerite Vernet (École Nationale des Chartes-PSL) sur la question de la lecture automatique des abréviations dans les manuscrits latins, et la comparaison de différentes approches, en particulier celle de Calfa ; le second article concerne la classification automatique des écritures arméniennes : l'intelligence artificielle voit-elle autre chose que les écritures erkat'agir, bolorgir, nōtrgir et šłagir ?
2. Jean-Baptiste Camps, Chahan Vidal-Gorène, Marguerite Vernet, "Handling Heavily Abbreviated Manuscripts: HTR engines vs text normalisation approaches", Computational Paleography, ICDAR, 2021.
3. Chahan Vidal-Gorène, Aliénor Decours-Perez, "A Computational Approach of Armenian Paleography", Computational Paleography, ICDAR, 2021.
Nous y introduirons pour la première fois notre plateforme d'annotation Calfa Vision, dédiée à la transcription assistée de documents manuscrits et imprimés, et à la création automatisée de données pour les langues orientales et peu dotées comme l'arménien, le syriaque ou l'arabe. Les modèles intégrés à la plateforme sont spécialisés sur les collections en cours de traitement sur la plateforme et évalués sur des datasets classiques de l'état de l'art.
En savoir plus sur Calfa Vision: Accéder à la plateforme
4. Chahan Vidal-Gorène, Boris Dupin, Aliénor-Decours Perez, Thomas Riccioli, "A Modular and Automated Annotation Platform for Handwritings: Evaluation on Under-resourced Languages", ICDAR, 2021.