Nouveau projet Calfa de sauvetage d’archives de la presse arménienne

Vue de la Librairie Samuélian (Paris)
Librairie Samuelian (Paris)

English version

La librairie orientale Samuelian, fondée à Paris en 1930, est un célèbre haut-lieu intellectuel de la diaspora arménienne ayant accueilli journalistes, chercheurs, historiens, ainsi que leur matériel de travail : livres ou de titres de presse.
Depuis sa fermeture il y a une dizaine d’années, les collections de journaux qui y sont stockées se dégradent inexorablement. Avec les années, l’état des documents est devenu critique et certains ne sont parfois plus manipulables.

Avec le soutien de la famille Samuelian sensible à la valeur de ces archives, et grâce au soutien financier apporté par la fondation Calouste Gulbenkian, Calfa va pouvoir mener sur place une opération de sauvetage. Son enjeu est non seulement d’immortaliser ces journaux par la numérisation, mais aussi de les rendre de nouveau accessibles au public grâce à leur OCRisation et leur publication en ligne par la Fundamental Scientific Library (FSL) de l'Académie des Sciences d'Arménie, également partenaire du projet.

Différents journaux arméniens
Divers journaux disponibles en attente de numérisation

Les archives concernées sont principalement des journaux de la diaspora arménienne, publiés entre 1920 et 1975, pour un total estimé entre 10 000 et 15 000 pages. Les titres édités en France dans les années 1930 sont très bien représentés. Il n’existe pas encore de liste exhaustive des titres disponibles, mais un premier inventaire a permis d’en identifier plus de 70 différents, publiés dans plus de 30 pays de la Diaspora arménienne. On peut citer par exemple :

  • France
    • la revue Երկունք (Paris, 1929-1936), publiée par Chavarch Nartouni
    • la revue Զուարթնոց (Paris, 1929-1964), publiée par Hrant Palouyan
    • la revue Կեանք եւ Արուեստ (Paris, 1931-1940), publiée par les frères Barsamian
    • la revue Օշական (Paris, 1920-1921)
    • la revue Ցոլք (Paris, 1928), publiée par Vahram Gakavian
  • Liban
    • Ազդակ (Beyrouth, 1927 - en cours)
    • Զարթօնք (Beyrouth, 1937 - en cours)
  • Égypte
    • Լուսարձակ (Le Caire, 1926-1928)
    • Լուսաբեր (Le Caire, 1904-1908)
  • Grèce
    • Նոր օր (Athènes, 1923-1944)
  • Turquie
    • Շողակաթ (Constantinople, 1952-1995)
    • Djem (Constantinople, 1911)
  • Roumanie
    • Հայ մամուլ (Bucarest, 1934 - 1942)

De grands plans de numérisation de la presse arménienne sont actuellement en cours dans le monde, notamment soutenus par la fondation Calouste Gulbenkian dans ses efforts pour la numérisation et la préservation des textes en arménien occidental. Dans ce cadre, la numérisation du journal Haratch par l’association ARAM et la BULAC (France) à partir de 2011, puis de la presse arménienne de la Congrégation des Pères Mekhitaristes de Vienne (Autriche) par la Fundamental Scientific Library de NASRA à partir de 2019, a permis la création d’immenses bases de données interrogeables et accessibles au grand public : cliquer pour accéder à la base de données.

Dans la lignée de cette dynamique, les équipes de Calfa ont commencé le travail d’inventaire des journaux stockés à la librairie Samuelian. Par la suite, l’ensemble de ces pages sera numérisé. Calfa OCR sera ensuite utilisé sur ces pages pour extraire le texte.

Développé spécialement par Calfa pour les journaux en arménien, l’OCR permet de restituer les textes imprimés dans les journaux sous une forme numérique, éditable et interrogeable. Enfin, les fichiers numérisés et leur texte retranscrit iront rejoindre la bibliothèque numérique de la FSL.

Exemple d'analyse sur journal Haratch
Exemple de détection de contenu dans le journal Haratch - © Calfa

Nous vous tiendrons régulièrement informés sur le blog et nos différents réseaux de l’avancement du projet et de nos découvertes, alors restez connectés !

Partenaires du projet
Logo de la fondation Gulbenkian Logo de la FSL

Calfa Team