Présentation du portail Studens

Interopérabilité entre Omeka et Atom

La Cité des mémoires étudiantes vient de présenter à la Fonderie, Studens, un nouveau portail consacré aux mémoires étudiantes. Un projet réalisé par Limonade & Co ayant nécessité d’engager une démarche exploratoire dans plusieurs domaines : échanges de données, logiciels open-source, normalisation de la description archivistique et expérience utilisateurs.

1- Présentation du portail Studens

Studens, signifiant “étudiant”* en latin, est un nouvel outil d’aide à la recherche autour des mémoires étudiantes ayant pour ambition de reconsidérer cet objet historique par une approche plus transversale, abordant les thématiques des mouvements sociaux, jeunesses, institutions universitaires, etc. Ce portail vise à faciliter l’accès aux documents numérisés (témoignages oraux d’anciens responsables de mouvements étudiants, rapports, procès-verbaux, etc.) et aux instruments de recherche des fonds d’archives conservés au sein de différentes institutions. Il s’agit pour le public d’appréhender ces ressources via une mise en scène ludique sans pour autant négliger le caractère didactique de l’outil en proposant leurs contextes de production archivistiques et documentaires. Studens a également pour objectif de devenir l’entrepôt de référence des ressources archivistiques ou documentaires sur les mouvements étudiants en offrant des résultats de recherches issues du moissonnage des métadonnées d’archives ouvertes de plusieurs institutions patrimoniales. De la sorte, l’utilisateur ne dispose donc plus seulement des résultats d’interrogation d’une seule base de données, mais peut  effectuer une recherche simultanée dans plusieurs réservoirs d’enregistrements qui signalent, décrivent et rendent accessibles des documents d’archives en relation avec le monde étudiant.
S’inscrivant pleinement dans le mouvance des archives ouvertes, Studens joue également le rôle de fournisseurs de données, en exposant ses métadonnées à d’autres fournisseurs de service comme Gallica ou Europeana (pour ne citer qu’eux).

2- L’architecture du projet

Pour répondre aux exigences de valorisation, de recherche, de collecte et d’exposition des données de Studens, il a été fait le choix de marier trois logiciels open-source, ayant chacun une fonction bien précise : Omeka pour la valorisation des données, AtoM pour la description archivistique et celle du contexte de production, enfin WordPress pour l’éditorialisation du projet.

2.1 Les logiciels open-source

2.1.1 Présentation d’AtoM

Le logiciel AtoM (Access to Memory) est destiné à la gestion de descriptions archivistiques. Il a été développé par la société Artefactual, à l’initiative du Conseil International des Archives. Il repose d’ailleurs sur les quatre normes de description d’archives de cette même organisation professionnelle : ISAD(G) pour la description des fonds et des documents d’archives, ISDIAH pour les institutions de conservation, ISAAR pour la description des personnes et des organisations (producteurs d’archives par exemple) et ISDF pour décrire les fonctions de ces mêmes personnes et organismes. L’association de ces quatre normes permet de décrire précisément un fonds ou un document d’archives et son contexte de production, son histoire. Ainsi, une notice décrivant une photo sera liée à son photographe, à son agence jusqu’à l’institution qui conserve le cliché. Bien qu’il soit possible d’associer des contenus numériques à une notice (un fichier image, un contenu texte type .pdf), la force d’AtoM réside plus dans la précision apportée aux descriptions qu’à la gestion de médias numériques.
Dans le cadre du projet Studens, chaque institution partenaire pourra bénéficier de sa propre instance AtoM qui sera moissonnée automatiquement par le logiciel Omeka décrit ci-dessous.

2.1.2 Présentation d’Omeka

Ce logiciel open-source est orienté grand public et a pour mission première de valoriser des ressources numériques. Développé par le Roy Rozensweig Center for History and New Media, Omeka permet de mettre en scène simplement des médias numériques par la création d’expositions virtuelles, sans pour autant négliger la rigueur scientifique des projets puisque s’appuyant sur un standard d’encodage de métadonnées, à savoir le Dublin Core. Autre atout séduisant de cette solution, sa capacité à ouvrir ses données au moissonnage grâce au protocole OAI-PMH et de collecter également les données issues d’autres entrepôts.

2.1.3 WordPress : éditorialisation de Studens

Nous ne nous arrêtons pas sur une présentation exhaustive de WordPress tant ce CMS open-source est devenu incontournable auprès des bloggers et autres institutions pour sa facilité d’usage en matière de publication de contenus Web. Cette couche, placée au-dessus d’Omeka et Atom, est apparue comme essentielle dans l’éditorialisation du projet Studens, afin de permettre à ses équipes de proposer un contenu enrichi autour de ses actualités, partenaires, inventaires, etc. Il s’agissait aussi d’optimiser la question du référencement naturel de ce portail sur les moteurs de recherche comme qwant.

Architecture Studens Omeka Atom

Architecture du portail Studens.

Merci à Antoine Courtin (@seeksanusername) pour la schématisation de l’architecture du projet.

2.2 L’enjeu de l’interopérabilité : protocole OAI-PMH

En théorie, ces trois logiciels présentent un potentiel intéressant pour répondre aux exigences d’un projet comme Studens : l’un chargé de valoriser et d’ouvrir les archives des mémoires étudiantes, le deuxième de présenter l’environnement scientifique et historique des collections et fonds d’archives conservés par différentes institutions patrimoniales, le troisième pour renforcer le rayonnement de la plateforme. Afin de tirer pleinement profit des logiciels Omeka et AtoM, l’enjeu principal pour notre équipe a donc été de renforcer leur interopérabilité au moyen notamment du protocole OAI-PMH.

2.2.1 Principes généraux de l’OAI-PMH

OAI-PMH sont les initiales de Open Archive Initiative – Protocol for Metadata Harvesting. Ce protocole a pour objectif de favoriser l’échange et le partage des données entre systèmes d’informations de différentes initiatives. Ce protocole repose sur le format XML et la norme Dublin Core.

Grâce à ce protocole, il est ainsi possible à un musée de disposer de son propre catalogue et de l’enrichir par des notices d’autres institutions. L’utilisateur ne dispose donc plus seulement des résultats d’interrogation d’une source de données, mais peut effectuer une recherche dans plusieurs catalogues à la fois via une interrogation unique.
On distingue deux types d’acteurs dans le domaine de l’OAI-PMH : les fournisseurs de données et les fournisseurs de services (moissonneurs). Les premiers vont donner accès à leur données à travers leur « entrepôt OAI », tandis que les moissonneurs vont recueillir ces données pour les afficher via leur moteur de recherche.

2.2.2 Archives ouvertes et Studens

Omeka a ainsi développé son propre plugin se basant sur le protocole OAI-PMH, afin de permettre à ses utilisateurs d’ouvrir leurs données au moissonnage, mais également de collecter les données issues d’autres instances d’Omeka ou d’autres entrepôts de données.
Le projet Studens a su tirer avantage de ce plugin pour établir un lien entre notre deux logiciels principaux : en ouvrant AtoM au moissonnage, Omeka a ainsi pu collecter les métadonnées ISAD(G) pour ensuite les ventiler au sein des 15 éléments de description composant le Dublin Core.
Outre l’import automatique de métadonnées dans Omeka, ce schéma fonctionnel présente les intérêts suivants pour le portail Studens :

    • la saisie et la description des données ne se réalisent qu’une seule fois au sein d’AtoM. Dans la perspective d’une réutilisation de ces données, dans le cadre d’un projet de valorisation par exemple, cela représente un gain de temps appréciable pour l’archiviste et évite de dupliquer les informations inutilement.
    •  Le moissonnage se réalise automatiquement selon une fréquence déterminée et à intervalles réguliers. Cette amélioration du plugin d’origine a été pensé pour répondre aux besoins futurs de Studens qui hébergera rapidement plusieurs instances AtoM pour ses partenaires. Lancer un moissonnage manuel suite à l’ajout de nouvelles descriptions d’archives de chaque partenaire aurait été fastidieux et chronophage.

      moissonnage oai pmh

      Moissonnage automatique selon des rythmes programmés.

 

  •  Il s’agissait également de pallier à la perte des relations de hiérarchie entre les descriptions, dû au Dublin Core. Le plugin doit collecter les informations nécessaires dans AtoM afin de documenter les bonnes relations entre descriptions dans le logiciel Omeka. C’est ensuite le plugin Omeka Item Relations qui permet de créer les relations entre différentes descriptions : une série d’items peut ainsi être considérée comme appartenant à la description d’un fonds. Cela nous permet donc de recréer des hiérarchies entre descriptions qui sont absentes d’Omeka, mais qui sont un pilier de la description archivistique (ISAD-G).
  • Enfin, le schéma OAI-PMH permet de recueillir automatiquement des données dans l’instance AtoM depuis Omeka, afin d’enrichir la description archivistique d’un item (pièce). De la sorte, l’URL et les caractéristiques techniques d’un média (photo, vidéo, son, etc.) ajouté dans un item Omeka sont automatiquement reportés dans l’item équivalent AtoM.

 

Métadonnées issues du fichier sont rattachées à l’item Omeka  Voir la notice Atom Voir la notice Omeka

Métadonnées issues du fichier sont rattachées à l’item Omeka
Voir la notice Atom
Voir la notice Omeka

4- Réflexion autour d’ISAD(G)

Studens affiche la volonté de collecter un ensemble documentaire (non exhaustif) portant sur les mémoires étudiantes, y compris les documents d’archives audiovisuelles. La Cité des mémoires étudiantes possède par un exemple une remarquable collection de témoignages oraux d’anciens militants étudiants au format .mp3. Aussi, Studens devait-il suivre rigoureusement  la norme ISAD(G) ?

(Exemple du témoignage de Frédéric Borella http://documents.studens.info/collections/show/23)

3.1 Une adaptation d’ISAD(G) ?

Ce qui fait la force d’ISAD(G) peut également se révéler une faiblesse dans certains cas. ISAD(G) a été pensée pour convenir à la description de tous types d’unités archivistiques. Elle remplit ce rôle sans aucun doute, mais les films, les livres, les photographies, disposent de caractéristiques particulières qui sont souvent importantes lors de leurs descriptions ou dans l’exploitation des notices créées. Ces caractéristiques se retrouvent donc perdues au milieu d’autres éléments techniques, descriptifs ou historiques (histoire de l’archive) au sein de champs larges qui peuvent contenir bon nombre d’informations.

La notion de durée par exemple est intrinsèque aux documents audiovisuels, alors qu’elle n’a pas de sens en ce qui concerne un texte ou une photographie.
A partir de ces constats, il nous a paru intéressant de proposer un complément à la norme ISAD(G) pour la description de documents audiovisuels. C’est-à-dire conserver ce qui fait la force de cette norme – à savoir la description hiérarchisée, etc. – mais en y adjoignant des éléments permettant une description plus adaptée à cette typologie particulière.

4.2 Comparaison d’ISAD(G) avec d’autres normes

Ce travail, mené par Pauline Ziserman dans le cadre de son stage de fin d’étude INA Pro chez Limonade & Co, s’est construit autour d’une analyse critique et comparative de huit normes de description d’archives audiovisuelles (que ce soit pour des films ayant connu une exploitation commerciale, ou pour des archives audiovisuelles au sens large) ou ayant une visée plus large (c’est le cas notamment de ISBD(NBM)) qui concerne les descriptions de tous les éléments “non livre”) :

  • EN 15 907 : développée par le Comité Européen de Normalisation (CEN) en 2005, cette norme a pour objectif de permettre l’identification des oeuvres cinématographiques.
  • Z44-065 : développée par l’AFNOR (Association Française de Normalisation) en 1998, cette norme vise à permettre la description bibliographique de vidéogrammes.
  • ISBD(NBM) : il s’agit d’une norme destinée à la description des éléments autres que des livres (NBM signifie Non Book Material). Elle a été développée par la Fédération Internationale des Associations Bibliothécaires et d’Institution (IFLA) en 1987.
  • FIAF recommandations : la Fédération Internationale des Archives du Film (qui regroupe les institutions consacrant leurs activités à la sauvegarde des films) a développé The FIAF Cataloguing Rules for Film Archives en 1991.
  • IASA recommandations : développée par l’International Association of Sound and Audiovisual Archives, les recommandations concernant le catalogage ont été publiées en 1999.
  • VRA Core 4.0 : développé par la Visual Resources Association, VRA Core est une standard de description d’oeuvres culturelles visuelles, ainsi que des images qui les documentent.
  • PBCore : développée par la public broadcasting community aux Etats-Unis, PBCore se base sur le Dublin Core en l’adaptant aux spécificités liées à l’audiovisuel.
  • Video MD : développé par la Library of Congress, il s’agit d’un schéma XML permettant la description technique des archives audiovisuelles.

3.3 Modifications de la norme ISAD(G) pour produire ISAD(G)/AV

La norme ISAD(G)/AV est développée pour la description d’archives audiovisuelles en général et à répondre aux exigences de descriptions de fonds constitués de rushs, de reportages, de documentaires, d’entretiens, voire de films amateurs, etc. Les descriptions ne seront donc pas orientées vers la technique mais celle-ci doit permettre une meilleure exploitation des notices, de mieux cerner le type de document en question ainsi que de mieux retrouver ces documents.
C’est pourquoi, bien que nous ayons comparé certaines normes s’orientant largement vers une description technique des archives audiovisuelles, nous avons pris le parti de ne pas retenir trop de champs techniques afin de conserver un maximum de généricité à ISAD(G), tout en isolant les informations qui seraient exploitables dans le cadre de diffusion en ligne des médias décrits (streaming, etc.).

D’un point de vue fonctionnel, la norme développée sera accessible dans AtoM via un nouveau masque de saisie, maintenant le choix aux utilisateurs de sélectionner une norme différente s’il le souhaite. Un mapping des champs d’ISAD-G/AV avec ISAD-G permet ainsi que replacer le contenu des champs spécifiques dans des champs ISAD-G, mais sans possibilité de retour en arrière par contre.

masque-ISADG-AV-ATOM

Sélection du masque de saisi ISAD(G)/AV

Voici donc la norme ISAD(G)/AV, telle qu’elle sera utilisée par Studens qui choisira le masque de saisie correspondant dans AtoM. La norme ISAD(G) contient 10 zones de descriptions : seules les 4 premières ont été modifiées, les zones 5 à 10 n’apparaissent donc pas dans ce qui suit.
1- Identity Area
– Identifier
– Title
– Dates
– Level of description
– Extent and medium
– Item Type Metadata
– Duration
2- Context Area
– Name of creator(s)
– Creator role
– Contributor
– Contributor role
– Repository
– Archival History
– Immediate source of acquisition or transfer
3- Content and structure Area
– Scope and content
– Appraisal, destruction and scheduling
– Accruals
– System of arrangement
4- Conditions of access and use Area
– Conditions governing access
– Conditions governing reproduction
– Language of material
– Script of material
– Language and script notes
– Physical characteristics and technical requirements
– Physical Format
– Digital Format
– Data Rate
Pour vous permettre d’en savoir plus sur ce travail d’adaptation de la norme ISAD(G) à l’audiovisuel, nous vous proposons de télécharger une étude complète sur ce sujet.

Télécharger l’étude

4- Expériences utilisateurs

Pour être jugé comme performant, un site Web a non seulement besoin de répondre à des exigences techniques, fonctionnelles, éditoriales et de contenus mais aussi à des exigences de navigation, d’ergonomie et d’émotion. Aussi, dans le cadre du projet Studens, nous avons tenté de rapprocher le plus possible l’utilisateur de la ressource documentaire selon deux approches.

4.1 Le “clic utile” et la structure narrative

Les fonctionnalités sur le socle Omeka se veulent volontairement minimalistes pour permettre à l’utilisateur d’optimiser le “clic utile”, à savoir accéder à la ressource documentaire le plus rapidement possible. En un clic, l’utilisateur peut ainsi soit prendre connaissance :

  • des expositions créées par Studens (accès par la barre de navigation principale + pied de page)
  • des collections d’items (accès par la barre de navigation principale + pied de page)
  • des fonds inventoriés (accès par la barre de navigation principale)
  • d’un item qui lui permettra de rebondir sur un corpus documentaire (pied de page).

Une fois immergé dans un item (une ressource documentaire), l’utilisateur le parcourt selon une structure narrative proche du conte et du célèbre “il était fois” pour dérouler son histoire : description, date de production, créateur, caractéristiques, etc. Ce parti pris vise à sortir d’une logique purement archivistique pour permettre à l’utilisateur de s’affranchir de normes métiers peu évocatrices pour lui et de se créer son propre parcours. Au terme de son expérience, l’objectif final de cette structure narrative est de créer une relation forte entre l’utilisateur et le portail Studens. Il s’agit de provoquer chez l’usager un acte d’engagement pouvant se traduire par le désir d’aller plus loin dans sa démarche en consultant le socle AtoM par exemple ou de partager le contenu du site sur les réseaux sociaux afin de faire la promotion du portail.

notice-omeka-experience-utilisateur

4.2 AtoM et la découverte archivistique

Conscient du caractère didactique du portail, l’approche scientifique n’est pas le parent pauvre de Studens. L’utilisateur a en effet à la possibilité de basculer à tout moment dans l’univers de l’outil métier d’AtoM au clic du bouton “Consulter la source de cet item”.
En opérant ce basculement d’univers, l’utilisateur pourra embrasser le document d’archives dans son ensemble (vision globale des collections, des fonds, norme ISAD(G)) et de découvrir l’approche de l’archiviste.
N’hésitez pas à nous faire part de vos remarques pour échanger sur ce portail
Article co-écrit par Benjamin Suc, Christophe Jacobs et Pauline Ziserman
*Au participe présent, et non en tant que substantif (pour les puristes).

Posted in:

Laisser un commentaire