Laboratoire : CHEC
Porteur de projet : M. Blaise PICHON / Florian BARET
Site : ARCHEOLOIE-DOC
Thibault FALVARD, Ingénieur de Recherche en Informatique à l'Université Clermont Auvergne
Il prend en charge dès l'expression du besoin l'analyse et la réalisation de projets liés à la gestion de données. C'est le représentant pour les SHS au sein du projet AUDACE (Auvergne Data Cloud Académique) qui vise à un mettre en place en Auvergne un centre de traitement des très grands volumes de données scientifiques.
Il s'agit de mettre en place un process qui permette de valoriser, stocker, pérénniser et diffuser le travail des chercheurs. Ce process est en cohérence avec les ressources locales (matérielles et humaines) et les infrastructures nationales HUMA-NUM.
La valorisation des données est faite au travers d'un sites web, puis d'un travail sur les méta-données.
Le stockage et la pérennisation sont réalisés sur une infrastructure locale mutualisée (CRRI) constituée autour du Mesocentre Clermont Auvergne. Ces données sont accessibles directement par les chercheurs (consultation, mises à jour...) au travers des sites web de corpus, et sont bien évidemment stockées dans une base de données (MariaDB). Ces bases de données, nous permettent de réaliser par l'intermédiaire des sites de corpus (accessibilité) des traitements en temps réel, eux mêmes accessibles via les sites web de corpus.
Quelques exemples de traitements des données, sans intervention préalable, et toujours accessibles :
Après retraitements, les données (ressources et méta-données) sont exportées soit localement, soit nationalement pour être mises à disposition de la communauté scientifique.
Dans le cadre des revues, en général la réalisation du site web est le prélude au passage sur le portail national des revues en sciences humaines revue.org.
La création de ces sites a pour objet de valoriser le travail des chercheurs sur des projets spécifiques qui ne s'inscrivent pas dans la démarche de réalisation d'un CORPUS.
La MSH propose une infrastructure dont le but est de faciliter le travail collaboratif sur les projets.
Cette Plateforme permet :
Pour l'instant, la plateforme compte 29 Extranets ouverts qui correspondent à autant de projets en cours, et 12 Extranets fermés (projets terminés).
Contrairement aux trois thématiques précédentes, ce travail est plus ponctuel et plus ciblé. Il s'agit de répondre à des demandes très précises (par exemple, la mise en place d'un forum...).
L'image présentée (lien du titre) permet d'avoir une idée globale de la gestion des données à travers la description d'un processus de création de contenus.
Tout part de l'incubateur de projets (où l'on crée, organise, met en forme ... les données qui peuvent par exemple être celles d'un corpus), puis passe vers le site web (où l'on valorise ces données et où l'on enrichit les contenus de méta-données), afin d'aboutir dans tous les cas à deux endroits, ISIDORE qui indexe ces données et la Plateforme de stockage HUMA-NUM qui expose ces données. Dans certains cas très particuliers, ces données peuvent également être archivées au CINES.
Aurelia Vasile, Ingénieur d’études en analyse de traitement de données, CNRS
Elle accompagne les chercheurs pour adopter de bonnes pratiques dans la gestion de leurs données et dans le travail de structuration, de normalisation et mise en place de protocoles de collecte de données. Elle est également en charge de développer les relations avec la TGIR Huma-Num et de proposer aux chercheurs de méthodes et d’outils d’analyse et de traitement.
1 - Structuration des fonds d’archives destinés à être exploités dans la cadre des projets de recherche ou collectés par des chercheurs. Description standardisée : norme ISAD(G), XML-EAD.
2 - Accompagnement des chercheurs dans la description des données : métadonnées Dublin-Core, Dublin-Core qualifié, métadonnées du modèle « DataCite Metadata Schema » pour la création de DOI (Digital Object Identifier)
3 - Exploration de méthodes et d’outils pour l’exploitation et l’analyse des données : Analyse de réseaux, Datavisualisation, Analyse et/ou structuration des textes (traitement automatique des textes non structurés, XML-TEI).
Laboratoire : CHEC
Porteur de projet : M. Blaise PICHON / Florian BARET
Site : ARCHEOLOIE-DOC
Laboratoire : CHEC
Porteur de projet : M. Stéphane Gomis
Site : Atlas historique Auvergne, Bourbonnais, Velay
Laboratoire : CHEC
Porteur de projet : M. Blaise PICHON
Site : CORREZEARCHEO
Laboratoire : MSH
Porteur de projet : Mme Mauricette FOURNIER, M.Stéphane Gomis
Site : Delecluze
Laboratoire : CHEC
Porteur de projet : M. Julien BOUCHET
Site : Les justes d'Auvergne
Laboratoire : IHPC (CEHRAC)
Porteur de projet : M. Dominique DESCOTES
Site : Les provinciales
Laboratoire : ACTé
Porteur du projet : Mme Emmanuèle AURIAC
Site : Philosophèmes