Ingénieur(e) en ingénierie logicielle à la MRSH F/H
Lieu de travail : MRSH - Pôle document numérique - Campus 1
Mission :
Assurer la conversion en XML TEI d'un corpus documentaire d'une trentaine de volumes déjà encodés en XML. Développer le moteur d'affichage du portail numérique de la CAG, assurer la normalisation des marqueurs d'indexation et l'alignement avec le thesaurus PACTOLS.
Contexte de la mission :
La Carte Archéologique de la Gaule (CAG) est un pré-inventaire bibliographique complété par des données provenant de rapports ou de notices conservés par les Services régionaux de l'archéologie. Les informations ainsi regroupées ont fait l'objet de vérification (y compris sur le terrain), de recoupements critiques pour éviter les doublons. La collection a également recours aux spécialistes régionaux qui ont l'avantage de bien connaître leur territoire de recherche. La CAG réunit plus de 120 volumes et couvre plus de 85 départements.
Un projet de mise en ligne des informations de ces ouvrages a été initié en 2016 par le PDN de la MRSH de Caen. A ainsi été mise en place une chaîne de traitement permettant de convertir les ouvrages papiers en format numérique XML-EAD destiné à être diffusé sur un portail unique regroupant l'ensemble des informations archéologiques à l'échelle nationale. Le projet évolue maintenant vers le traitement du corpus textuel avec un encodage respectant les recommandations de la Text Enconding Initiative.
Une des avancées attendues de la mission réside dans l'alignement de l'indexation de la CAG avec les PACTOLS pour permettre l'ouverture des données à l'international.
L'ingénieur(e) travaillera essentiellement sur des données textuelles encodées en XML.
L'ingénieur(e) recruté(e) travaillera sous l'autorité du directeur et du responsable technique du PDN. Il sera, pendant toute la durée de la mission, en lien constant avec les ingénieurs du PDN qui travaillent sur le dossier de numérisation de la CAG.
Activités :
Définir le schéma TEI adapté à la CAG
Définir et mettre en oeuvre les procédures de conversion de l'ensemble des volumes déjà encodés en XML EAD
Développer le portail de consultation numérique de la CAG, en s'appuyant sur le Moteur d'affichage XML (MaX) développé par le PDN et le CERTIC
Définir et mettre en oeuvre les procédures d'alignement avec les PACTOLS
Documenter l'activité
Conditions de recrutement :
Recrutement à temps complet, dans le cadre d'un contrat de projet.
Poste ouvert uniquement aux contractuels
Rémunération statutaire et appréciée en fonction de l'expérience professionnelle
Poste à pourvoir : en novembre 2024, jusqu'en novembre 2025.
Date limite de candidature : Avant le 14/11/2024
Catégorie d'emploi : A - Ingénieur d'études
Compétences attendues :
Connaissances
Applications métiers (git, XML et technologies associées)
Technologies du web sémantique et du traitement automatique de la langue
Archéologie et ses spécificités scientifiques
Savoir Faire
Génie logiciel ? Méthode d'analyse et de conception
Langage de programmation (python et technologies XML)
Méthodes de modélisation et de développement
Rédiger et mettre à jour la documentation fonctionnelle et technique
Diagnostic et résolution de problèmes
Savoir être
Travailler en équipe

Offre terminée le 13 novembre 2024 à 00:00