L’outil Minet pour Instagram et Panoptic
Panoptic : Explorer de grands corpus d’images à l’aide de la reconnaissance de similarités
Tableau Public : visualiser et analyser des bases de données
L'HTR/OCR en LSHS
Europresse pour les LSHS
TXM pour l’analyse de corpus de textes
Excel est un logiciel de tableurs particulièrement connu pour être propice à la réalisation de calculs et de graphiques à partir de données numériques. Il est également tout à fait possible de l’utiliser pour manipuler des objets textuels. Cela est particulièrement pertinent lorsque des chercheur·euses disposent déjà de données formatées pour ce logiciel, ou bien enregistrées en format .csv (car elles ont été inscrites à la main par les chercheur·euses dans ce logiciel, parce qu’un logiciel de collecte a permis de construire un corpus dans le format .csv, ou encore car des jeux de données sont partagées en open data dans ce format). L’usage d’Excel pour l’analyse de textes est également pertinent lorsque le coût de migration d’un corpus déjà constitué vers des logiciels de textométrie est trop important, ou bien n’est pas nécessairement pertinent pour la question de recherche qui est en jeu.
Objectifs
- Maîtriser les fondements conceptuels de l’activité de modélisation, entendue comme démarche d’explicitation permettant de passer des connaissances implicites à des données partageables
- Évaluer les apports scientifiques, pratiques et heuristiques de la phase de modélisation d’un projet de recherche en SHS visant la production et la diffusion de données
- S’orienter dans les concepts informationnels et techniques convoqués dans les pratiques de production et de gestion des données de la recherche (identifiant, IRI, base de données, graphe de connaissances, entité, relation, modèle, thésaurus, ontologie, web sémantique, document numérique…)
- Comprendre les liens techniques et informationnels existant entre modélisation et application des principes FAIR
- Organiser le travail entre recherche, modélisation et informatique
Contenus
- Principes du modèle RDF & notion de données ouvertes et liées
- Décryptage de l’ontologie CIDOC-CRM : principes de fond, étude de la documentation, présentation de cas concrets
- Survol des autres ontologies de la famille CIDOC-CRM
- Bonnes pratiques de modélisation pour représenter les connaissances et les sources, leur contexte historique et leur contexte de production