Où stocker les autorisations des locuteurs, et les métadonnées confidentielles? #8

alexis-michaud · 2017-09-14T14:44:22Z

Il faudrait avoir un lieu où stocker, de façon non publique,

les autorisations signées par les locuteurs, si on en a
et les métadonnées confidentielles concernant les locuteurs. Pour la recherche, c'est utile en principe d'avoir le plus d'infos possibles sur les locuteurs: date de naissance, lieu de naissance, expérience linguistique, taille/poids, antécédents médicaux, et plein d'autres. Bien sûr il ne faut pas mettre ça en libre accès.

Où est-ce que ça pourrait être stocké, de façon à ce que ce soit bien archivé (=pas à la merci d'un oubli lors d'un passage d'un disque à l'autre, d'un serveur à l'autre...) et bien relié aux ressources concernées?

Tavalmayam · 2017-09-14T15:57:54Z

Bonne question. Pour info, ces deux points sont remarquablement bien gérés par le logiciel de transcription SIL SayMore <https://software.sil.org/saymore/screenshots/>, que nous utilisons déjà comme un input possible pour Pangloss. Donc si nous créons un lieu dans Pangloss où stocker ces infos, il faudrait qu'elles soient récupérables automatiquement à partir de l'interface de SayMore.

sguillaume · 2017-09-16T23:47:04Z

Je pense, pour commencer, qu'il nous faut réfléchir à un lieu de stockage pour ces informations.
Qu'elles soient récupérables ou non pour un logiciel particulier est secondaire.
D'autant plus que SayMore n'est pas tellement utilisé et surtout les imports c'est juste galère.
S'il fallait absolument choisir un outil je dirais qu'Arbil est plus logique.

Bref, trouvons déjà une solution de stockage.

Tavalmayam · 2017-09-17T12:32:58Z

Quel lieu de stockage proposes-tu?

…

------------------------------

alexis-michaud · 2017-09-17T12:37:30Z

Ca serait du ressort de Nakala, non?

Tavalmayam · 2017-09-17T13:09:45Z

Ce sera sûrement sur HumaNum, puisque tout va bientôt se trouver là-bas. Donc peut-être Nakala, je ne sais pas. Mais cela prendrait quel format? un gros fichier Xml de métadonnées? des fichiers séparés, un par ressource??

…

------------------------------

alexis-michaud · 2017-09-17T13:30:55Z

Pour les autorisations, ce serait fichier par fichier. Allez je me lance. Syntaxe du nom de fichier :

(je crois que j'ai maxi 1 autorisation par an)

et aussi "CC" pour "CreativeCommons", quand c'est ça la licence choisie.

Exemple : NRU_F4_2017_CC.pdf

Je laisse le format d'origine : JPG, PDF... Ce sont des scans ou photos du document papier signé.

Je crée un dossier "licenses_authorizations" dans le repositoire GitHub "Pangloss". Je proposerais qu'on mette tout à plat.
Question à Séverine : souhaites-tu qu'il y ait 1 dossier par déposant? Ou on met tout à plat dans le même dossier? Pour l'instant je mets tout à plat.

Ensuite, dans les métadonnées des documents (=pour chaque document), on ajouterait la référence au fichier scanné.

Les métadonnées, j'en garde 1 copie dans le document Excel qui me sert pour la saisie (et dont les métadonnées sont extraites par un script de Séverine lors des dépôts).

Cf discussion #45

alexis-michaud · 2019-07-02T09:44:17Z

Une info en direct de la Journée d'étude "Questions éthiques & cadre juridique autour des corpus langagiers" : le laboratoire ICAR (Lyon) scanne et conserve les autorisations écrites dans un stockage numérique hors réseau : disques durs en "armoires fortes" à accès restreint.

alexis-michaud · 2021-02-10T20:29:42Z

@sguillaume si tu avais l'occasion de lancer la discussion à l'échelle de Cocoon...?
Pour lutter contre la déperdition de métadonnées et de documents papier (de même qu'on lutte contre la déperdition de données). Ce n'est pas évident de remettre la main sur des documents qu'on garde quelque part sans lieu de dépôt.

alexis-michaud · 2022-03-08T13:48:35Z

En direct d'une journée de formation "La protection des données personnelles dans les projets de recherche" : même demande émanant d'autres projets et d'autres unités de recherche. Huma-Num ni le CINES ne considèrent être directement responsables d'héberger des autorisations. Un travail est nécessaire pour articuler l'archivage des données (archivage pérenne) avec l'archivage de données à caractère personnel, plus souvent traité en termes d'archivage courant et archivage intermédiaire. Un archivage pérenne de "méta-documents" est-il possible ?

À suivre.

sguillaume · 2022-07-04T13:37:50Z

Pour la conservation des autorisations des locuteurs (et autres) et des informations de métadonnées non diffusables :

Stocker au niveau de la personne ? du labo ? d'une institution ?

Idée :

Stocker au niveau du labo sur l'espace Lacito de l'Huma-Num Box. Doubler par une conservation papier ? Sur la baie ?
(Mais pas de pérennité dans la sauvegarde car pas d'archivage)
Il n'y a aucune solution directement pérenne aujourd'hui.
Mais les questions commencent à se poser, il serait intéressant d'anticiper en commençant avec un lieu de sauvegarde temporaire et une structuration dans le stockage et la description en attendant un versement dans un lieu plus pérenne

Propositions pour le stockage :

crypté ou non ?
Un répertoire par déposant
-> le document dans son format original (plus une version pdf ?)
un tableur listant toutes les autorisations ainsi que la liste des ressources concernées par l'autorisation ?
-> Définir un fichier type
-> Lister les ressources, corpus, langues qui sont concernés par une autorisation (il faut conserver l'information de quelle autorisation pour quel ensemble de données). Avec leur identifiant oai et ark au minimum.

Est ce que l'on fait un tableur par déposant ou un csv général ?
Un tableur général permettra une meilleure vue d'ensemble de ce que l'on stocke.

maxime-fily · 2023-08-24T15:38:55Z

Je souscris totalement à la proposition de @sguillaume : stockage en local. Ma pierre à l'édifice : archivage sur bandes magnétiques. C'est encore largement utilisé, mais je ne sais pas si c'est aisé à mettre en place. un article du monde informatique en parle : https://www.lemondeinformatique.fr/actualites/lire-pourquoi-l-archivage-sur-bande-est-toujours-d-actualite-73237.html
A voir...

alexis-michaud referenced this issue in CNRS-LACITO/Pangloss_website Sep 17, 2017

Création dossier pour autorisations, et copie premiers fichiers image

040212d

Cf discussion #45

alexis-michaud assigned sguillaume Dec 21, 2020

alexis-michaud added enhancement New feature or request help wanted Extra attention is needed labels Feb 10, 2021

alexis-michaud unassigned sguillaume Jun 10, 2022

alexis-michaud transferred this issue from CNRS-LACITO/Pangloss_website Oct 19, 2022

alexis-michaud mentioned this issue Jan 31, 2024

Où stocker les métadonnées (généralement confidentielles) concernant les locuteurs? CNRS-LACITO/website#17

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Où stocker les autorisations des locuteurs, et les métadonnées confidentielles? #8

Où stocker les autorisations des locuteurs, et les métadonnées confidentielles? #8

alexis-michaud commented Sep 14, 2017

Tavalmayam commented Sep 14, 2017 via email

sguillaume commented Sep 16, 2017

Tavalmayam commented Sep 17, 2017 via email

alexis-michaud commented Sep 17, 2017

Tavalmayam commented Sep 17, 2017 via email

alexis-michaud commented Sep 17, 2017 •

edited

Loading

alexis-michaud commented Jul 2, 2019 •

edited

Loading

alexis-michaud commented Feb 10, 2021

alexis-michaud commented Mar 8, 2022

sguillaume commented Jul 4, 2022 •

edited

Loading

maxime-fily commented Aug 24, 2023

Où stocker les autorisations des locuteurs, et les métadonnées confidentielles? #8

Où stocker les autorisations des locuteurs, et les métadonnées confidentielles? #8

Comments

alexis-michaud commented Sep 14, 2017

Tavalmayam commented Sep 14, 2017 via email

sguillaume commented Sep 16, 2017

Tavalmayam commented Sep 17, 2017 via email

alexis-michaud commented Sep 17, 2017

Tavalmayam commented Sep 17, 2017 via email

alexis-michaud commented Sep 17, 2017 • edited Loading

alexis-michaud commented Jul 2, 2019 • edited Loading

alexis-michaud commented Feb 10, 2021

alexis-michaud commented Mar 8, 2022

sguillaume commented Jul 4, 2022 • edited Loading

maxime-fily commented Aug 24, 2023

alexis-michaud commented Sep 17, 2017 •

edited

Loading

alexis-michaud commented Jul 2, 2019 •

edited

Loading

sguillaume commented Jul 4, 2022 •

edited

Loading