Participants (57) : - Daniel Bartolo - Clément Mayer - Nicolas Landel - Heytem Boumaza - Corentin Boidot -Cedric Meurée - Margaux Duhayun - Jeremie Abiteboul -Eric Boniface -Ana Ulianovici -Dominique Doquang -Adriana Nava -Adrian Nesonson -Anthéa Serafin -Data Sud -Enguérand Acquarone -Aurélien Bourgais -Céline Jacques -Checci alix -Julie Bec -Justin Boulant -Katleen Blanchet -Farid Ahamada -Fernando Abarca -emilie rannou -Guillaume A -T S -Youssef Horchani -Team Arkea Cycling -Paul-Marie -Grégoire Mialet -Clotide Tp -Philippe Neveux -Milton Minervino -Victoire -Wacim B -Sebastien Quinault -Elise P -Johanna P - Amine Saboni - Cloelia Tissier - Eric Chau - Faboien Faivre - Fernando Abarca - Grégoire Martinon (Quantmetry) - Justine Boulant - Katleen - Marie Lange - Seyda Irani - Olivier Auradou - Shintaro Mascia - Théo Alves Da Costa - Paul Rengade -Mickael Fine - Achat voiture - Anthéa Séfarin - Yann Mallegol - Paul-marie - Olivier -occitanie data - Emilie Sirvent-Hien -Valentin Defour - ndjekoua sandjo jean - nicolas Justinien
- Nouvelle saison Data For Good, élaboration du MOOC “Data Science Responsable et de Confiance”
- Présentation par Grégoire Martinon de Quantmetry sur les biais algorithmiques
- Présentation par Ana Ulianovici et Theo Alves de Ekimetrics de leurs travaux sur la fairness
- Présentation par Thomas Souverain de Dreamquark du Whitepaper "State of ethical AI in 2021"
- Présentation d'Occitanie Data et de sa charte éthique
- Gouvernance du référentiel d'évaluation (suite 22.02.2021)
- Dernières évolutions de la plateforme d'évaluation
Lors de cette nouvelle saison de Data for Good, Labelia Labs (ex- Substra Foundation) a demandé l'aide de la communauté de bénévoles Data Scientists / Designers / Développeurs de Data For Good pour construire le premier MOOC de la Data Science Responsable et de Confiance ! Pendant 3 mois jusqu'à fin juin, les bénévoles se réunissent tous les mercredis pour construire les briques de cette formation accompagnés de Sarah et Appoline qui apportent leur expertise de la pédagogie. Une première version de ce MOOC sera disponible fin juin !
Appel à contributions : vous souhaitez contribuez au premier MOOC de la Data Science Responsable et de Confiance ? Contactez-nous sur Slack pour rejoindre l'aventure. Que vous ayez un profil technique ou non, vous pouvez contribuer à ce projet !
Quels sont les biais algorithmiques que l’on rencontre fréquemment ? Comment les mesurer et les corriger ? Grégoire, lors de cette présentation, nous a montré toute la complexité des biais algorithmiques, de leur correction et de la notion de performance, à travers un notebook très concret présentant différentes stratégies mises en place et les défauts qu'elles comportent, ainsi que des takeaways très utiles sur le sujet.
Très complémentaire de la présentation de Grégoire, Théo et Ana nous ont présenté les différentes mesures de fairness sur lesquelles concrètement ils travaillent au quotidien. Ils préparent notamment un benchmark complet qui sera publié et partagé fin mai.
Thomas Souverain, doctorant à l’ENS Ulm en partenariat avec DreamQuark a présenté le livre blanc sur l’IA éthique dans le monde et les principales lignes de sa thèse de philosophie sur l’explication de l’IA. Vous pouvez télécharger le livre blanc sur le site de DreamQuark.
Olivier, Eugénie et Anthéa ont présenté l'association Occitanie Data et sa raison d'être, du pourquoi de sa transformation en Ekitia (groupement d'intérêt public), et la charte éthique composée de 8 sections très complètes pour un développement responsable de l’économie de la donnée.
La gouvernance du référentiel d'évaluation se renforce avec la mise en place d'un processus de mise à jour semestrielle et d'un comité de gouvernance en charge d’assurer la transparence et la sincérité du processus participatif. Une branche candidate pour mise à jour sera communiquée pro-activement à la communauté chaque semestre pour revue et question avant sa validation. Le comité de gouvernance sera chargé de veiller à ce que tous les points remontés par la communauté soient pris en compte, et que la version retenue pour mise à jour fasse consensus.
Appel à contributions : La version candidate pour mise à jour du premier semestre 2021 est en cours d’élaboration et de nombreux points ont déjà été soumis. N'hésitez pas à la revoir dès à présent et/ou à y contribuer.
Après plusieurs mois de développements, d'amélioration, de prises en compte des retours reçus (un grand merci à tous !), la plateforme d'évaluation de la Data Science Responsable et de Confiance est lancée. Retrouvez toutes les nouveautés sur la page de release notes.
Evaluez votre organisation et son niveau de maturité dès à présent et faites nous vos retours sur le score de maturité que vous obtenez !
- Understanding Simpson’s Paradox (Fabien Favre)
- Some resources on explainability (Amine)
Théo Lvs17:04
Bonjour tout le monde !
Vous17:05
Hello ! :-)
Guillaume A17:05
Bonjour à tous !
Mickael Fine17:05
Hello à tous, bienvenue à l'atelier DSRC !
Clément Mayer17:07
https://www.labelia.org/fr/blog/evaluation-data-science-responsable
https://github.com/SubstraFoundation/referentiel-evaluation-dsrc/blob/master/referentiel_evaluation.md
Clément Mayer17:11
https://assessment.labelia.org/fr/
Mickael Fine17:11
Pour les intéressés : https://dataforgood-fr.medium.com/.
Clément Mayer17:14
https://c-ways.com/datascience-responsable
Cloélia Tissier17:15
Bonjour à toutes et tous ! est-ce que l'atelier démarre bientôt ?
Vous17:16
Bonjour Cloélia, on est en plein dedans ça y est :-)
Cloélia Tissier17:18
je ne sais pas pourquoi cela ne marchait pas de mon ordinateur, y 'aura-t-il un replay pour celles qui ont raté le début …?
Vous17:20
Aïe malheureusement non nous n'enregistrons pas. Mais les présentations principales démarrent maintenant
Théo Lvs17:35
https://fr.wikipedia.org/wiki/Paradoxe_de_Simpson
Fabien FAIVRE17:37
Avec en rebond l'intérêt des approches causales : https://ftp.cs.ucla.edu/pub/stat_ser/r414.pdf
Clément Mayer17:41
N'hésitez pas à poster vos questions à Grégoire dans le chat :)
Théo Lvs17:47
Crystal clear
Marie Lange17:47
C'était trop bien, merci !!
Clotilde Tp17:47
"Torrent d'acclamations"
Sheyda Irani17:47
Merciiii c'était top !
ndjekoua sandjo jean thibaut17:47
est ce que le TP sera partager ?
Grégoire Mialet17:47
Top présentation Grégoire !
Céline Jacques17:47
Très clair! Très intéressant, merci!
Adrian Nesonson17:47
Merci !
Paul Rengade17:47
Merci Grégoire, c'était top!
Nicolas Landel17:47
Très intéressant !
yann mallegol17:47
Merci Grégoire !
Fabien FAIVRE17:48
Vraiment intéressant, merci
Paul-Marie17:48
Merci! Est-ce que le tutoriel est accessible?
Marie Lange17:49
J'ai jamais vu ça dans ma formation de Data Science à Dauphine
Amine Saboni17:49
Super intéressant, merci!
Marie Lange17:49
en revanche au Wagon et à Simplon le sujet est évoqué
Grégoire Mialet17:50
ok merci Marie
Clément Mayer17:54
Ana essaye peut être de te déconnecter / reconnecter.
Amine Saboni18:02
Très intéressant, je vous recommande la lecture des travaux de Upol Ehsan sur une nouvelle génération des outils de XAI qui prendrait en compte des critères socio-techniques en plus des explications techniques qui permettent de mettre en évidence les biais : https://docs.google.com/document/d/1nfmtPnBRsxGhjbhZDJ8jweKwwX9g_B9CIjfK8rCx0Kk/edit
Clément Mayer18:03
https://www.labelia.org/fr/blog/fairness-dans-le-machine-learning
Théo Lvs18:04
https://www.labelia.org/en/blog/fairness-in-machine-learning
Ah plus rapide ahah
Vous18:11
On a une main levée - Julie voulez-vous poser votre question d'abord à l'écrit que l'on puisse voir le meilleur moment pour interrompre le présentateur et lui poser ?
Vous18:13
Thomas a mentionné la publication toute récente par la commission européenne d'une proposition de réglementation de l'IA en UE. Elle est TRES intéressante. On cherche d'ailleurs des volontaires pour l'étudier en détail et en tirer un maximum d'éléments pour enrichir le référentiel cadre et l'évaluation : - )
Théo Lvs18:15
https://digital-strategy.ec.europa.eu/en/library/proposal-regulation-laying-down-harmonised-rules-artificial-intelligence-artificial-intelligence
Jeremie Abiteboul18:17
@Eric partant pour participer à l'analyse de la proposition de règlementation de l'UE
Vous18:18
👍 Super Jeremie. On va structurer ça via le repo GitHub du référentiel cadre.
T S18:25
Vous pouvez télécharger le livre blanc sur le site de DreamQuark : https://www.dreamquark.com/
Vous18:26
Merci Thomas - on l'ajoutera dans le récap
T S18:27
N'hésitez-pas aussi si vous voulez échanger sur l'IA éthique ou l'explicabilité, ce sera avec plaisir. Merci !
olivier - Occitanie Data18:31
pour plus d'infos : www.occitaniedata.fr
Emilie Sirvent-Hien18:31
Merci beaucoup pour la présentation, pouvez-vous redonner le nom de l'association européenne sur l'éthique?
Vous18:32
Donc à tous les participants : on dépasse un peu le timing, c'était trop ambitieux d'avoir 4 présentations en 1 seul soirée ! J'espère que certains d'entre vous pourront rester un peu plus, sinon on fera le lien pour qu'aucune info ne soit perdue
Paul-Marie18:32
Top, merci!
olivier - Occitanie Data18:32
l'association européenne dont je parlais est la BDVA, big data value association, mais qui n'est pas portée sur l'éthique pour le coup, plutôt sur la question de la valeur de la donnée
Emilie Sirvent-Hien18:33
ok merci
olivier - Occitanie Data18:33
on participe également au GPAI (global partnership on AI), où la question de la confiance et de l'éthique dans la gouvernance de la donnée est , là, abordée
Vous18:39
On va devoir conclure :)
Emilie Sirvent-Hien18:41
Est-ce qu'il y a l'idée de faire signer la charte par des acteurs?
Laurence Herve18:42
cette videoconférence sera t'elle disponible par la suite?
Clément Mayer18:43
Malheureusement non Laurence mais nous allons essayer de faire un résumé le plus complet possible.
Vous18:43
Malheureusement non nous n'avons pas enregistré. L'idée est noté pour les prochains épisodes !
S'il y a des points en particulier que vous voudriez revoir ou sur lesquels vous avez des questions n'hésitez pas à les indiquer ici ou via les réseaux (Meetup, GitHub, Slack)
Laurence Herve18:44
vous avez un lien pour votre slack?
Clément Mayer18:45
https://substra.us18.list-manage.com/track/click?e=2effed55c9&id=fa49875322&u=385fa3f9736ea94a1fcca969f
Laurence le lien pour Slack : https://substra.us18.list-manage.com/track/click?e=2effed55c9&id=fa49875322&u=385fa3f9736ea94a1fcca969f
olivier - Occitanie Data18:47
nous devons vous quitter, encore un grand merci pour nous avoir permis de vous présenter nos activités. Au plaisir de maintenir ce lien!
Clément Mayer18:48
Merci Olivier pour votre intervention
Grégoire Mialet18:48
faut faire de la discrimination positive sur le teta :)
Laurence Herve18:51
merci ç tous, c'était très intéressant et prometteur!!
Ana Ulianovici18:51
Merci beaucoup !
Fabien FAIVRE18:51
Merci beaucoup, toujours aussi intéressant!
Anthéa Serafin (Occitanie Data)18:51
Merci beaucoup pour cet atelier, des présentations très intéressantes !
Emilie Sirvent-Hien18:51
Merci beaucoup!
Dominique Doquang18:51
Merci à tous !
Céline Jacques18:51
Merci ! Bonne soirée :)
Heytem Boumaza18:51
Merci
Nicolas Landel18:51
Merci et à bientôt !
Cloélia Tissier18:52
Quel niveau faut il avoir en "data science" pour pouvoir participer ?