Impact des données ouvertes 4/6
Publié le 22 octobre 2024
Quel est l'impact social des données ouvertes ?
Dans le cadre de ses missions, l’équipe de data.gouv.fr mène des travaux sur la mesure de l’impact de l’open data.
Nous avons récemment réalisé une étude pour documenter et analyser cet impact, selon les quatre dimensions identifiées par l’Open Data Maturity report (ODM) :
- Impact gouvernemental ;
- Impact social ;
- Impact économique ;
- Impact environnemental.
Cette série d’articles présente l’impact des données ouvertes dans chacun de ces domaines. Après avoir abordé l’impact gouvernemental et environnemental, nous nous consacrons aujourd’hui à l’impact social des données ouvertes.
Qu’entend-on par impact social ?
Les données ouvertes peuvent contribuer à répondre à des questions sociales telles que :
- L’inclusion des groupes marginalisés et la réduction des inégalités ;
- Les problématiques de logement dans les zones urbaines ;
- La santé et le bien-être ;
- L’éducation et les compétences.
C’est ce que l’on entend par impact social de l’open data.
Parmi les données les plus emblématiques de la thématique figurent notamment :
- Les données sur les vacances des logements (Ministère de la transition écologique);
- Les données de Parcoursup (2018, 2019, 2020, 2021, 2022, 2023) (Ministère de l’enseignement supérieur et de la recherche) ;
- Les indices de position sociale dans les écoles, collèges et lycées (Ministère de l’éducation nationale) ;
- Les données sur les revenus, pauvreté et niveau de vie (INSEE) ;
- La base Transparence Santé (Ministère de la santé et de l’accès aux soins) ;
- etc.
Dans le cadre de nos travaux, les quatre aspects susmentionnés ont été mesurés en examinant :
- Les résultats directs de la mise à disposition des données ouvertes dans ce domaine ;
- Les effets à moyen et long terme.
Quels résultats directs ?
Les résultats directs induits par les données ouvertes couvrent :
- L’intérêt pour les jeux de données de la thématique ;
- Les utilisations directes des données.
Ces deux volets sont mesurés au moyen d’indicateurs comme le nombre de vues sur les jeux de données de la thématique, le nombre de téléchargements, le nombre de réutilisations, etc. et quantifiés à partir des métriques de la plateforme data.gouv.fr.
La catégorie “Questions sociales” englobe 6487 jeux de données sur data.gouv.fr, comptabilisant au total 23,5 millions de vues et plus de 156,7 millions de téléchargements (statistiques pour la période été 2023-été 2024).
Ces jeux de données font l’objet de nombreuses interactions, avec 2804 discussions recensées sur la même période. En 2023, 405 nouveaux jeux de données se rapportant à cette catégorie ont été publiés, indiquant un flux constant de mises à jour et de nouvelles données mises à disposition du public.
A ce jour, 1222 réutilisations ont été référencées sur data.gouv.fr comme se rapportant à la catégorie “Questions sociales”, avec 163 nouvelles réutilisations publiées en 2023. Elles ont été consultées près de 4,7 millions de fois pendant la période étudiée.
Note méthodologique : Ces statistiques ont été obtenues à partir d’un travail de thématisation du catalogue de données de la plateforme data.gouv.fr.
Bien que cette catégorisation soit intéressante, il est important de garder en tête les limites de l’exercice lors de l’analyse :
- Certains jeux de données peuvent appartenir à plusieurs thèmes ;
- Tous les jeux de données n’ont pas la même valeur : certains présentent un potentiel d’impact important et constituent de grands volumes de données, quand d’autres ne consistent parfois qu’en une seule ligne.
Cette analyse quantitative doit ainsi nécessairement être complétée d’une étude qualitative.
Quel impact à moyen et long terme ?
La connaissance des effets à moyen et long terme des données ouvertes passe par l’examen minutieux de cas d’usage pour en comprendre les services proposés, les données utilisées et en révéler les impacts.
Les exemples d’usage examinés dans notre étude permettent de rendre compte de ces effets sur la société. Il s’agit ici de vous permettre de les apprécier en les présentant succinctement.
Inclusion des groupes marginalisés et réduction des inégalités
Nous nous sommes intéressés à deux cas d’usage qui convergent vers une mise en évidence d’inégalités existantes :
Atlas Culture des territoires
Proposé par le ministère de la culture, l’Atlas Culture des territoires permet de comprendre les dynamiques culturelles. Il mobilise des données publiques relatives à l’offre culturelle, aux dépenses culturelles, à l’emploi et aux entreprises culturelles, ainsi que des indicateurs socio-économiques, pour proposer :
- Une carte interactive permettant de les visualiser ;
- Des fiches portrait qui décrivent chaque région.
Cette cartographie concourt à l’identification des inégalités culturelles et à l’adaptation des stratégies d’aménagement culturel. L’Atlas permet également au grand public de comprendre les enjeux liés aux politiques culturelles et de participer au débat public.
Célébrations et commémorations nationales en France depuis 1970
Cette analyse des données ouvertes relatives aux célébrations et commémorations permet de visualiser les périodes historiques concernées, les thématiques commémorées, etc. mais surtout de révéler de nombreuses inégalités de représentation : depuis 1970, seules 103 femmes ont été célébrées, sur 1358 individus (7,5%).
Nombre de célébrations par genre au fil des années
Logement urbain
Deux cas d’usage illustrent la façon dont les données ouvertes peuvent être mobilisées pour résoudre des problématiques relatives au logement urbain :
Résorption bidonvilles
Résorption bidonvilles est un service public numérique qui permet aux services de l’Etat, collectivités territoriales, etc. de connaître, partager et agir pour résorber les bidonvilles. Il permet notamment :
- de consulter la liste et les caractéristiques de tous les sites d’un territoire ;
- de prendre connaissances des actions effectuées ;
- de s’entraider, avec un annuaire de tous les utilisateurs et un forum ;
- de visualiser les données de la plateforme.
Par un suivi opérationnel simplifié pour les responsables publics et une meilleure coordination entre acteurs, l’outil favorise l’accélération de la résorption des bidonvilles et un meilleur accompagnement des populations. Depuis le lancement de la plateforme en 2019, plus de 4000 personnes ont été relogées (17 sites résorbés en 2022, 28 en 2021, 16 en 2020) et en 2022 :
- 3566 mineurs ont été scolarisés grâce au programme de médiation scolaire ;
- 5461 personnes ont bénéficié d’un accompagnement vers la santé en 2022 ;
- Plus de 1000 personnes ont accédé à un emploi.
Aux Alentours par MAIF
Aux Alentours par MAIF est un outil développé par la société d’assurance mutuelle. Il agrège et cartographie de nombreuses données ouvertes (risques, équipements, arrêts de transport, exposition au bruit, etc.) pour permettre à chacune et chacun de mieux connaître les risques associés à son environnement et d’en prévenir les conséquences avec des conseils adaptés.
Santé et bien-être
Sur la santé et le bien-être, nous nous sommes attardés sur 2 usages :
Euros for docs
L’association Euros for Docs s’est donné pour objectif de simplifier l’accès à la base Transparence Santé, dans laquelle les industriels déclarent tous leurs liens d’intérêt, en nettoyant les données et en offrant une interface simplifiée. Les usages sont nombreux :
- Pour les patients : se renseigner sur les liens d’intérêt de leur médecin ;
- Pour les citoyens : comprendre le lobby de l’industrie sur le système de santé ;
- Pour les professionnels de santé : se sensibiliser et participer à l’indépendance de la médecine ;
- Pour les administrations publiques : contrôler l’indépendance des experts sanitaires ;
- Pour les journalistes et les chercheurs : mener plus facilement leurs investigations et recherches.
Plateforme de prévision de la qualité des eaux de baignade en temps réel
Les données de rapportage de la saison balnéaire et des données publiques météorologiques sont mobilisées pour nourrir un modèle de type machine learning qui estime le risque de contamination bactériologique fécale (jusqu’à une échéance de 5 jours, avec 4 niveaux d’alerte). L’outil permet aux collectivités de mieux gérer leurs sites de baignade et au grand public d’exercer un principe de précaution.
Education et compétences
Les exemples abondent concernant l’usage des données ouvertes dans le domaine de l’éducation et des compétences. Nous en avons retenu 4 pour être examinés :
DiagOriente
DiagOriente est un service public numérique qui permet aux jeunes de formaliser leurs compétences et intérêts professionnels, de découvrir les métiers correspondants et de trouver des formations et/ou des emplois plus facilement. Il s’appuie notamment sur le répertoire opérationnel des métiers et des emplois, les données du marché du travail ou encore les données sur les offres d'emploi. Le service compte aujourd’hui plus de 400 000 utilisateurs, parmi lesquels :
- 85% ont réalisé qu’ils avaient de nombreuses compétences ;
- 75% ont pu découvrir des métiers qu’ils souhaiteraient faire ;
- 65% sont sortis du processus avec un projet professionnel engagé.
SupTracker
Projet personnel de deux citoyens, SupTracker met en forme les données ouvertes relatives à Parcoursup pour permettre de :
- S’informer sur une formation : candidatures et admissions, profil des candidats admis, indicateurs de sélectivité, etc. ;
- Comparer des formations ;
- Explorer la répartition des candidats selon leur profil : mention au bac, bourse, etc.
Grâce à l’application, les élèves peuvent mieux s’informer sur les formations qu’ils envisagent d’intégrer (recrutement et sélectivité) pour formuler des projets d’orientation cohérents.
Analyses réalisées à partir des indices de position sociale dans les écoles, collèges et lycées
L’indice de position sociale d’un établissement est un indicateur qui résume les conditions socio-économiques et culturelles des familles des élèves qu’il accueille. Les données associées, publiées en 2022 par le ministère de l’éducation nationale, ont permis de relancer et nourrir le débat sur le manque de brassage social dans les établissements scolaires, par exemple :
- Le journal Le Monde a rédigé un article qui met en évidence les écarts socio-économiques entre collèges publics et privés, mais également entre certains collèges publics voisins ;
- Le département de la prospective, de l’évaluation et de la performance du ministère de l’éducation nationale a réalisé une étude sur les disparités sociales entre collèges, au regard de l’objectif de mixité sociale.
Les défis open data de l’Open Data University
Dans le cadre de l’Open Data University, les données ouvertes deviennent un outil de formation, au service du développement des compétences et de l’engagement citoyen. L’Open Data University est un dispositif qui propose aux établissements de l’enseignement supérieur de faire travailler leurs élèves sur des challenges open data qui répondent à des enjeux sociaux et environnementaux. Le programme est porté par l’association Latitudes, qui travaille aux côtés de 100 établissements du supérieur pour intégrer une dimension sociale et environnementale à leur cursus. En 2023-2024, ce sont plus de 650 étudiants, issus de 16 établissements, qui se sont formés en travaillant sur des défis open data sur les données des élections, de la culture ou encore de l’énergie. La saison 3 est lancée : responsables pédagogiques et enseignants, n’hésitez pas à la rejoindre !
Nous vous donnons rendez-vous la semaine prochaine pour découvrir ensemble l’impact économique de l’open data !