Retour à la liste

Actualités

Quels usages pour l’offre de données ouvertes Onisep ?

Revue de quelques aspects essentiels du catalogue pour les utilisateurs professionnels

Depuis novembre 2020, le catalogue de données ouvertes Onisep s’est étoffé avec plus de 50 jeux de données sous licence ODBL. Ces derniers séduisent de plus en plus de professionnels et de partenaires qui les exploitent pour enrichir leurs propres outils et/ou plateformes d’information sur l’orientation et les métiers...

L’offre Onisep, relativement vaste et découpée en périmètres et en lots documentaires logiques, favorise à la fois la lisibilité des jeux pour les usagers et leurs fréquentes mises à jour.

Trois aspects essentiels facilitant les exploitations et les usages possibles ont été présentés fin 2021 à des partenaires professionnels régionaux de l’Onisep. Ils sont passés en revue sous forme de diaporama synthétique.

1) Croiser ou enrichir des jeux grâce aux identifiants ou aux codes uniques

Les principaux objets documentaires décrits et mis à jour en permanence par le réseau documentaire Onisep sont :

  • les formations,
  • les structures d’enseignement,
  • les actions de formation,
  • les actions de dispositif,
  • les métiers.

Tous sont reconnaissables grâce à leurs identifiants Onisep uniques, composés d’un préfixe et d’une série de chiffres. Ex : FOR.135 ou ENS.5874 ou AF.4897 ou AD.643 ou MET.982…

Les jeux de données ouvertes Onisep font aussi souvent référence à des identifiants ou des codes externes uniques, émanant de référentiels publics incontournables.

Par exemple les :

Il est essentiel de repérer ces identifiants et ces codes pour pouvoir croiser les différents jeux de données ouvertes Onisep, pour les enrichir ou encore les recouper avec des données externes.

2) Repérer les séparateurs dans les données listées

La nécessité de réduire le volume des jeux et de bien identifier, sur les jeux linéarisés, chaque ligne comme description d’une entité documentaire distincte, oblige parfois à rassembler des valeurs multiples dans une même cellule.

Pour exploiter ces différentes valeurs possibles, il est important de repérer les séparateurs et la syntaxe des éléments listés parmi les autres signes de ponctuation ou caractères possibles dans les valeurs elles-mêmes.

3) Exploiter des nomenclatures pour trier des données

L’Onisep a créé sa propre nomenclature « domaines et sous-domaines web » pour faciliter les tris et les recherches de ses usagers web (sur onisep.fr par exemple).

Forte de ses usages, de sa stabilité et de sa simplicité (20 domaines et 132 sous-domaines), cette nomenclature est également proposée comme base de tri de données aux usagers sous forme d’un jeu dédié et d’indexations sur divers jeux, selon cette nomenclature.

Des indexations, selon d’autres nomenclatures, externes, sont également présentes dans l’offre Onisep. Elles permettent de trier différemment les données, en fonction des besoins et des priorités.

On repérera, par exemple :

  • la NSF (Nomenclature des spécialités de formation),
  • les listes GFE (Groupes formation emploi),
  • le Formacode de Centre Inffo,
  • le Rome (Répertoire opérationnel des métiers et des emplois) de Pôle emploi.

Tous les jeux Onisep sont conçus et produits à partir du système d’information Idéo, avec un contrôle-qualité permanent, afin d’assurer une homogénéité suffisante des collectes, ainsi qu’une sélection pondérée des colonnes ou balises à publier.

En contrepartie, les utilisateurs professionnels devront :

  • analyser ces données et leur structuration,
  • les croiser et éventuellement les enrichir,
  • les éditorialiser pour les adapter à leurs publications, ou les rendre accessibles sur d’autres plateformes.

En savoir plus :