Retour à la liste

Actualités

OpenRefine : pour nettoyer et enrichir ses données

Un logiciel utile pour récupérer et traiter les données ouvertes.

[Brève mise à jour le 07/09/2021]

Bénéficier d’un logiciel libre pour nettoyer (des données hétérogènes, incomplètes, erronées ou bruitées, mal normalisées), préparer (format, organisation ou codage des données non adaptées à l’outil d’analyse ou aux questions à explorer), enrichir (croisement avec d’autres données ou récupération d’informations sur Internet), mettre en forme (modifier l’organisation d’un fichier et le contenu des cellules, en mode graphique ou avec des formules) : c’est la promesse d’OpenRefine (anciennement Google Refine).

Ce logiciel se télécharge localement et permet de préserver ainsi le caractère privé de ses données avant d’envisager un éventuel partage.

Une documentation étoffée est disponible en anglais sur http://openrefine.org/, à laquelle s’ajoutent diverses ressources et partages d’expériences, d’utilisateurs parfois francophones.

Avec OpenRefine, on peut :

  • explorer un jeu de données issu d’une requête SPARQL ou d’un tableau, en utilisant des tris, des facettes et des regroupements sur des valeurs proches
  • modifier des données via une interface ergonomique ou à l’aide de formules
  • enrichir des données à partir de l’alignement, compléter un jeu de données avec les données manquantes issues d’autres référentiels (Wikidata, DBpedia...)
  • documenter tous les traitements (historique des modifications...).

.

Pour en savoir plus :

http://openrefine.org/

https://rbdd.cnrs.fr/IMG/pdf/openrefinecours.pdf?518/a69ce451abd02003a0e96957e39828e0f2e9f2ee : ressource CNRS - Réseau métier Bases de données (RBDD), Chloé Martin et Jean-Baptiste Pressac, 2018. « OpenRefine. In : ANF « Sciences des données : un nouveau challenge pour les métiers liés aux bases de données », 11 mai 2018.

https://fr.slideshare.net/27point7/nettoyer-et-prparer-des-donnes-avec-openrefine : ressource Urfist Pacac/Mathieu Saby, avril 2017

https://www.slideshare.net/lespetitescases/aligner-vos-donnes-avec-wikidata-grce-loutil-open-refine: tutoriel « Aligner vos données avec Wikidata grâce à l'outil Open Refine », Gautier Poupeau, octobre 2018