Site Open data Onisep
Actualités
Retour à la liste

OpenRefine : pour nettoyer et enrichir ses données

Publié le 24/07/2019
général
Logiciel gratuit pour préparer, enrichir et mettre en forme des données.

Logiciel gratuit pour nettoyer (des données hétérogènes, incomplètes, erronées ou bruitées, mal normalisées), préparer (format, organisation ou codage des données non adaptées à l’outil d’analyse ou aux questions à explorer), enrichir (croisement avec d’autres données ou récupération d’informations sur Internet), mettre en forme (modifier l’organisation d’un fichier et le contenu des cellules, en mode graphique ou avec des formules) : c’est la promesse d’OpenRefine (ex Google Refine).

Grâce à lui, on peut :

- explorer un jeu de données issu d’une requête SPARQL ou d’un tableau, en utilisant des tris, des facettes et des regroupements sur des valeurs proches

- modifier des données via une interface ergonomique ou à l’aide de formules

- enrichir des données à partir de l’alignement, compléter un jeu de données avec les données manquantes issues d’autres référentiels (Wikidata, DBpedia...)

- documenter tous les traitements (historique des modifications...).

Pour en savoir plus :

http://openrefine.org/

https://fr.slideshare.net/27point7/nettoyer-et-prparer-des-donnes-avec-openrefine : formation Urfist Pacac/Mathieu Saby, avril 2017

https://www.slideshare.net/lespetitescases/aligner-vos-donnes-avec-wikidata-grce-loutil-open-refine: tutoriel « Aligner vos données avec Wikidata grâce à l'outil Open Refine », Gautier Poupeau, octobre 2018