[Brève mise à jour le 07/09/2021]
Bénéficier d’un logiciel libre pour nettoyer (des données hétérogènes, incomplètes, erronées ou bruitées, mal normalisées), préparer (format, organisation ou codage des données non adaptées à l’outil d’analyse ou aux questions à explorer), enrichir (croisement avec d’autres données ou récupération d’informations sur Internet), mettre en forme (modifier l’organisation d’un fichier et le contenu des cellules, en mode graphique ou avec des formules) : c’est la promesse d’OpenRefine (anciennement Google Refine).
Ce logiciel se télécharge localement et permet de préserver ainsi le caractère privé de ses données avant d’envisager un éventuel partage.
Une documentation étoffée est disponible en anglais sur http://openrefine.org/, à laquelle s’ajoutent diverses ressources et partages d’expériences, d’utilisateurs parfois francophones.
Avec OpenRefine, on peut :
.
Pour en savoir plus :
https://rbdd.cnrs.fr/IMG/pdf/openrefinecours.pdf?518/a69ce451abd02003a0e96957e39828e0f2e9f2ee : ressource CNRS - Réseau métier Bases de données (RBDD), Chloé Martin et Jean-Baptiste Pressac, 2018. « OpenRefine. In : ANF « Sciences des données : un nouveau challenge pour les métiers liés aux bases de données », 11 mai 2018.
https://fr.slideshare.net/27point7/nettoyer-et-prparer-des-donnes-avec-openrefine : ressource Urfist Pacac/Mathieu Saby, avril 2017
https://www.slideshare.net/lespetitescases/aligner-vos-donnes-avec-wikidata-grce-loutil-open-refine: tutoriel « Aligner vos données avec Wikidata grâce à l'outil Open Refine », Gautier Poupeau, octobre 2018