Le National Democratic Institute, think-tank américain proche du Parti démocrate, vient de se lancer dans une opération de «libération» des données à l'occasion des élections législatives (Wolesi Jirga) en Afghanistan organisées samedi 18 septembre.
Sur un site dédié, l'organisation publie les cartes, mais aussi les données brutes téléchargeables de l'élection présidentielle de 2004, des législatives de 2005, et de la présidentielle de 2009, à partir des résultats validés par la commission électorale indépendante (IEC). Au fur et à mesure de leur disponibilité, les chiffres du scrutin du week-end seront aussi mis en ligne.
Mais la partie la plus intéressant du site, OpenData, ajoute une couche de «journalisme de données» sous la forme de 14 séries de données utilisables par les chercheurs et les développeurs pour les croiser et en tirer des conclusions inédites:
- topographie
- découpage politique (en anglais et en dari),
- groupes ethniques,
- proportion de candidates
- étiquettes partisanes en 2010,
- relevé des votes achetés en 2009 selon Integrity Watch Afghanistan,
- participation,
- votes blancs et nuls,
- proportions de candidates en 2005,
- participation féminine,
- votes blancs et nuls,
- vote Karzai en 2004.
Surtout, allant dans le sens des conseils de Simon Rodgers (Guardian Datablog), les chiffres sont fournis sous forme de fac-simile du document officiel (PDF, ce qui permet d'accéder à la source brute, même si elle n'est pas directement exploitable), en indiquant si possible le lien direct sur le site d'origine (pour vérifier la provenance, la date des données, etc.), mais aussi sous forme de tableau sur Google Fusion Table, au format Excel, et en texte non structuré (données séparées par des virgules au format CSV). Les données localisées existent au format KML qui permettent de l'intégrer à Google Map, Google Earth ou à n'importe quel format cartographique type OpenStreetMap.
Un «manuel» de réutilisation des données ouvertes explique en détail comment exploiter informatiquement les données (le site renvoie à un module Drupal de visualisation des données, Managing News combiné avec MapBox. Une représentation (géo)graphique est également proposée au moyen de cartes dynamiques (avec des calques) ou statiques (imprimables) pour ceux qui ne veulent pas/savent pas/ n'ont pas besoin de coder.
Le but de cette libération des données est de laisser le public trouver et proposer des croisements et des utilisations plus pertinentes, plus créatives, plus originales que les utilisations classiques (type carte de résultats électoraux) pour permettre au public d'en tirer ses propres analyses appuyées sur des données fiables mais des croisements statistiques inédits.
Lire aussi: Données, donnez-moi