Casserolade de Coq au Bouillon Padagraph
- 20 mars 2017
- Par Joanne
- Blog : Le blog de Joanne
Recette pour un banquet en campagne
Circles in a Circle, 1923. © Wassily Kandinsky
Chassez le coq avec un canard
Suite aux révélations du Canard Enchaîné du 8 Février sur les revenus de Pénélope Fillon, mise en cause pour “détournement de fonds publics, abus de biens sociaux et recel de ces délits”, et celle sur Marine Le Pen, qui refuse de rembourser les 298 392 euros qui lui sont réclamés par le parlement européen dans une affaire d’assistants parlementaires supposés fictifs, de nombreux citoyens font entendre leur mécontentement.

Alors même que l’attente de plus de probité de la part des élus a trouvé une large expression à gauche comme à droite parmi les citoyens, une proposition de loi sur la prescription pénale a été adoptée définitivement le 16 Février par le Parlement. Elle établit un nouveau délai de prescription fixé à 12 ans pour les délits de nature économique et financier. Des voix se sont élevées pour dénoncer cette réforme qui faciliterait la vie des fraudeurs financiers et pourrait empêcher les poursuites judiciaires des futures affaires Fillon (une chronique sur France Inter de Nicole Ferroni y fait aussi référence).
Portez le dossier à ébullition avec Padagraph
Le seuil de tolérance des citoyens face aux affaires de corruption touchant les élus semble être la clé de l’évolution de la législation et des pratiques des acteurs. Mediapart le montre à travers le regard de la presse étrangère: la poursuite de la campagne de François Fillon après le scandale provoqué par la rémunération, semble t’il indue, de son épouse serait impensable dans certains pays. Des mobilisations dans plusieurs villes de France ont appelé au changement. Nous imaginons ici l’organisation d’un espace virtuel, avec Padagraph, qui pourrait permettre d’agir par la constitution de dossiers en commun et l’analyse des cas recueillis.
Cette exploration prend racine dans le travail de l’association Transparency France, qui a recensé à ce jour 667 affaires dans une base de données consultable par tous, grâce à Raymond Bonomo, retraité, bénévole à l’association, qui actualise depuis deux ans la base. Il est appuyé par Fabien Schwebel, qui a conçu une carte interactive de la France pour offrir une vue d’ensemble sur les informations recueillies. Ce type d’initiatives pourrait amener plus de monde à une participation active, s’il se créait une habitude d’actualiser des bases de données d’utilités citoyennes, faciles d’accès et d’utilisation. Padagraph peut être utilisé comme un espace pour forger des connaissances communes.
Voici le site de Transparency International France et le site du travail cartographique permettant de visualiser la corruption avec une carte de France interactive et de soumettre de nouveaux cas aux membres de l'association
Cliquez ici pour acceder au site de Padagraph, et pour regarder sous le capot cliquez là!
Les graphes sont une façon de représenter et de visualiser des informations. Ils sont faits de sommets (ou nœuds) et d’arêtes (ou liens). Nous rencontrons régulièrement des graphes dans notre vie quotidienne: un arbre généalogique est un graphe particulier, dont les sommets sont des personnes; un réseau de chemin de fer peut être vu comme un graphe dont les sommets sont les gares et les arêtes les voies qui les relient (les arêtes peuvent additionnellement indiquer la distance entre celles-ci). Ces représentations montrent les relations entre des éléments, contrairement aux listes d’éléments empilés dans des tableurs ou des fichiers textes.
Padagraph permet de construire, de partager, et d’éditer des graphes en ligne. Toute personne peut venir modifier, enrichir ou commenter un graphe. Une affaire trouvée dans la presse peut être ajoutée par un internaute facilement, puis éventuellement ses informations complétées par d’autres. L’outil est en cours de développement. Il peut nécessiter un petit temps de prise en main et devrait devenir de plus en plus facile à utiliser avec le temps. L’objectif de ce billet est de recueillir des commentaires pour orienter la suite des développements.
Préparation des données
Nous proposons des graphes qui viennent compléter la carte interactive mise au point par Fabien Schwebel, à travers trois niveaux de représentation des données, qui amènent progressivement vers les affaires judiciaires en passant par des graphes résumant les informations qui se trouvent dans la base.

La recension des affaires du fichier original n’étant pas exhaustive et provenant principalement de la presse, il n’est pas exclus qu’elle contienne des biais, comme le ratio des professions concernées par les affaires, probablement non représentatif du ratio réel des condamnations en France.
Considérez la bête
La première chose que l’on souhaite comprendre lorsque l’on observe un jeu de données, c’est sa structure et les quelques traits qui le résument. Nous représentons les variables sous forme de graphe-schéma, un graphe pointant vers d’autres graphes plus développés et précis, qui permet de se faire une idée de ce que contient la base. Par exemple il y a 667 affaires judiciaires recensées pour 80 types d’infractions touchant 25 secteurs.

http://public.padagraph.io/graph/MetaGraphCorruption
Ce graphe contient peu d’éléments, il est un bon moyen de prendre en main l’interface. Double cliquez pour qu’il entre en rotation régulière ou maintenez un clic gauche pour le faire pivoter à l’envie. Sélectionnez un sommet pour faire ressortir son entourage direct et observer à gauche de l’écran ses propriétés. Choisissez la couleur de l’arrière-plan qui vous plaît à l’aide de l’onglet Themes et la taille de la police et des sommets avec les touches ‘+’ et ‘-’ ( ‘;’ et ‘,’ pour la taille de la police seulement). La couleur des sommets, si elle n’est pas imposée par l’intégration d’une image à leur création, est décidée automatiquement pour faire ressortir les groupements d’éléments qui ont des contextes similaires dans le graphe.
Deux noeuds ressortent nettement au premier coup d’oeil: les affaires judiciaires et les types d’infraction, qui comportent toutes les deux plus de liens que les autres nœuds car ils sont les variables clés de notre problème:
- les Affaires Judiciaires sont les nœuds qui correspondent aux entrées de la table. Chaque ligne de la table recense une affaire. Cette variable est représentée par un cercle.
- les éléments traités comme des propriétés des Affaires Judiciaires, comme la Date des Faits ou la Date de la Condamnation, ont une forme carrée. Les propriétés sont des informations liées à des sommets, elles n’ont pas leurs propres sommets dans les autres graphes proposés ici.
- les informations traitées comme des sommets à parts entières sont représentées par des triangles, par exemple le Secteur D’activité ou le Type d’Infractions.
- les graphes créés à partir de cette table sont représentés par des losanges blancs (e.g. Distribution: Infraction par Entité ou Histographe: répartition par type d’infraction). Leurs liens aux autres nœuds montrent les variables qu’ils contiennent. Dans les propriétés d’un nœuds symbolisant un graphe, visibles à droite de l’écran lorsqu’il est sélectionnée, se trouve l’url pour y accéder.

Vous pouvez aussi tester les filtres, en cliquant sur Nodes, puis sur le petit entonnoir au dessous, à droite de votre écran. Faîtes par exemple d’abord disparaître les graphes et les propriétés pour y voir plus clair quant-aux variables essentielle, puis ajoutez les à nouveau.
Découpez pour mieux digérer
A partir d’un jeux de données comme celui-ci, certaines visualisations standards permettent de faire ressortir des tendances pertinentes par l’analyse de la distribution des variables. Nous présentons ici des histogrammes sous forme de graphes ainsi que des graphes montrant la distribution d’une variable par rapport à une autre.
Pour réaliser ces graphes, nous avons fait quelques modifications du fichier original: nous avons changé certains noms de variables et nous en avons unifié d’autres (par exemple nous avons réuni les anciennes et les nouvelles régions sous les labels des nouvelles et unifié certains noms de lieux qui apparaissaient écrits différemment dans différents cas judiciaires)
Histographes
Les histogrammes, permettent de visualiser la répartition d’une variable. Nous nous essayons aux histographes pour la répartition des affaires en fonction du type d’infraction, de la fonction exercée, de la région ou encore du secteur d’activité. Les variables sont ici réparties en fonction d’intervalles de pourcentages, l’échelle est systématiquement divisée en dix intervalles. La part d’affaires judiciaires recensées dans la base pour chaque critère est représentée par son lien à l’échelle, en rouge dans nos graphes. La part exacte est indiquée dans le label des arêtes.

http://www.padagraph.io/graph/HistographEntiteCorruption

http://www.padagraph.io/graph/HistographRegionCorruption
Après normalisation de la répartition des infractions par régions par le PIB, comme l’a fait Fabien Schwebel, nous observons que la Corse obtient un score de corruption très élevé pour la France Métropolitaine. La Polynésie Française détient le record de l’outre-mer et de la France en général.

http://www.padagraph.io/graph/normalizedPIB
Distributions entre paires de variables
-
Y a t’il des types d’infractions plus propres à telle région ou à tel secteur d’activité?
-
Quelles sont les infractions commises le plus souvent par les sénateurs ou les chefs d’entreprises?
Un autre type de graphe permet de répondre à ces questions, montrant les deux types de variables considérées et indiquant les pourcentages sur les arêtes. Les pourcentages apparaissent au passage de la souris sur un noeud.
Le graphe montrant la distribution des infractions selon les entitéss’ouvre sur les données relatives aux sénateurs, et montre que la prise illégale d’intérêts et les conflits d’intérêts sont en tête, représentant plus de 10% des infractions, suivis par le favoritisme de près avec 9% des infractions commises.

http://www.padagraph.io/graph/DistributionInfractionparEntite
Ces graphes sont beaucoup plus denses, la navigation par recherche de noeuds et l’usage de filtres sur les labels de noeuds est nécessaire pour faire apparaître les distributions clairement à l’écran en affichant seulement les informations pertinentes. Les exemple ci-dessous (de la distribution des entités impliquées selon les infractions et de la distribution des infractions selon les secteurs), montre comment procéder à une recherche.
Lancez d’abord l’exploration d’un sommet en double cliquant dessus ou en recherchant son label dans l’onglet de recherche au dessus du graphe, pour afficher tous ses voisins, et appliquez un filtre en tapant le nom d’une infraction dans la fenêtre de droite.

http://www.padagraph.io/graph/DistributionEntiteparInfraction

http://www.padagraph.io/graph/DistributionInfractionparSecteur
Libérez les arômes avant une balade dans les données brutes
Un troisième niveau d’utilisation des graphes consiste à se promener directement dans les données. Les graphes de données brutes contiennent encore plus de sommets et de liens. Nous nous promenons donc de sous-graphe en sous-graphe, en utilisant le double clic sur un nœud, l’onglet de recherche au dessus de l’écran ou encore les boutons d’exploration qui apparaissent à droite de l’écran lorsqu’un nœud est sélectionné.
Il peut être préférable de choisir un sous ensemble de variables à représenter pour ne pas être submergé par la densité du graphe, comme par exemple les affaires avec les types d’infractions et les régions.
Il est aussi possible de construire le graphe contenant toutes les informations et d’utiliser ensuite les filtres pour la navigation. En sélectionnant un noeud comme une affaire particulière, vous verrez apparaître ses propriétés, donnant toutes les informations contenues dans la base de données.

http://www.padagraph.io/graph/GraphCorruptionToutesInfos
Dans une perspective d’extension collaborative de graphes en ligne, ce niveau est celui de l’ajout d’une nouvelle affaire, ou de l’édition des informations sur une affaire déjà recensée.
Créez et partagez vos propres recettes
Le mode d’emploi pour construire des graphes à partager fera l’objet d’un prochain billet.
Tous les graphes peuvent d’ors et déjà être intégrés dans des pages web (regardez par exemple ici, le format du blog Mediapart ne permet pas de le faire directement dans ce billet), moyennant un degré réduit d’interactivité.
Ustensiles:
- L'association Transparency Internationale France
- La carte de France de la corruption
- Le site de Padagraph
- Ces graphes on été réalisés avec le module Botapadd qui utilise Framapad comme support pour construire les graphes et les exporter sur le site de Padagraph.
- Un script pour générer les trois niveaux de graphes
Le Club est l'espace de libre expression des abonnés de Mediapart. Ses contenus n'engagent pas la rédaction.