Casserolade de Coq au Bouillon Padagraph

Le travail de l’association Transparency France pour réunir une base de données relatives aux condamnations judiciaires liées à la corruption a été repris par la presse nationale et les organisateurs de mouvements de protestations, nous nous en emparons à notre tour pour en faire des graphes collaboratifs dans le cadre du développement de Padagraph, un outil de visualisation 3D open source.

Recette pour un banquet en campagne

Circles in a Circle, 1923. © Wassily Kandinsky Circles in a Circle, 1923. © Wassily Kandinsky

Chassez le coq avec un canard

 Suite aux révélations du Canard Enchaîné du 8 Février sur les revenus de Pénélope Fillon, mise en cause pour “détournement de fonds publics, abus de biens sociaux et recel de ces délits”, et celle sur Marine Le Pen, qui refuse de rembourser les 298 392 euros qui lui sont réclamés par le parlement européen dans une affaire d’assistants parlementaires supposés fictifs, de nombreux citoyens font entendre leur mécontentement.

Louis-Philippe, à la traîne duquel est attachée une casserole, et son chien famélique, à la queue duquel pend le même récipient. Estampe d'Honoré Daumier.• Crédits : © Bibliothèque Nationale de France Louis-Philippe, à la traîne duquel est attachée une casserole, et son chien famélique, à la queue duquel pend le même récipient. Estampe d'Honoré Daumier.• Crédits : © Bibliothèque Nationale de France

Alors même que l’attente de plus de probité de la part des élus a trouvé une large expression à gauche comme à droite parmi les citoyens, une proposition de loi sur la prescription pénale a été adoptée définitivement le 16 Février par le Parlement. Elle établit un nouveau délai de prescription fixé à 12 ans pour les délits de nature économique et financier. Des voix se sont élevées pour dénoncer cette réforme qui faciliterait la vie des fraudeurs financiers et pourrait empêcher les poursuites judiciaires des futures affaires Fillon (une chronique sur France Inter de Nicole Ferroni y fait aussi référence).

Portez le dossier à ébullition avec Padagraph

Le seuil de tolérance des citoyens face aux affaires de corruption touchant les élus semble être la clé de l’évolution de la législation et des pratiques des acteurs. Mediapart le montre à travers le regard de la presse étrangère: la poursuite de la campagne de François Fillon après le scandale provoqué par la rémunération, semble t’il indue, de son épouse serait impensable dans certains pays. Des mobilisations dans plusieurs villes de France ont appelé au changement. Nous imaginons ici l’organisation d’un espace virtuel, avec Padagraph, qui pourrait permettre d’agir par la constitution de dossiers  en commun et l’analyse des cas recueillis. 

Cette exploration prend racine dans le travail de l’association Transparency France, qui a recensé à ce jour 667 affaires dans une base de données consultable par tous, grâce à Raymond Bonomo, retraité, bénévole à l’association, qui actualise depuis deux ans la base. Il est appuyé par Fabien Schwebel, qui a conçu une carte interactive de la France pour offrir une vue d’ensemble sur les informations recueillies. Ce type d’initiatives pourrait amener plus de monde à une participation active, s’il se créait une habitude d’actualiser des bases de données d’utilités citoyennes, faciles d’accès et d’utilisation. Padagraph peut être utilisé comme un espace pour forger des connaissances communes.

Voici le site de Transparency International France et le site du travail cartographique permettant de visualiser la corruption avec une carte de France interactive et de soumettre de nouveaux cas aux membres de l'association

Cliquez ici pour acceder au site de Padagraph, et pour regarder sous le capot cliquez là

Les graphes sont une façon de représenter et de visualiser des informations. Ils sont faits de sommets (ou nœuds) et d’arêtes (ou liens). Nous rencontrons régulièrement des graphes dans notre vie quotidienne: un arbre généalogique est un graphe particulier, dont les sommets sont des personnes; un réseau de chemin de fer peut être vu comme un graphe dont les sommets sont les gares et les arêtes les voies qui les relient (les arêtes peuvent additionnellement indiquer la distance entre celles-ci). Ces représentations montrent les relations entre des éléments, contrairement aux listes d’éléments empilés dans des tableurs ou des fichiers textes.

Padagraph permet de construire, de partager, et d’éditer des graphes en ligne.  Toute personne peut venir modifier, enrichir ou commenter un graphe. Une affaire trouvée dans la presse peut être ajoutée par un internaute facilement, puis éventuellement ses informations complétées par d’autres. L’outil est en cours de développement. Il peut nécessiter un petit temps de prise en main et devrait devenir de plus en plus facile à utiliser avec le temps. L’objectif de ce billet est de recueillir des commentaires pour orienter la suite des développements.

Préparation des données

Nous proposons des graphes qui viennent compléter la carte interactive mise au point par Fabien Schwebel, à travers trois niveaux de représentation des données, qui amènent progressivement vers les affaires judiciaires en passant par des graphes résumant les informations qui se trouvent dans la base.

Courrier International, 23-02-2017, par Alex © Alexandre Ballaman Courrier International, 23-02-2017, par Alex © Alexandre Ballaman

La recension des affaires du fichier original n’étant pas exhaustive et provenant principalement de la presse, il n’est pas exclus qu’elle contienne des biais, comme le ratio des professions concernées par les affaires, probablement non représentatif du ratio réel des condamnations en France. 

 

Considérez la bête

La première chose que l’on souhaite comprendre lorsque l’on observe un jeu de données, c’est sa structure et les quelques traits qui le résument. Nous représentons les variables sous forme de graphe-schéma, un graphe pointant vers d’autres graphes plus développés et précis, qui permet de se faire une idée de ce que contient la base. Par exemple il y a 667 affaires judiciaires recensées pour 80 types d’infractions touchant 25 secteurs. 

Interface de Padagraph, graphe présentant les variables du jeu de données corruption, et contenant les url de tous les graphes générés à partir de ces données. http://public.padagraph.io/graph/MetaGraphCorruption © Padagraph Interface de Padagraph, graphe présentant les variables du jeu de données corruption, et contenant les url de tous les graphes générés à partir de ces données. http://public.padagraph.io/graph/MetaGraphCorruption © Padagraph

http://public.padagraph.io/graph/MetaGraphCorruption

Ce graphe contient peu d’éléments, il est un bon moyen de prendre en main l’interface. Double cliquez pour qu’il entre en rotation régulière ou maintenez un clic gauche pour le faire pivoter à l’envie. Sélectionnez un sommet pour faire ressortir son entourage direct et observer à gauche de l’écran ses propriétés. Choisissez la couleur de l’arrière-plan qui vous plaît à l’aide de l’onglet Themes et la taille de la police et des sommets avec les touches ‘+’ et ‘-’ ( ‘;’ et ‘,’ pour la taille de la police seulement). La couleur des sommets, si elle n’est pas imposée par l’intégration d’une image à leur création, est décidée automatiquement pour faire ressortir les groupements d’éléments qui ont des contextes similaires dans le graphe.  

Deux noeuds ressortent nettement au premier coup d’oeil: les affaires judiciaires et les types d’infraction, qui comportent toutes les deux plus de liens que les autres nœuds car ils sont les variables clés de notre problème:

  • les Affaires Judiciaires sont les nœuds qui correspondent aux entrées de la table. Chaque ligne de la table recense une affaire. Cette variable est représentée par un cercle.
  • les éléments traités comme des propriétés des Affaires Judiciaires, comme la Date des Faits ou la Date de la Condamnation, ont une forme carrée. Les propriétés sont des informations liées à des sommets, elles n’ont pas leurs propres sommets dans les autres graphes proposés ici.
  • les informations traitées comme des sommets à parts entières sont représentées par des triangles, par exemple le Secteur D’activité ou le Type d’Infractions.
  • les graphes créés à partir de cette table sont représentés par des losanges blancs (e.g. Distribution: Infraction par Entité ou Histographe: répartition par type d’infraction). Leurs liens aux autres nœuds montrent les variables qu’ils contiennent. Dans les propriétés d’un nœuds symbolisant un graphe, visibles à droite de l’écran lorsqu’il est sélectionnée, se trouve l’url pour y accéder.

Option de filtre des sommets, entonnoir à droite de l’interface Padagraph, sous l’onglet Nodes. © Padagraph Option de filtre des sommets, entonnoir à droite de l’interface Padagraph, sous l’onglet Nodes. © Padagraph

Vous pouvez aussi tester les filtres, en cliquant sur Nodes, puis sur le petit entonnoir au dessous, à droite de votre écran. Faîtes par exemple d’abord disparaître les graphes et les propriétés pour y voir plus clair quant-aux variables essentielle, puis ajoutez les à nouveau.

Découpez pour mieux digérer

A partir d’un jeux de données comme celui-ci, certaines visualisations standards permettent de faire ressortir des tendances pertinentes par l’analyse de la distribution des variables. Nous présentons ici des histogrammes sous forme de graphes ainsi que des graphes montrant la distribution d’une variable par rapport à une autre.

Pour réaliser ces graphes, nous avons fait quelques modifications du fichier original: nous avons changé certains noms de variables et nous en avons unifié d’autres (par exemple nous avons réuni les anciennes et les nouvelles régions sous les labels des nouvelles et unifié certains noms de lieux qui apparaissaient écrits différemment dans différents cas judiciaires)

Histographes

Les histogrammes, permettent de visualiser la répartition d’une variable. Nous nous essayons aux histographes pour la répartition des affaires en fonction du type d’infraction, de la fonction exercée, de la région ou encore du secteur d’activité. Les variables sont ici réparties en fonction d’intervalles de pourcentages, l’échelle est systématiquement divisée en dix intervalles. La part d’affaires judiciaires recensées dans la base pour chaque critère est représentée par son lien à l’échelle, en rouge dans nos graphes. La part exacte est indiquée dans le label des arêtes.

Graphe montrant la répartition des Entités concernées par les affaires réunies dans la base de données: http://www.padagraph.io/graph/HistographEntiteCorruption © Padagraph Graphe montrant la répartition des Entités concernées par les affaires réunies dans la base de données: http://www.padagraph.io/graph/HistographEntiteCorruption © Padagraph

http://www.padagraph.io/graph/HistographEntiteCorruption 

Histographe de la répartition des affaires par région : http://www.padagraph.io/graph/HistographRegionCorruption © Padagraph Histographe de la répartition des affaires par région : http://www.padagraph.io/graph/HistographRegionCorruption © Padagraph

http://www.padagraph.io/graph/HistographRegionCorruption

Après normalisation de la répartition des infractions par régions par le PIB, comme l’a fait Fabien Schwebel, nous observons que la Corse obtient un score de corruption très élevé pour la France Métropolitaine. La Polynésie Française détient le record de l’outre-mer et de la France en général.

Histographe montrant l’Indice de corruption des régions:  Affaires/PIB,  http://www.padagraph.io/graph/normalizedPIB Histographe montrant l’Indice de corruption des régions: Affaires/PIB, http://www.padagraph.io/graph/normalizedPIB

http://www.padagraph.io/graph/normalizedPIB

Distributions entre paires de variables

  • Y a t’il des types d’infractions plus propres à telle région ou à tel secteur d’activité?

  • Quelles sont les infractions commises le plus souvent par les sénateurs ou les chefs d’entreprises?

Un autre type de graphe permet de répondre à ces questions, montrant les deux types de variables considérées et indiquant les pourcentages sur les arêtes. Les pourcentages apparaissent au passage de la souris sur un noeud.

Le graphe montrant la distribution des infractions selon les entitéss’ouvre sur les données relatives aux sénateurs, et montre que la prise illégale d’intérêts et les conflits d’intérêts sont en tête, représentant plus de 10% des infractions, suivis par le favoritisme de près avec 9% des infractions commises.  

Distribution des Infractions en fonction des Entités concernées, l’exemple des sénateurs. http://www.padagraph.io/graph/DistributionInfractionparEntite © Padagraph Distribution des Infractions en fonction des Entités concernées, l’exemple des sénateurs. http://www.padagraph.io/graph/DistributionInfractionparEntite © Padagraph

http://www.padagraph.io/graph/DistributionInfractionparEntite

Ces graphes sont beaucoup plus denses, la navigation par recherche de noeuds et l’usage de filtres sur les labels de noeuds est nécessaire pour faire apparaître les distributions clairement à l’écran en affichant seulement les informations pertinentes. Les exemple ci-dessous (de la distribution des entités impliquées selon les infractions et de la distribution des infractions selon les secteurs), montre comment procéder à une recherche.

Lancez d’abord l’exploration d’un sommet en double cliquant dessus ou en recherchant son label dans l’onglet de recherche au dessus du graphe, pour afficher tous ses voisins, et appliquez un filtre en tapant le nom d’une infraction dans la fenêtre de droite.

Entite par infraction: http://www.padagraph.io/graph/DistributionEntiteparInfraction. Exemples: prise illégale d’intérêts. © Padagraph Entite par infraction: http://www.padagraph.io/graph/DistributionEntiteparInfraction. Exemples: prise illégale d’intérêts. © Padagraph

http://www.padagraph.io/graph/DistributionEntiteparInfraction

Type d’infraction par secteur : http://www.padagraph.io/graph/DistributionInfractionparSecteur.  Exemple: défense, vente d’armes. © Padagraph Type d’infraction par secteur : http://www.padagraph.io/graph/DistributionInfractionparSecteur. Exemple: défense, vente d’armes. © Padagraph

http://www.padagraph.io/graph/DistributionInfractionparSecteur

Libérez les arômes avant une balade dans les données brutes

Un troisième niveau d’utilisation des graphes consiste à se promener directement dans les données. Les graphes de données brutes contiennent encore plus de sommets et de liens. Nous nous promenons donc de sous-graphe en sous-graphe, en utilisant le double clic sur un nœud, l’onglet de recherche au dessus de l’écran ou encore les boutons d’exploration qui apparaissent à droite de l’écran lorsqu’un nœud est sélectionné.

Il peut être préférable de choisir un sous ensemble de variables à représenter pour ne pas être submergé par la densité du graphe, comme par exemple les affaires avec les types d’infractions et les régions.

Il est aussi possible de construire le graphe contenant toutes les informations et d’utiliser ensuite les filtres pour la navigation. En sélectionnant un noeud comme une affaire particulière, vous verrez apparaître ses propriétés, donnant toutes les informations contenues dans la base de données.

Une affaire judiciaire spécifique: un cas de détournement de fonds de 1992 dans les Alpes-Maritimes. Graphe contenant tous les liens, tous les sommets et toutes les propriétés de la base. © Padagraph Une affaire judiciaire spécifique: un cas de détournement de fonds de 1992 dans les Alpes-Maritimes. Graphe contenant tous les liens, tous les sommets et toutes les propriétés de la base. © Padagraph

http://www.padagraph.io/graph/GraphCorruptionToutesInfos

Dans une perspective d’extension collaborative de graphes en ligne, ce niveau est celui de l’ajout d’une nouvelle affaire, ou de l’édition des informations sur une affaire déjà recensée.

Créez et partagez vos propres recettes

Le mode d’emploi pour construire des graphes à partager fera l’objet d’un prochain billet.

Tous les graphes peuvent d’ors et déjà être intégrés dans des pages web (regardez par exemple ici, le format du blog Mediapart ne permet pas de le faire directement dans ce billet), moyennant un degré réduit d’interactivité. 

Ustensiles:

 

Le Club est l'espace de libre expression des abonnés de Mediapart. Ses contenus n'engagent pas la rédaction.