Analyse des votes des motions au congrès de Reims par une grandeur statistique : le Chi 2
On parle beaucoup ces derniers jours de l'infame fraude qui aurait eu lieu dans l'horrible fédération du Nord lors du Congrès de Reims. Mais revenons rapidement sur le vote qui eu lieu quelques jours avant sur les motions. Car tout commence le 6 novembre 2008, lorsque l'on a demandé aux militants de voter sur les motions.En Bref quelles sont les fédérations qui ont vraiment déterminé le vote ? Et je vous laisserai seul juge des conclusions que vous pourriez en tirer.
Nous allons appliquer un test statistique sur le vote du 6 novembre relatifs aux choix des motions qui a eu lieu au Parti Socialiste. Nous voulons savoir si le nombre de voies par motions est réparti de façon aléatoire entre toutes les fédérations ou bien s'il existe une représentation plus forte de telles ou telles motions dans l'une des fédérations (FD). De cette manière, il nous est possible de dresser une carte démographique de la famille socialiste en France et de localiser les fiefs géographiques des motions. Nous entendons par fiefs une fédération qui a voté majoritairement pour une motion le 6 novembre.
Le but de cette analyse est de déterminer si l'existence de fiefs dans certaines fédérations (FD) est un événement fréquent (hypothèse d'indépendance entre FD et votes sur motions) ou un événement rare (rejet de l'hypothèse d'indépendance, c'est-à-dire que l'appartenance à une fédération prédétermine le vote).
Le principe du calcul du Chi 2 (X2) est d'analyser les écarts entre des effectifs théoriques et des effectifs observés. Dans le cas qui nous intéresse, les effectifs observés sont le nombre de voies qui se sont portées sur les différentes motions respectivement dans chacune des fédérations.
L'effectif théorique représente la quantité de voies des motions qui serait obtenue pour chacune des motions dans l'ensemble des fédérations s'il n'y avait aucun lien entre la fédération et le vote des motions. On considère qu'il y a une indépendance mathématique entre la fédération et les votes sur les motions cela veut dire que l'attribution de chaque modalité (choix d'un vote sur une motion) se fait de façon indépendante de la fédération.
L'étude de la relation entre les FD et le vote sur les motions repose sur la confrontation entre situation observée (résultats) et la situation théorique que présenterait le tableau des résultats dans le cas ou FD et vote sur les motions seraient mathématiquement indépendants.
On construit un tableau représentant le cas théorique de l'indépendance mathématique entre FD et motions.
Nous construisons en statistique ce que nous appelons un tableau de contingence. Nous prenons comme base de données les résultats des votes des motions par fédération qui ont eu lieu le 6 novembre 2008, étant bien entendu que si les résultats du 20 et 21 étaient disponibles nous aurions procédé à des test complémentaires sur les probabilités de report des voies.
Extraits du tableau des résultats des votes**:
Contribution relative de chaque case valeur du Chi2 total
FD
A'''
C'''
D'''
E'''
% écarts
BOUCHES-DU-RHONE
1,26
0,95
1,17
8,29
11,77
NORD
0,46
0,17
6,64
1,72
9,08
LANDES
0,82
6,06
0,11
0,56
7,60
SEINE-MARITIME
0,38
0,48
5,66
1,04
7,59
PAS-DE-CALAIS
0,01
0,56
3,72
1,48
5,78
AUDE
0,54
0,13
0,19
2,16
3,11
GUADELOUPE
2,27
0,43
0,23
0,14
3,11
LA REUNION
1,30
0,53
0,73
0,13
2,74
HERAULT
0,08
0,25
0,42
1,81
2,64
PYRENEES-ORIENTALES
0,50
0,08
1,84
0,09
2,54
Cette grandeur représente la part que représente une association (fédération - vote sur motion) dans la somme totale des écarts. En d'autres termes cette grandeur statistique exprime l'importance que prend une fédération dans le vote national.
On peut ainsi constater que plus de 40 % de la somme des écarts sont le fait de 10 associations (Motions / fédération). D'après les distributions


Tous les commentaires
Extraordinaire démonstration. Merci Fabrice.
Quand on parle de fief, on ne dit pas n'importe quoi.
On peut voir cela pour les votes au secrétariat général ou l'on ne connaît toujours pas les résultats?
Joli travail statistique qui montre bien le poids des effets locaux et de leurs leaders soit par verrouillage, soit par bourrage des urnes. Tout cela n'est pas vraiment rassurant sur la démocratie.
Merci Fabrice pour ce calcul qui apporte un éclairage précieux. e me ermets malgré tout d'apporter quelques petites nuances interprétatives, avec lesquelles vous serez je crois d'accord:
1) s'il s'agissait de choisir entre pile ou face, il y aurait en effet de très fortes raisons de s'inquiéter des écarts importants envec une répartition aléatoire, notamment dans les sections à effectifs nombreux; mais il s'agit de personnalités qui peuvent avoir un capital d'influence très inégal d'une région à l'autre (dynamisme de leurs éventuels clubs ou réseaux, participation fréquente, rare ou nulle à des événements locaux) et de programmes qui peuvent être également différemment perçus pour diverses raisons; je suppose entre autres que toutes les sections socialistes ne sont pas homogènes du point de vue de critères influençant les choix: catégories socio-professionnelles, statut public ou privé, sexe, classes d'âge...
2) s'il y a un effet "poids des barons locaux", il reste quand même une grande différence entre le bourrage d'urnes ou autres tricheries et la pratique d'un soutien politique actif et déclaré à tel leader, telle motion ; dans toutes les élections les "relais d'opinion" jouent un rôle important et en l'occurrence si la motion d' un leader est localement favorisé par le soutien apporté des dirigeants locaux, cela veut dire - s'il n'y a pas tricherie - primo que le leader favorisé aura su convaincre et mobiliser des cadres du parti, secundo que ces cadres ont suffisamment de crédit auprès de leur base pour infléchir significativement son vote;
3) il reste que l'ampleur de certains écarts est impressionnante et rend très plausible que les manipulations électorales aient été aussi importantes dans les Bouches du Rhône que dans le Nord, voire plus; mais si je ne me trompe pas, votre liste ne comprend pas la section locale où Ségolène Royal exerce la plus forte influence directe, ce qui permet au moins de supposer que si des fraudes lui ont profité, elle ne les a ni commandés ni dirigées. Cela rassure un peu non?
Vous avez raison, mais le Chi 2 est une distance statistique qui permet justement de tenir compte de caractéristiques spécifiques. Ce test ne permet que de mettre en évidence des associations soit fréquentes soit rares. En sociologie urbaine on peut l'utilser pour savoir s'il existe un type de population sureprésentée dans un quartier ou inversement, en environnement on peut s'en servir pour avoir une idée des conditions des associations sols / plantes...
Nous pourrions faire une analyse factorielle (ACP, AFC...) des votes des motions en fonction de critères départementaux (PIB,cadre de vie CSP...) et voir de quelle manière les variables se redistribuent en fonction de nouveaux critères (axes factorielles). Existe- t-il des associations de motions possibles ? De cette manière on pourrait établir des probabilités de vote au second tour en fonction des duels envisagés.
Je l'avoue, je n'ai pas eu le courage de le faire.