Sun.
27
May

MEDIAPART

Connexion utilisateur

Fermer

Biaisé ou pas?

Je n'avais pas encore regardé les sondages des prochaines présidentielles. Dans tous les sondages, Sarko obtient au mieux 43% des voix et Hollande au pire 57 % des voix. Si les échantillons ne sont pas biaisés... 

En regardant sur ma table de loi normale centrée, 0,95 correspond à peu près à 1,63 et 0,99 correspond à peu prés à 2,33.

On sait que par le biais d'estimateurs, la probabilité que Sarko obtienne sa "moyenne" estimée plus ou moins 1,63 multiplié par l'écart-type et divisé par la racine carrée de l'échantillon est de 0,95.

Si on veut être plus précis, la probabilité que Sarko obtienne sa "moyenne" estimée plus ou moins 2,33 multiplié par l'écart-type et divisé par la racine carrée de l'échantillon est de 0,99.

 

Si on prend une probabilité de 0,95, cela donne comme échantillon : [40,3 % ; 45,7%].

Si on prend une probabilité de 0,99, cela donne comme échantillon : [39,3 % ; 46,7%].

Autrement dit la probabilité que Sarkozy ait plus de 46,7 % des voix est inférieure à 1%.

 

Bon, c'est vrai, ce sont des modèles.  Tout dépend de la validité des échantillons. Sont-ils biaisés ou pas?

On peut espèrer que les instituts divers qui interviennent n'ont pas intérêt à biaiser leurs échantillons. Leur réputation en prendrait un coup.

Tout cela suppose bien évidemment qu'il ne se passe rien de particulier d'ici Mai 2012....

Les Mathématiciens pensent donc raisonnablement que Sarkozy ira faire du droit dans 3 mois.

Je dirai même plus : Sarkozy converge presque surement vers le matier d'avocat, que la phase  soit a prioi ou a posteriori.

Tous les commentaires

Et ceux qui ne se prononcent pas ou refusent de répondre ! L'échantillon n'est-il pas biaisé dès le départ ?

 

Et je ne parle pas des corrections à la louche suivant l'air du temps, alors mon cher Philippe, à vos équations !

 

En fait, s'il n'y avait qu'un seul sondage, on pourrait le penser. Mais, si on considère qu'il y a p sondages ( p entier strictement positif) et que chaque sondage correspond à une variable aléatoire Xi d'espérance pi, d'écart-type si, alors, on va dire en langage simple que la moyenne des Xi converge encore plus vite vers la moyenne des pi.....

Encore une fois, ceci est valable dès que l'échantillon est supérieur à 30, ce qui est le cas, puisque l'échantillon ususel est de l'ordre de 1000 personnes pour une population de 65 millions d'habitants. Un achnatillonage non biaisé correspond à la population. il faut garder les mêmes proportions d'hommes , de femmes, de catégories socio-professionnelles, de gens qui votent blanc ou qui ne votent pas....

Il serait surprenant que les diverses agences qui font des sondages biaisent tous de la même manière et en regroupant les différents sondages on a une précision encore plus grande.

L'intérêt, c'est de pourvoir faire un rapprochement entre les statistiques et les probabilités.

Sauf s'il y a un complot entre les agences de sondage pour biaiser intentionnellemnt les échantillons ( ce qui est POSSIBLE, mais je n'y crois pas), les résultats que j'ai donnés avec les proobabilités sont justes.

  Ceci étant, même un événement de probabilité faible peut arriver. On parle de probabilités.

 

En plus j'ai fait une petite erreur. La probabilité n'est pas de 1%, mais de 0,5 %. En effet, la probabilité qu'il soit à l'extérieur de l'intervalle est de 1%.  Il a autant de chances d'être en dessous qu'au dessus. Donc, la probabilité qu'il aie plus de 46,7 % est de  0,005.

Je pense qu'il est probable que nous ne le verrons plus après le mois de mai (calcul perso), étant donné qu'il a pris un méchant coup de vieux suite à la perte du triple A (cf. "le canard enchainé"), je subodore qu'il va encore en subir quelques uns d'ici la fin de la campagne et alors le calcul de probabilité deviendra une certitude, c'est à dire qu'il ne dépassera guère les 40% s'il survit jusque là (toujours calcul perso) !

 

moi, c'est pas perso, c'est mathématique....Lol.

Newsletter
Je m'identifie