jfvacher (avatar)

jfvacher

Economiste

Abonné·e de Mediapart

53 Billets

0 Édition

Billet de blog 5 mai 2012

jfvacher (avatar)

jfvacher

Economiste

Abonné·e de Mediapart

Les chiffres du chômage dans le débat Hollande-Sarkozy

jfvacher (avatar)

jfvacher

Economiste

Abonné·e de Mediapart

Ce blog est personnel, la rédaction n’est pas à l’origine de ses contenus.

Réflexions à propos des chiffres du chômage

avancés lors du débat télévisé Hollande-Sarkozy du 2 mai 2012

 Comme beaucoup de français (et d’autres), j’ai suivi le débat Hollande-Sarkozy à la TV le soir du mercredi 2 mai 2012, et j’ai été particulièrement attentif à la question des chiffres qui ont été cités par les deux candidats, et fortement contestés, puisque c’est un de mes domaines d’activité. Nombre de chiffres ou données avancées posent en effet problème.

 J’ai suffisamment d’expérience avec la manipulation (volontaire ou non) des chiffres, qui ne se limite pas à leur simple interprétation, pour savoir que dans ce type de débat c’est malheureusement la pugnacité qui paye et non le respect des réalités. Il n’y a pas en statistique (comme en d’autres domaines) de vérité suprême ou établie une fois pour toute mais des vérités partielles ou relatives qui dépendent des concepts et méthodes choisies (définitions, périmètres, périodisation, conventions adoptées, modes de calcul, reflet ou non de réalités mouvantes, etc.…).

 Dans le cas présent, j’ai choisi de revenir sur le premier désaccord apparu dans le débat parce qu’il me semble très emblématique : le chiffre du chômage. Tout le monde a bien compris, du moins parmi ceux qui sont des habitués de ce genre de controverse, qu’il ne s’agissait pas des mêmes données avancées par les deux candidats : les chiffres de Pôle Emploi pour François Hollande et ceux de l’Enquête Emploi de l’INSEE basée sur la définition du BIT. Ces deux sources sont différentes (même s’il y a des liens entre elles) et n’ont pas la même signification. Je voudrais juste apporter ici quelques précisions qui me semblent absolument indispensables si l’on veut éviter des réactions du genre : « C’est faux ! » qui n’apportent rien et sont de plus complètement inappropriées, puisqu’il s’agit de deux sources tout à fait légitimes (voire légales).

 Comme je ne peux, ni ne veux, trop rentrer dans le détail de cette question extrêmement complexe et technique (le Diable est dans les détails), je joins d’abord les deux dernières publications correspondant à ces deux séries qui viennent de sortir fin avril, afin que l’on puisse avoir d’abord une meilleure idée de ce qui les sépare aujourd’hui. Pour aller vite, on peut consulter à ce sujet le petit paragraphe de l’Encadré 2 à la fin du document de la DARES (la Direction du Ministère du Travail qui traite les données de Pôle Emploi) qui fait un bon parallèle avec le chômage au sens du BIT. De même, l’Information rapide de l’INSEE donne le minimum d’informations méthodologiques. D’autres documents plus approfondis sont également disponibles sur les deux sites concernés.

 Ce que je souhaite apporter ici, c’est un certain nombre d’éléments de contexte ou de méthode qui n’apparaissent pas au seul vu des chiffres, mais résultent d’une longue pratique et d’expériences personnelles dans l’univers où ont été élaborées ces données.

1 - Le contexte historique :

 Depuis plus de trente cinq ans que j’ai enseigné l’économie et participé à la création et l’utilisation d’outils statistiques (je ne joue pas ici sur le registre « ancien combattant »), j’ai constaté que les chiffres du chômage étaient particulièrement « sensibles » et suscitaient toujours beaucoup de réactions parmi les gouvernants. C’est bien sûr également vrai pour la croissance, l’inflation, le pouvoir d’achat, etc.…. L’INSEE (qui produit ou contrôle environ 90 % de la production statistique en France) a dû beaucoup batailler pour tenter de garder son indépendance (relative). Des compromis ont dû malheureusement être faits pour garder l’essentiel, mais au prix d’une plus grande complexité (et d’une certaine démoralisation).

 Jusque dans les années 80, il existait 3 principaux indicateurs officiels du chômage que l’on pouvait utiliser concurremment :

  • Le « chômage au sens de l’INSEE » qui résultait de l’exploitation de l’Enquête Emploi réalisée en mars chaque année, ainsi que d’informations issues du recensement. Rapidement, on peut dire que toute personne se déclarant sans emploi lors de l’enquête faisait partie de la « Population disponible à la recherche d’un emploi » (PDRE), définition que l’on pouvait élargir en rajoutant des actifs « marginaux » (PMDRE). L’ensemble des deux concepts formait la notion la plus large du chômage, proche du sous-emploi.
  • Le « chômage au sens du BIT ». La conception du BIT (Bureau International du Travail, institution internationale basée à Genève), auquel participent également les syndicats, a l’avantage de reposer sur une définition harmonisée permettant d’effectuer des comparaisons homogènes entre pays. Elle est en principe très restrictive (voir les 3 conditions dans les PJ), mais recouvre en fait une approche assez classique du sous-emploi. En pratique ses résultats étaient supérieurs à ceux de l’INSEE, ce qui poussait naturellement les gouvernants à ignorer ces données statistiques (et ses opposants à faire le contraire). La bataille de chiffres se livrait surtout entre INSEE et BIT.
  • Les « Demandes d’emploi en fin de mois (DEFM) » que collecte pour sa part l’ANPE et que traite le Ministère du Travail. Il s’agit ici de données administratives globales et non de statistiques au sens plein du terme (puisque basées sur des dossiers constitués sur des critères purement administratifs et dépendant du comportement des inscrits et non-inscrits). L’ANPE collecte également les Offres d’emploi et le solde forme le déficit d’emploi, qui n’est pas vraiment représentatif du besoin d’emploi, et encore moins du sous-emploi. Son principal avantage était sa périodicité mensuelle, ce qui lui donnait une importance médiatique assez grande. Toutefois, ses résultats étaient souvent supérieurs à ceux de la PDRE de l’INSEE.

 Dans les années 80, les courbes des deux premiers indicateurs se sont inversées en raison de la montée du chômage (conséquence de la crise), qui était alors mieux pris en compte dans l’enquête de l’INSEE, tandis que la définition du BIT devenait plus restrictive (on ne compte notamment pas les personnes ayant travaillé ne serait-ce qu’une heure au cours de la période de référence dans un contexte où le travail devient plus partiel et précaire). En conséquence, les gouvernants ont alors privilégié le chômage au sens du BIT dans leurs références économiques ou les critères d’appréciation de leur politique…..

 Les méthodes et définitions ont donc progressivement changé. Les critères se sont étoffés, y compris pour les DEFM qui ont introduit des tranches d’âge et des notions de durée. L’enquête emploi conserve toujours un rôle moteur mais sa nature, ses définitions, ses particularités (base de sondage, périmètre géographique, taille de l’échantillon) et sa périodicité ont été changés dans un processus en plusieurs étapes. Des jeux de nouvelles enquêtes partielles et des méthodes provisoires ont été testés dans les années 90 et 2000.

 Dans un premier temps, on a tenté d’articuler le niveau annuel de l’enquête emploi avec le profil d’évolution des DEFM par un processus complexe d’ajustement et de calage (les statisticiens adorent ce type de « bricolage »), c.-à-d. que les indicateurs de chômage de l’INSEE évoluent comme les données de l’ANPE mais sont fixés plus ou moins au niveau donné une fois par an par l’enquête. L’idée est de disposer d’indicateurs en continu pendant toute l’année, mais la période avant le calage ou de raccord est particulièrement difficile si les différences d’évolution entre données administratives et données d’enquête sont trop fortes. Il faut pouvoir expliquer les sauts ou les écarts créés par les nouveaux ajustements.

 Parallèlement, Eurostat, le service statistique de la Commission européenne, a préconisé d’harmoniser toutes les statistiques d’emploi en Europe en se calant sur les critères de l’Organisation Internationale du Travail (l’OIT, dont le BIT est le secrétariat permanent) et donc pousse également dans le sens d’un changement de la définition du chômage dans l’enquête Emploi de l’INSEE. Le premier pas vers les nouvelles séries de l’INSEE a été lancé en 2001 mais c’est fin 2007 que la décision fur prise. L’enquête devient continue (sauf dans les DOM où le calcul est spécifique), et seulement trimestrielle (ce qui en fait un indicateur conjoncturel), elle repose sur la définition du chômage au sens du BIT, augmente progressivement de 50 % son échantillon (en visant 100.000 ménages/logements), ajoute des pondérations, corrige des variations saisonnières (CVS), etc… L’enquête Emploi est complètement modifiée et la notion de chômage au sens de l’INSEE disparaît au profit d’une présentation du « taux de chômage au sens de l’INSEE/BIT » (rapport à la population active, dont le périmètre est d’ailleurs également discutable).

 Au total, les premières estimations de la nouvelle Enquête ont été présentées en novembre 2007 et ont montré que, si le profil précédent n’a pas sensiblement évolué, les niveaux par contre sont sensiblement plus bas de 1 point de % de la population active (dont 0,7 % attribuable aux critères spécifiquement européens). Par exemple, le taux de chômage annuel moyen sur l’année 2006 est passé de 9,8 % dans l’ancienne série à 8,8 % dans la nouvelle série ! On a beaucoup crié à la manipulation et sommé le gouvernement de s’expliquer, d’autant plus que Nicolas Sarkozy venait d’être élu et que les chiffres de l’INSEE sont devenus une de ses « bêtes noires ». Si certains arguments plaident en faveur d’une harmonisation européenne et internationale, les résultats démontrent clairement le bénéfice tiré par le nouveau pouvoir. De plus, on note un écart sensible avec la courbe des DEFM….

 De fait, la question a été rendue encore plus grave et complexe par l’épisode survenu au début de 2007. Cette réforme avait en réalité été prévue pour mars 2007 et son report en fin d’année fut brutalement décidé. Elle avait été préparée avant les élections par un Directeur Général de l’INSEE (nommé par la gauche), dont la maladresse involontaire a surpris tous les cadres de l’INSEE et a jeté le discrédit sur l’Institut qui semblait ainsi se mettre à genoux devant le nouveau pouvoir. Le Directeur des statistiques sociales de l’INSEE devait comme convenu transmettre les nouvelles séries à Eurostat dès mars 2007. Il n’a pas voulu le faire, alors qu’il aurait pu se contenter de signaler des problèmes de mise en œuvre. Il a seulement transmis les nouveaux chiffres bruts de l’Enquête. C’était à mon avis essentiellement pour des raisons de conscience du fait de la fragilité des nouvelles séries, du risque de mauvaise interprétation et surtout du contexte de la campagne présidentielle. Malheureusement, le Directeur des statistiques sociales à Eurostat (qui avait été un de ses prédécesseurs à l’INSEE) a publié les séries retraitées sans état d’âme (cela a été confirmé en privé) et a donc provoqué un incident politico-médiatique puisqu’il donnait l’impression que l’INSEE publiait les chiffres voulus par le nouveau pouvoir. Quoi qu’il en soit, le Directeur Général de l’INSEE de cette époque a été finalement « remercié », comme d’ailleurs son successeur actuel doit l’être incessamment, remplacé par un proche de Nicolas Sarkozy contre toutes les règles (manque de zèle semble-t-il ?). J’ai évoqué cet épisode qui a traumatisé l’ensemble du personnel (en même temps que le projet de délocalisation de l’Institut) pour rappeler qu’un organisme statistique libre et indépendant est vital pour la démocratie, au même titre que l’audiovisuel public par exemple.

2 - Le fond du débat :

 Sur le fond, si on revient au débat télévisé, les chiffres échangés n’étaient en aucune manière comparables, et ce pour deux raisons : la différence de sources d’abord, et également le fait que F. Hollande raisonnait en nombre de chômeurs et que N. Sarkozy lui opposait des taux de chômage dont la comparaison n’est pas directe. Mes remarques sur les chiffres avancés sont les suivantes :

  • Les séries de DEFM publiées par la DARES viennent de Pôle Emploi (issu de la fusion de l’ANPE et de l’URSSAF) et comportent un changement important des catégories qui sont depuis 1995 au nombre de 5 et notées A, B, C, D et E (au lieu de 1, 2, 3 à 8 précédemment) en fonction du comportement des inscrits (voir le tableau dans la PJ correspondante). Il y a aussi des distinctions secondaires mais non négligeables : corrections CVS-CJO (saisonnalité et jours ouvrables), France métropolitaine et DOM. La première catégorie A est la plus suivie dans les médias et affiche en mars 2012, pour la seule France métropolitaine, un chiffre de 2.884,5 milliers de chômeurs contre un ensemble ABCDE de 4.920,4 milliers, soit près d’un total de 5 Millions d’inscrits en CVS-CJO. En données brutes (non corrigées), la seule catégorie A comprend 2.905,6 milliers de chômeurs sur le territoire métropolitain et 241,2 milliers dans les DOM, soit un total de 3.146,8 milliers de chômeurs pour la France en catégorie « A », la plus restrictive.
  • François Hollande a mentionné une « augmentation de 700.000 pour ceux qui n’ont aucune activité ». On peut supposer qu’il s’agit de la catégorie A, pour la France métropolitaine, calculée en CVS-CJO (soit le résultat minimal en général). Or, mes calculs sur ce champ limité montrent en fait plusieurs chiffres selon la période considérée (voir fichier Séries DARES joint) : + 864,0 milliers de décembre 2007 à mars 2012, + 769,5 milliers de juin 2007 à mars 2012, + 713,8 milliers de mars 2007 à mars 2012. C’est probablement ce dernier montant auquel se référait Hollande, puisqu’il s’agit d’un accroissement « en glissement annuel » (méthode préférée par les medias) de début à fin de période (fin mars 2007 à fin mars 2012). Il faut donc conclure que le chiffre choisi est le plus faible, et le plus favorable a priori pour Sarkozy ! Le champ ABC cité dans Ouest-France aurait donné sur la même période + 1.028,4 milliers ou un bon million (soit + 31,3 %).
  • Il faut noter, pour être complet, que les économistes et les comptables nationaux (et d’une manière générale les spécialistes de macroéconomie) raisonnent plutôt sur le moyen et long terme, et utilisent donc des séries annuelles, où les calculs sont effectués à l’opposé en « moyenne annuelle » qui peuvent donner des résultats significativement différents des évolutions mesurées en glissement. On peut dans certains cas complètement changer le sens de l’histoire, en particulier si la conjoncture est atypique comme en période de crise, et des débats sanglants en période électorale peuvent s’ensuivre (j’ai eu quelques expériences de ce type dans le passé). Cette question n’est pas simplement technique. On peut le voir dans le cas qui nous occupe, puisque j’ai mis en regard les moyennes annuelles dans le document joint. On peut effectivement trouver une augmentation inférieure à 700.000 chômeurs (+ 628.700) si l’on prend la période 2007-2011, mais dans ce cas on gomme la dégradation récente des derniers mois, et si on va jusqu’en mars 2012, l’évolution moyenne est de + 751.500 environ. Ces calculs sont un peu plus complexes en réalité puisqu’il s’agit de données corrigée CVS-CJO (il faudrait le faire sur des données brutes, puis les recorriger à nouveau) et l’on me pardonnera une très légère approximation pour faire vite.
  • La courbe du taux de chômage au sens du BIT (document joint INSEE/BIT) indique bien le creux de la fin 2007/début 2008, la remontée brutale consécutive à la crise mondiale exceptionnelle de 2007/2008 et à la récession qui s’en est notamment suivie en France. Elle a d’ailleurs une allure assez similaire à celle des DEFM. Quel que soit le périmètre choisi (Métropole/France, CVS/brut) et le poids des nouvelles méthodes d’enquête mises en place à ce moment-là, on ne peut nier la hausse de cet indicateur du chômage de l’ordre de 2,5 points de % de la population active, ce qui est un écart très élevé. Il faut se rapporter au dernier document joint pour en apprécier plus précisément l’importance.
  • Les chiffres cités par M. Sarkozy ont une origine très claire comme le montre le tableau de synthèse présenté dans ce document. L’augmentation de 422.000 chômeurs au sens du BIT entre 2007 et 2011 (soit le taux de 18,7 % indiqué) est bien réelle mais dépend du mode de calcul de la période de référence choisie, puisqu’il s’agit de données trimestrielles. Dans ce cas, il s’agit d’un accroissement calculé entre le second trimestre 2007 (où Nicolas Sarkozy est arrivé au pouvoir) et le quatrième trimestre 2012 qui vient d’être publié. Si l’on choisit un autre point de départ pour la période à prendre en compte qui soit plus réaliste (il faut un certain temps pour que des politiques donnent des résultats, particulièrement en matière de chômage), on peut partir du 3èmeou 4ème trimestre 2007, voire même du premier trimestre de 2008 qui est le point le plus bas avant le retournement, on obtient respectivement des chiffres de 464.000, 593.000 et 685.000 chômeurs en supplément (voir Graphique 3), ce qui pour le dernier est très proche des 700.000 donnés par François Hollande (le taux d’accroissement correspondant de + 34,4 %, est même légèrement supérieur à celui de + 32,9 % lorsqu’on prend le chiffre considéré comme minimal de 713.800 personnes des DEFM).
  • Un simple calcul en « moyenne annuelle », qui est plus pertinent, mais a aussi l’avantage (d’un point de vue « sarkozyste ») de « lisser » les séries trimestrielles, donne malgré tout + 403.000 chômeurs par rapport à la moyenne de 2007 et même + 561.000 par rapport à celle de 2008 (dont les résultats économiques sont plus mauvais). Techniques de lissage et choix plus ou moins arbitraire des périodes de référence sont des outils très classiques pour faire dire ce que l’on veut à une chronique statistique (tout en restant objectif et légitime sur les méthodes). C’est la façon dont on emploie ces outils, et en particulier les critères et hypothèses retenues qui font la différence entre l’analyse sérieuse et la manipulation.
  • Au total, il est normal que ces deux méthodes si différentes par nature donnent des résultats assez divergents. La réalité économique est toujours difficile à saisir, et encore plus à mesurer. Néanmoins, l’ordre de grandeur du chômage cité par le candidat socialiste me semble assez fondé au vu des analyses précédentes, et son estimation plutôt basse, tandis que son opposant (ou ses conseillers) fait preuve d’une certaine légèreté (voire de mauvaise foi) dans l’interprétation de ces données, qui restent toujours contestables dans leur principe mais ne sauraient valablement donner lieu à de telles arguties étant donné l’ampleur de la crise.
  • Enfin, en ce qui concerne la comparaison avec la Zone Euro, et les rythmes comparés de croissance du chômage entre pays, les chiffres du communiqué d’Eurostat publié le 2 mai (voir dernier document joint) donnent un profil d’évolution de la Zone euro et de l’UE27 assez comparable au profil français (graphes). Toutefois, il est exact que l’accroissement du taux de chômage sur la même période mars 2012/ mars 2007 est de + 14,9 % contre + 39,7 % pour la Zone euro à 17, soit environ 2,6 fois moins, mais il faut noter que cette dernière part d’un taux de chômage moins élevé de près d’un point (7,8 % contre 8,7 % pour la France) et atteint un niveau plus fort en mars 2012 (respectivement 10,9 % et 10,0 %). On peut également remarquer que le taux de l’Espagne qui était inférieur à celui de la France en mars 2007 (8,0 %) a augmenté depuis de 16,1 points, et a donc triplé pour atteindre 24,1 % en mars 2012.
  • Si les chiffres de François Hollande ont donc été minimalistes dans ce débat, il n’en reste pas moins que les deux sources ne sont pas strictement comparables. D’une manière générale, deux remarques importantes doivent être faites : 1°) - objectivement, les chiffres de l’INSEE issus de l’enquête Emploi au sens du BIT sont d’abord plus significatifs d’un point de vue économique (de par leurs méthodes de construction) et moins entachés des défauts des fichiers administratifs mais obéissent par contre à des critères plus restrictifs ; 2°) - l’opposition entre les deux repose sur des arguments d’ordre technique et non de légitimité puisqu’il s’agit dans les deux cas de chiffres officiels se référant à des réalités différentes qui sont plus complémentaires que concurrentes. Je rajouterais que la DARES est un SSM (Service statistique ministériel) dans le jargon du Système statistique public (SSP), qui est chapeauté et contrôlé officiellement par le CNIS (Conseil national de l’information statistique, organisme paritaire national créé pratiquement en même temps que l’INSEE) et qu’en pratique le Chef et les cadres d’un SSM sont des agents de l’INSEE (comme je l’ai notamment été). Ce dernier dispose de tous les moyens pour assurer la conformité aux règles et principes statistiques, même si la tendance à la privatisation/sous-traitance de ses fonctions est en cours.

 J’espère que ces développements, qui sont un peu plus longs que je ne l’avais prévu initialement, permettront aux lecteurs de se faire une meilleure idée des méthodes d’élaboration des chiffres et de la difficulté de mesurer avec pertinence une réalité par nature mouvante et complexe, et en dernière analyse d’apprécier plus justement ce genre de querelles apparemment techniques. J’aurais souhaité aborder le débat sur les chiffres de la Dette, mais ce sera pour une autre fois.

 Jean-François Vacher

Ce blog est personnel, la rédaction n’est pas à l’origine de ses contenus.