Politicométrie: janvier 2016

Pour inaugurer ce blog, dans lequel je compte mettre quelques travaux statistiques ou économétriques extra professionnels qui ne se résument pas bien en 130 caractères voici un peu de "politicométrie". Que les économètres excusent un manque de rigueur (je ne sais pas encore faire tout ce que je voudrais avec R! aucun relecteur à la publication sur ce site). Que les gens normaux excusent le jargon. Pour une lecture rapide : le résumé ci-dessous, le premier graphique, et le dernier.

Résumé : La série chronologique du chômage en France et celle des résultats électoraux du Front National entre 1984 et 2015 sont faiblement corrélées. Mais dans modèle tenant compte de deux ruptures on obtient qu'un point de chômage en plus est associé à environ un point de côte de popularité en plus pour le FN, puis environ un point de vote en plus. A taux de chômage donné, à partir de 2011, c’est-à-dire sous la présidence de Marine Le Pen, le FN gagne près de 10 points de popularité. Entre l’élection de Nicolas Sarkozy à la Présidence de la République en 2007 et sa défaite en 2012, le FN perd en moyenne 5 points de pourcentage des votants. Par ailleurs les élections Présidentielles mais aussi Régionales sont les plus favorables au FN.

Le chômage est souvent avancé comme facteur explicatif du vote pour le Front National. Voyons dans quelle mesure 30 ans d’histoire électorale de ce parti permettent de valider cette hypothèse.

Un premier graphique superpose les scores du FN depuis les élections Européennes de juin 1984 jusqu’aux élections Régionales de décembre 2015 (cercles rouges) et la série du taux de chômage (ligne noire). Sont prises en comptes les élections Européennes, Régionales, Présidentielles, Législatives (repérables sur le graphique car le score du FN y est systématiquement moins élevé qu’aux Présidentielles qui les précèdent immédiatement, sauf en 1995 (Jacques Chirac ne dissout pas l’Assemblée Nationale en débutant son premier septennat) ; apparaissent donc deux cercles à peu près alignés verticalement). Sont exclues les élections Cantonales et Municipales dans lesquelles le FN n’a pas de candidats sur tout le territoire. Seul le premier tour de chaque élection est pris en compte.

La capacité du chômage à rendre compte de la variabilité du vote pour le FN semble modérée. Avec une régression économétrique simple, en contrôlant pour le type d’élection (on y reviendra) on trouve qu’un point de chômage en plus et associé à 1,8% de vote en plus pour le FN. Mais ce chiffre est très imprécis, il se situe dans un intervalle de confiance (à 95%, pour les connaisseurs) allant environ de 0 (pas d’impact du chômage) à 4 (très fort impact du chômage).

Trois périodes en particulier expliquent le faible pouvoir explicatif d’un modèle simple : Présidentielles et Législatives de 2002 (scores élevés du FN malgré un taux de chômage assez bas –en hausse cependant), score à nouveaux très élevés en 2012 et surtout 2014-2015 alors que le chômage est élevé mais à peu près au même niveau que vingt ans auparavant.

La côte de popularité du FN

L’économètre est confronté au problème du manque d’observations : 25 élections donc 25 observations.

Pour disposer de plus de points nous pouvons utiliser une mesure de popularité du FN issue du baromètre TNS-Sofres / Figaro-Magazine. Dans le cas du FN une enquête mensuelle recueille depuis 1984 les réponses à la question suivante : « Avez-vous une opinion très bonne, plutôt bonne, plutôt mauvaise ou très mauvaise du parti suivant : Front National ? ». Nous exploitons ici la somme des opinions favorables.

Cette mesure est assez bien corrélée avec le vote FN.

On notera cependant qu’à la fois en 2002-2004 et 2014-2015 le vote FN apparaît « anormalement » élevé au regard de la popularité le mois précédant l’élection. Il apparaît aussi que la popularité bénéficie des succès électoraux comme l’illustre l’élection Présidentielle de 1995 qui précède un pic de popularité exceptionnel mais de courte durée.

Qu’en est-il de la corrélation entre popularité et taux de chômage ? :

Il semble au regard de ce graphique possible d’expliquer une part importante de la popularité du FN. Pour parvenir à une équation satisfaisante nous allons cependant tenir compte de deux enseignements du graphique : (i) il est possible que la relation entre popularité et taux de chômage soit non linéaire, dans le sens où l’impact du chômage serait différent selon que son niveau est plus ou moins élevé ; plus simplement à la fois le niveau et l’évolution du taux de chômage pourrait avoir un rôle ; (ii) la très forte popularité du FN depuis 2011 ne semble pas pouvoir être expliquée par le chômage seul.

Le second point est le plus important. En effet cette forte popularité « explique » potentiellement bien le vote FN, qui on l’a vu a été très élevé dans les dernières années. Nous proposons une hypothèse, qui devrait être validée autrement que par la capacité explicative de note modèle : l’arrivée à la tête du FN de Marine Le Pen a fortement accru les opinions favorables à l’égard de ce parti, et par suite les votes qu’il a pu recueillir. Techniquement nous introduisons simplement une variable indicatrice en « marche d’escalier » (en février 2011) dans une régression de la popularité du FN sur le taux de chômage (en niveau, niveau au carré, variation et variation au carré comme le suggère l’appréciation faite dans le point (i)).

Le graphique suivant montre l’ajustement statistique qui en résulte.

Il apparaît que si la forte variabilité à court terme de la popularité du FN, en particulier dans les années 80 et au début des années 90 ne peut être expliquée, le modèle (aidé bien évidemment « mécaniquement » par la variable « Marine Le Pen » !) rend assez bien compte des inflexions de la popularité du FN. On observe toutefois, et sans surprise, que pic de popularité de 1995 n’est que très partiellement expliqué par le chômage. Peut-être du fait des tensions au sein du FN qui conduisent à la scission (MNR du Bruno Mégret, dont nous ajoutons les scores à ceux du FN) le FN est « anormalement » peu populaire à la fin des années 90 et au début des années 2000. A la veille du 21 avril 2002 la popularité du FN était en dessous de sa moyenne de long terme et la popularité « prédite » par le modèle (donc en fonction du chômage) était en forte hausse mais elle aussi à un niveau relativement bas. La hausse de popularité suivant la qualification de Jean-Marie Le Pen pour le second tour est éphémère même si la tendance à la hausse de la popularité se poursuit, suivant la courbe du chômage. Lors du mandat de Nicolas Sarkozy la popularité du FN apparaît inférieure à son niveau prédit.

Pour revenir sur le modèle on pourra noter qu’il explique environ 69% de la variance de la popularité du FN (R² ajusté –pour tenir compte du nombre de variables prises en compte– de 0,68). Au niveau de chômage actuel un point de chômage en plus entraîne une hausse d’environ un point de la popularité du FN. Les variations du chômage sont amplifiés dans la popularité du FN : une forte hausse (ou baisse) du chômage sur un an cause une hausse (baisse) plus que proportionnelle de la popularité du FN.

L’arrivée à la tête du FN de Marine Le Pen, si on accepte cette interprétation, « cause » une hausse de la popularité du FN d’environ 10 points de % (9,6%, avec un intervalle de confiance à 95% allant de 8,8 à 10,4%).

La capacité d’un FN dirigé par Marine Le Pen à surmonter le handicap qu’avait le parti dirigé par son père vis-à-vis de l’électorat féminin pourrait être une des explications de ce « bonus » élevé observé. Marie Merdrignac (Ouest-France) note ainsi qu’ « aux dernières régionales, en 2010, selon un sondage CSA réalisé sur 2 000 personnes, les femmes auraient voté à 10 % pour le parti d’extrême droite. Cette année, avant le premier tour, elles étaient 28 % à indiquer à Opinion Way, leur intention de voter Front national (sondage effectué sur un échantillon de 8 000 personnes). ». Plus généralement la « dédiabolisation » du FN paraît avoir réussi à élargir l’électorat potentiel (et effectif) de ce parti. Ce processus a sans doute été graduel, ce dont par souci de parcimonie notre modèle ne rend pas compte. On ne peut exclure toutefois que la rupture introduite en 2011 capte autre chose que les changements de stratégie et de leadership au FN. Les lecteurs de cet article sont invités à faire des suggestions !

Vote pour le FN

Dans un deuxième temps nous utilisons la série de popularité prédite par notre modèle (spécification préférée parmi celles n’utilisant pas d’information sur la popularité passée ou les scores passés du FN) ainsi que des variables indicatrices pour le type d’élection. Avec seulement 25 observations il est difficile à ce stade d’ajouter d’autres variables.

Il ressort de cette estimation qu’une hausse de 1 de la popularité prédite (donc indirectement du chômage) entraîne une hausse de 1 du score du FN (0,92 avec un intervalle de confiance entre 0,6 et 1,3). Le FN réalise en moyenne des scores très différents selon les scrutins : si on prend comme référence l’élection Européenne alors le score aux élections Législatives est de -0,6 (mais non significatif), les Régionales et Présidentielles sont entre +3,2 et +3,5.

Le graphique suivant présente les résultats du modèle. Les carrés rouges sont les estimations, les points bleus les scores du FN.

Les principaux écarts entre estimation et réalisé sont observés en 2002 (21 avril), 2014 (Européennes) et 2015 (Régionales) pour les cas de sous-estimation du FN par le modèle, en 2007 (surtout Législatives) et 2012 pour les sur-estimations du FN.

Modèles « augmentés » :

Si on introduit en 2011 la même rupture que dans le modèle de popularité, celle-ci ressort avec un coefficient d’environ -10 (mais non significatif aux niveaux usuels) dans le modèle de vote. Ce nouveau modèle, très proche en termes d’ajustement des données (R² ajusté de 0,595 au lieu de 0,586), conduit toujours à un gain d’environ 10 points de % aux élections après 2011 car la réponse du vote au chômage doublé, passant de 0,9 à 1,8. Un point de popularité (donc de chômage puisque la popularité répond environ un pour un au taux de chômage) se traduirait par près de 2 points de vote en plus. A partir de 2011 les 10 points supplémentaires de popularité conduisent à 8 points de vote aux élections pour le FN : 10*1,8 – 10. L’écart type associée au coefficient de 1,8 est toutefois très fort : l’intervalle de confiance à 95% s’étend de 0,3 à 3,5. Nous retrouvons ainsi les résultats obtenus dans un modèle expliquant directement le vote FN par le chômage, avec une incertitude légèrement moindre. Un coefficient très supérieur à sur la popularité pose problème puisqu’il implique que le vote FN peut théoriquement dépasser la population des personnes en ayant une opinion favorable. Le modèle correspondant donne par ailleurs des prévisions peu satisfaisantes à certaines périodes comme des Européennes de 2004 aux Régionales de 2010.

Le meilleur modèle parmi ceux testés comprend une variable indicatrice en « touche de piano » des Présidentielles de 2007 jusqu’aux Législatives de 2012. Cette période correspond à la campagne Présidentielle et au mandat de Nicolas Sarkozy (y compris Législatives de 2012 pour ne pas perturber l’estimation de l’indicatrice élections Législatives présente par ailleurs dans le modèle). La capacité de Nicolas Sarkozy à capter une partie de l’électorat frontiste est souvent discuté (voir par exemple Gilles Kepel, 2015). Nous proposons ici, en faisant l’hypothèse que cette capacité n’est effective qu’à partir de 2007 et seulement jusqu’à 2012, d’apporter une quantification de ce phénomène. Contrairement à l'"effet Marine Le Pen" l'"effet Nicolas Sarkozy" dans notre stratégie de modélisation affecte directement le vote, sans modifier la popularité du FN.

Il ressort de ce dernier modèle que la déperdition de voix pour le FN dans la période 2007-2012 était de 5 points de % (dans un intervalle de confiance de 2,6 à 7,4). Le coefficient de la popularité prédite est presque exactement de 1 (intervalle de confiance de 0,75 à 1,25). Les coefficients des différents types d’élections sont eux aussi plus précisément estimés. Toujours avec pour référence les Européennes, on obtient Législatives -0,1 (non significatif), Régionales +3,2 et Présidentielles +4,8.

"meilleur" modèle de vote pour le FN:

lm(formula = Score ~ PopuPred + ELEC + Sarkozy)

Residuals:

Min 1Q Median 3Q Max

-4.7389 -1.3127 -0.2271 1.5043 3.7170

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) -0.5684 1.9077 -0.298 0.768970

PopuPred 1.0047 0.1283 7.829 2.31e-07 ***

ELECLegisl 0.1283 1.3131 0.098 0.923204

ELECPresid 4.7952 1.4575 3.290 0.003850 **

ELECRegio 3.2378 1.3561 2.388 0.027505 *

Sarkozy -5.0345 1.1841 -4.252 0.000431 ***

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.434 on 19 degrees of freedom

(358 observations deleted due to missingness)

Multiple R-squared: 0.823, Adjusted R-squared: 0.7765

F-statistic: 17.67 on 5 and 19 DF, p-value: 1.461e-06

L’ajustement est de bonne qualité avec un R² ajusté de 0,78 et des écarts pour la plupart faibles entre prévisions et réalisations, comme on peut le voir dans le graphique ci-dessous :

On remarquera que la surprise du 21 avril 2001 avec un score de l’extrême droite (Jean-Marie Le Pen + Bruno Mégret) de 19,2% contre 15,5% prédit (à partir du chômage et du type d’élection) est atténuée mais demeure. L’écart est moins fort avec le score de Jean-Marie Le Pen seul, qui était de 16,86% (16,18% pour Lionel Jospin qui ne se qualifie pas pour le second tout).

Les scores prédit en 2012 demeurent trop élevés tandis que ceux de 2014 et 2015 sont sous-évalués

(25,3 contre 27,7 pour les dernières Régionales) mais ces écarts pourraient sans doutes être réduit en considérant des effets « Marine Le Pen » et/ou Sarkozy moins « abrupts » (progressivité dans le changement d’image du FN sous la présidence de Marine Le Pen, déclin de la capacité de Nicolas Sarkozy à capter un électorat FN).

L’utilisation faite ici du terme prévision est certainement abusive dans la mesure où les modèles utilisés sont estimés en prenant en compte les résultats du FN, sa popularité et le taux de chômage de 1983 à 2015 et non la seule information disponible avant chaque scrutin.

L’utilisation d’un modèle estimé sur les données jusqu’en 2014 pour prédire le résultat du FN aux Régionales de 2015 aurait donné un résultat satisfaisant mais probablement peu différent de ceux donnés par les sondages classiques. Les ruptures possibles telle celle que nous suggérons autour de 2011 et de 2007 à 2012, que nous ne modélisons pas à l’aide de variables observables ex-ante, réduisent beaucoup le potentiel prédictif d’une telle approche.

Reste que les résultats suggèrent que les sondages sur la côte de popularité des partis, réalisés avec une méthodologie suffisamment stables pendant de longues périodes, sont sans doute utiles pour « prédire » à court terme et surtout analyser ex post les trajectoires électorales.

Politicométrie

vendredi 29 janvier 2016

30 ans de chômage et de Front National