Pour inaugurer ce blog, dans lequel je compte mettre quelques travaux statistiques ou économétriques extra professionnels qui ne se résument pas bien en 130 caractères voici un peu de "politicométrie". Que les économètres excusent un manque de rigueur (je ne sais pas encore faire tout ce que je voudrais avec R! aucun relecteur à la publication sur ce site). Que les gens normaux excusent le jargon. Pour une lecture rapide : le résumé ci-dessous, le premier graphique, et le dernier.
Résumé : La série chronologique du chômage en France et celle des résultats électoraux du Front National entre 1984 et 2015 sont faiblement corrélées. Mais dans modèle tenant compte de deux ruptures on obtient qu'un point de chômage en
plus est associé à environ un point de côte de popularité en plus pour le FN,
puis environ un point de vote en plus. A taux de chômage donné, à
partir de 2011, c’est-à-dire sous la présidence de Marine Le Pen, le FN gagne
près de 10 points de popularité. Entre l’élection de Nicolas Sarkozy à la Présidence
de la République en 2007 et sa défaite en 2012, le FN perd en moyenne 5 points
de pourcentage des votants. Par ailleurs les élections Présidentielles mais aussi Régionales sont les plus favorables au FN.
Le chômage est souvent avancé comme facteur explicatif du
vote pour le Front National. Voyons dans quelle mesure 30 ans d’histoire
électorale de ce parti permettent de valider cette hypothèse.
Un premier graphique superpose les scores du FN depuis les
élections Européennes de juin 1984 jusqu’aux élections Régionales de décembre
2015 (cercles rouges) et la série du taux de chômage (ligne noire). Sont prises
en comptes les élections Européennes, Régionales, Présidentielles, Législatives
(repérables sur le graphique car le score du FN y est systématiquement moins
élevé qu’aux Présidentielles qui les précèdent immédiatement, sauf en 1995
(Jacques Chirac ne dissout pas l’Assemblée Nationale en débutant son premier
septennat) ; apparaissent donc deux cercles à peu près alignés
verticalement). Sont exclues les élections Cantonales et Municipales dans
lesquelles le FN n’a pas de candidats sur tout le territoire. Seul le premier
tour de chaque élection est pris en compte.
La capacité du chômage à rendre compte de la variabilité du
vote pour le FN semble modérée. Avec une régression économétrique simple, en contrôlant pour le type
d’élection (on y reviendra) on trouve qu’un point de chômage en plus et associé à
1,8% de vote en plus pour le FN. Mais ce chiffre est très imprécis, il se situe
dans un intervalle de confiance (à 95%, pour les connaisseurs) allant environ
de 0 (pas d’impact du chômage) à 4 (très fort impact du chômage).
Trois périodes en particulier expliquent le faible pouvoir
explicatif d’un modèle simple : Présidentielles et Législatives de
2002 (scores élevés du FN malgré un taux
de chômage assez bas –en hausse cependant), score à nouveaux très élevés en
2012 et surtout 2014-2015 alors que le chômage est élevé mais à peu près au
même niveau que vingt ans auparavant.
La côte de popularité du FN
L’économètre est confronté au problème du manque
d’observations : 25 élections donc 25 observations.
Pour disposer de plus de points nous pouvons utiliser une
mesure de popularité du FN issue du
baromètre TNS-Sofres / Figaro-Magazine.
Dans le cas du FN une enquête mensuelle recueille depuis 1984 les réponses à la
question suivante :
« Avez-vous une
opinion très bonne, plutôt bonne, plutôt mauvaise ou très mauvaise du parti
suivant : Front National ? ». Nous exploitons ici la somme des opinions
favorables.
Cette mesure est assez bien corrélée avec le vote FN.
On notera cependant qu’à la fois en 2002-2004 et 2014-2015
le vote FN apparaît « anormalement » élevé au regard de la popularité
le mois précédant l’élection. Il apparaît aussi que la popularité bénéficie des
succès électoraux comme l’illustre l’élection Présidentielle de 1995 qui
précède un pic de popularité exceptionnel mais de courte durée.
Qu’en est-il de la corrélation entre popularité et taux de
chômage ? :
Il semble au regard de ce graphique possible d’expliquer une
part importante de la popularité du FN. Pour parvenir à une équation
satisfaisante nous allons cependant tenir compte de deux enseignements du
graphique : (i) il est possible que la relation entre popularité et taux
de chômage soit non linéaire, dans le sens où l’impact du chômage serait
différent selon que son niveau est plus ou moins élevé ; plus simplement à
la fois le niveau et l’évolution du taux de chômage pourrait avoir un
rôle ; (ii) la très forte popularité du FN depuis 2011 ne semble pas
pouvoir être expliquée par le chômage seul.
Le second point est le plus important. En effet cette forte
popularité « explique » potentiellement bien le vote FN, qui on l’a
vu a été très élevé dans les dernières années. Nous proposons une hypothèse,
qui devrait être validée autrement que par la capacité explicative de note
modèle : l’arrivée à la tête du FN de Marine Le Pen a fortement accru les
opinions favorables à l’égard de ce parti, et par suite les votes qu’il a pu
recueillir. Techniquement nous introduisons simplement une variable indicatrice
en « marche d’escalier » (en février 2011) dans une régression de la
popularité du FN sur le taux de chômage (en niveau, niveau au carré, variation
et variation au carré comme le suggère l’appréciation faite dans le point (i)).
Le graphique suivant montre l’ajustement statistique qui en
résulte.
Il apparaît que si la forte variabilité à court terme de la
popularité du FN, en particulier dans les années 80 et au début des années 90
ne peut être expliquée, le modèle (aidé bien évidemment
« mécaniquement » par la variable « Marine Le Pen » !)
rend assez bien compte des inflexions de la popularité du FN. On observe
toutefois, et sans surprise, que pic de popularité de 1995 n’est que très
partiellement expliqué par le chômage. Peut-être du fait des tensions au sein
du FN qui conduisent à la scission (MNR du Bruno Mégret, dont nous ajoutons les
scores à ceux du FN) le FN est « anormalement » peu populaire à la
fin des années 90 et au début des années 2000. A la veille du 21 avril 2002 la
popularité du FN était en dessous de sa moyenne de long terme et la popularité
« prédite » par le modèle (donc en fonction du chômage) était en forte
hausse mais elle aussi à un niveau relativement bas. La hausse de popularité
suivant la qualification de Jean-Marie Le Pen pour le second tour est éphémère
même si la tendance à la hausse de la popularité se poursuit, suivant la courbe
du chômage. Lors du mandat de Nicolas Sarkozy la popularité du FN apparaît
inférieure à son niveau prédit.
Pour revenir sur le modèle on pourra noter qu’il explique
environ 69% de la variance de la popularité du FN (R² ajusté –pour tenir compte
du nombre de variables prises en compte– de 0,68). Au niveau de chômage actuel
un point de chômage en plus entraîne une hausse d’environ un point de la
popularité du FN. Les variations du chômage sont amplifiés dans la popularité
du FN : une forte hausse (ou baisse) du chômage sur un an cause une hausse
(baisse) plus que proportionnelle de la popularité du FN.
L’arrivée à la tête du FN de Marine Le Pen, si on accepte
cette interprétation, « cause » une hausse de la popularité du FN
d’environ 10 points de % (9,6%, avec un intervalle de confiance à 95% allant de
8,8 à 10,4%).
La capacité d’un FN dirigé par Marine Le Pen à surmonter le handicap
qu’avait le parti dirigé par son père vis-à-vis de l’électorat féminin pourrait
être une des explications de ce « bonus » élevé observé. Marie
Merdrignac (Ouest-France) note ainsi qu’
« aux dernières régionales, en 2010, selon un sondage CSA
réalisé sur 2 000 personnes, les
femmes auraient voté à 10 % pour le parti d’extrême droite. Cette année,
avant le premier tour, elles étaient 28 % à indiquer à Opinion Way, leur intention de voter Front national
(sondage effectué sur un échantillon de 8 000 personnes). ». Plus
généralement la « dédiabolisation » du FN paraît avoir réussi à
élargir l’électorat potentiel (et effectif) de ce parti. Ce processus a sans
doute été graduel, ce dont par souci de parcimonie notre modèle ne rend pas
compte. On ne peut exclure toutefois que la rupture introduite en 2011 capte
autre chose que les changements de stratégie et de leadership au FN. Les
lecteurs de cet article sont invités à faire des suggestions !
Vote pour le FN
Dans un deuxième temps nous utilisons la série de popularité
prédite par notre modèle (spécification préférée parmi celles n’utilisant pas
d’information sur la popularité passée ou les scores passés du FN) ainsi que
des variables indicatrices pour le type d’élection. Avec seulement 25
observations il est difficile à ce stade d’ajouter d’autres variables.
Il ressort de cette estimation qu’une hausse de 1 de la
popularité prédite (donc indirectement du chômage) entraîne une hausse de 1 du
score du FN (0,92 avec un intervalle de confiance entre 0,6 et 1,3). Le FN
réalise en moyenne des scores très différents selon les scrutins : si on
prend comme référence l’élection Européenne alors le score aux élections
Législatives est de -0,6 (mais non significatif), les Régionales et
Présidentielles sont entre +3,2 et +3,5.
Le graphique suivant présente les résultats du modèle. Les
carrés rouges sont les estimations, les points bleus les scores du FN.
Les principaux écarts entre estimation et réalisé sont
observés en 2002 (21 avril), 2014 (Européennes) et 2015 (Régionales) pour les
cas de sous-estimation du FN par le modèle, en 2007 (surtout Législatives)
et 2012 pour les sur-estimations du FN.
Modèles « augmentés » :
Si on introduit en 2011 la même rupture que dans le modèle de
popularité, celle-ci ressort avec un coefficient d’environ -10 (mais non
significatif aux niveaux usuels) dans le modèle de vote. Ce nouveau modèle,
très proche en termes d’ajustement des données (R² ajusté de 0,595 au lieu de
0,586), conduit toujours à un gain d’environ 10 points de % aux élections après
2011 car la réponse du vote au chômage doublé, passant de 0,9 à 1,8. Un point
de popularité (donc de chômage puisque la popularité répond environ un pour un
au taux de chômage) se traduirait par près de 2 points de vote en plus. A partir
de 2011 les 10 points supplémentaires de popularité conduisent à 8 points de
vote aux élections pour le FN : 10*1,8 – 10. L’écart type associée au
coefficient de 1,8 est toutefois très fort : l’intervalle de confiance à
95% s’étend de 0,3 à 3,5. Nous retrouvons ainsi les résultats obtenus dans un
modèle expliquant directement le vote FN par le chômage, avec une incertitude
légèrement moindre. Un coefficient très supérieur à sur la popularité pose
problème puisqu’il implique que le vote FN peut théoriquement dépasser la
population des personnes en ayant une opinion favorable. Le modèle
correspondant donne par ailleurs des prévisions peu satisfaisantes à certaines
périodes comme des Européennes de 2004 aux Régionales de 2010.
Le meilleur modèle parmi ceux testés comprend une variable
indicatrice en « touche de piano » des Présidentielles de 2007
jusqu’aux Législatives de 2012. Cette période correspond à la campagne
Présidentielle et au mandat de Nicolas Sarkozy (y compris Législatives de 2012
pour ne pas perturber l’estimation de l’indicatrice élections Législatives
présente par ailleurs dans le modèle). La capacité de Nicolas Sarkozy à capter une
partie de l’électorat frontiste est souvent discuté (voir par exemple Gilles
Kepel, 2015). Nous proposons ici, en faisant l’hypothèse que cette capacité
n’est effective qu’à partir de 2007 et seulement jusqu’à 2012, d’apporter une
quantification de ce phénomène. Contrairement à l'"effet Marine Le Pen" l'"effet Nicolas Sarkozy" dans notre stratégie de modélisation affecte directement le vote, sans modifier la popularité du FN.
Il ressort de ce dernier modèle que la déperdition de voix
pour le FN dans la période 2007-2012 était de 5 points de % (dans un intervalle
de confiance de 2,6 à 7,4). Le coefficient de la popularité prédite est presque
exactement de 1 (intervalle de confiance de 0,75 à 1,25). Les coefficients des
différents types d’élections sont eux aussi plus précisément estimés. Toujours
avec pour référence les Européennes, on obtient Législatives -0,1 (non
significatif), Régionales +3,2 et Présidentielles +4,8.
"meilleur" modèle de vote pour le FN:
lm(formula = Score ~
PopuPred + ELEC + Sarkozy)
Residuals:
Min
1Q Median 3Q
Max
-4.7389 -1.3127
-0.2271 1.5043 3.7170
Coefficients:
Estimate Std. Error t value
Pr(>|t|)
(Intercept) -0.5684 1.9077
-0.298 0.768970
PopuPred 1.0047 0.1283
7.829 2.31e-07 ***
ELECLegisl 0.1283 1.3131
0.098 0.923204
ELECPresid 4.7952 1.4575
3.290 0.003850 **
ELECRegio 3.2378 1.3561
2.388 0.027505 *
Sarkozy -5.0345
1.1841 -4.252 0.000431 ***
---
Signif. codes: 0 ‘***’ 0.001
‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘
’ 1
Residual standard
error: 2.434 on 19 degrees of freedom
(358 observations deleted due to
missingness)
Multiple
R-squared: 0.823, Adjusted R-squared: 0.7765
F-statistic: 17.67
on 5 and 19 DF, p-value: 1.461e-06
|
L’ajustement est de bonne qualité avec un R² ajusté de
0,78 et des écarts pour la plupart faibles entre prévisions et réalisations,
comme on peut le voir dans le graphique ci-dessous :
On remarquera que la surprise du 21 avril 2001 avec un score
de l’extrême droite (Jean-Marie Le Pen + Bruno Mégret) de 19,2% contre 15,5%
prédit (à partir du chômage et du type d’élection) est atténuée mais demeure.
L’écart est moins fort avec le score de Jean-Marie Le Pen seul, qui était de
16,86% (16,18% pour Lionel Jospin qui ne se qualifie pas pour le second tout).
Les scores prédit en 2012 demeurent trop élevés tandis que
ceux de 2014 et 2015 sont sous-évalués
(25,3 contre 27,7 pour les dernières
Régionales) mais ces écarts pourraient sans doutes être réduit en considérant
des effets « Marine Le Pen » et/ou Sarkozy moins
« abrupts » (progressivité dans le changement d’image du FN sous la
présidence de Marine Le Pen, déclin de la capacité de Nicolas Sarkozy à capter
un électorat FN).
L’utilisation faite ici du terme prévision est certainement abusive
dans la mesure où les modèles utilisés sont estimés en prenant en compte les
résultats du FN, sa popularité et le taux de chômage de 1983 à 2015 et non la
seule information disponible avant chaque scrutin.
L’utilisation d’un modèle estimé sur les données jusqu’en
2014 pour prédire le résultat du FN aux Régionales de 2015 aurait donné un
résultat satisfaisant mais probablement peu différent de ceux donnés par les
sondages classiques. Les ruptures possibles telle celle que nous suggérons
autour de 2011 et de 2007 à 2012, que nous ne modélisons pas à l’aide de
variables observables ex-ante, réduisent beaucoup le potentiel prédictif d’une
telle approche.
Reste que les résultats suggèrent que les sondages sur la côte
de popularité des partis, réalisés avec une méthodologie suffisamment stables
pendant de longues périodes, sont sans doute utiles pour « prédire »
à court terme et surtout analyser ex post les trajectoires électorales.