mercredi 2 novembre 2016

Logement : lectures et cartes Paris 1ère couronne


La question du logement est éminemment politique. Et elle se prête très bien à l'analyse quantitative. Un bon sujet pour ce blog donc!

Quatre livres et articles que j'ai lu récemment m'ont conduit à me replonger dans les statistiques immobilières (cela m'est arrivé à plusieurs reprises déjà, notamment en 2005 en participant à des discussions sur la bulle immobilière : dans ce lien un graphique qui montrait une baisse des prix dans les quartiers chics de Paris : la bulle n'a éclaté quelques années après, et pas vraiment à Paris...-)


Des lectures récentes :


- Comment la France a tué ses villes de Olivier Razemon, sur le déclin des villes moyennes en France.

- Gentrifications de Marie Chabrol, Anaïs Collet, Matthieu Giroud, Lydie Launay, Max Rousseau et Hovig Ter Minassian, qui étudient la diversité des formes, des lieux et des acteurs de la gentrification ("boboisation" pour utiliser un terme moins académique) dans une dizaine de villes européennes dont Paris.

- Un article de Arnaud Simon : Le logement n'est pas un hors-bilan des baby-boomers, sur le rôle des baby-boomers dans la hausse des prix immobiliers avec à la clé un transfert intergénérationnel de grande ampleur.

- Les incontournables éclairages statistiques (depuis 1200!) de Jacques Friggit, par exemple dans un support de cours cette année.

Beaucoup de questions intéressantes dont certaines peuvent je crois être explorées plus qu'elles ne le sont déjà, à l'aide de statistiques locales notamment.


3 cartes :



Peut-être utile de regarder un peu le marché immobilier parisien aujourd'hui. C'est ce que font les trois cartes suivantes :

D'abord le loyer médian par m² des appartements en 2016 (source : CLAMEUR, données complétées et parfois corrigées avec Meilleursagents.com pour quelques villes -je tiens à disposition la liste des "corrections")

Ensuite le prix médian au m² des appartements au 2ème trimestre 2016 (source: Notaires, complétées comme précédemment)


Enfin les rendements locatifs bruts (12*loyer/prix)


Les loyers et les prix sont très corrélés. Mais les écarts de prix sont beaucoup plus grands.
Résultat : les rendements locatifs sont faibles là où les prix sont élevés, élevés là où les prix sont bas (de nombreuses communes de Seine-Saint-Denis, d'autres dans le Val-de-Marne).

Paris, surtout au centre et à l'ouest, n'est rentable en moyenne pour un investisseur que grâce aux taux d'intérêt bas actuellement (effet de levier, faible rentabilité de placements alternatifs) et si les prix ne chutent pas sur la période d'investissement (alors que Friggit estime que les prix sont 70% au dessus de leur tendance de long terme). Un rendement locatif brut relativement faible est plus soutenable pour un propriétaire occupant qui paie la taxe foncière mais bénéficie de la non imposition des revenus de son capital logement (l'OFCE propose de taxer les loyers implicites des propriétaires-occupants, ce serait une mesure d'équité fiscale, qui toucherait en particulier les baby-boomers!).

mardi 18 octobre 2016

Taux de chômage par zone d'emploi - 2ème trimestre 2016


L'INSEE vient de mettre à jour les données de taux de chômage par zone d'emploi du 1er trimestre 2003 au 2ème trimestre 2016.

Quelques cartes :

Taux de chômage au 2ème trimestre 2016 (moyenne simple=9,7%) :

Variation du 2ème trimestre 2007 au 2ème trimestre 2012 (moyenne simple=+1,8%) :



Variation du 2ème trimestre 2012 au 2ème trimestre 2016 (moyenne simple=+0,4%):

Variation du 3ème trimestre 2015 (point le plus haut) au 2ème trimestre 2016 (dernier point) (moyenne simple=-0,5%) :
Plus que 7 zones d'emploi "dans le rouge" (jaune en fait!), sur 304 en France métropolitaine

dimanche 2 octobre 2016

Vote FN, chômage et pauvreté

Dans le premier article de ce blog je décrivais les résultat d'une petite analyse économétrique, à partir de séries chronologiques, sur le vote pour le Front National.
En particulier celui-ci : "un point de chômage en plus est associé à environ un point de côte de popularité en plus pour le FN, puis environ un point de vote en plus"
Je viens de voir que la société SPLV Analytics a réalisé une étude des déterminants du vote FN, à partir de données géographiques, les résultats par commune lors des élections législatives de 2012. Le travail m'a l'air très sérieux et est assez bien documenté (même si on aimerait des précisions sur les variables instrumentales utilisées). Il en ressort en particulier que : "L’effet est le même quel que soit la taille de la commune : 1% de chômage en plus donne 0,93% de vote supplémentaire au FN" (à noter que le traitement de l'endogénéité -avec variables instrumentales- n'a pas, pour cette variable, d'influence).
L'obtention d'une élasticité unitaire entre chômage et vote FN avec deux méthodologie très différente (la mienne étant très certainement la plus faible à ce stade) rassure sur la robustesse du résultat.
Il serait intéressant de combiner données localisées et variations dans le temps du vote FN.

La base de données au niveau communal de SPLV Analytics même si elle ne fait appel qu'à des données publiques est difficile à construire. Je regarde donc du côté des données départementales.
J'ai mis la main sur les résultats du FN par département aux Européennes de 2014 mais n'ai pas encore de point de comparaison : 2004 ou 2009 (point bas pour le FN) serait intéressantes. Si vous voyez où trouver ça sans devoir faire une centaine d’interrogation et de copier-coller sur le site du Ministère de l'Intérieur, dites-moi!

En attendant une petite corrélation, la meilleure que j'ai trouvé pour le moment (data mining!!!), entre taux de pauvreté des jeunes ménages (moins de 30 ans) et vote FN en 2014.

D'abord une carte (désolé pour la faible résolution) du taux de pauvreté des jeunes (données INSEE) :

Maintenant le vote FN en 2014 (Européennes) -qualité d'image un peu meilleure, je ne sais pas pourquoi...

La corrélation entre les deux variables est de 0,53, le coefficient de détermination (R²) de 0,28.
Ce qui est surtout intéressant il me semble c'est que R² est nettement plus bas quand on prend le taux de pauvreté total (tous âges) : 0,15, et même 0 pour la pauvreté des plus de 75 ans.

Si on revient à la pauvreté des jeunes (moins de 30 ans, mais 30-39 ans marche presque aussi bien)
on peut s'intéresser aux départements qui s'écartent le plus de la relation linéaire estimée. Ils sont indiqués sur cette dernière carte : 

En bleu (c'est le logiciel qui a choisi!) les départements où le vote FN est faible étant donné le niveau de pauvreté des jeunes : Paris et les trois départements de petite couronne, beaucoup de départements de la façade Atlantique ou du centre, en particulier les Haute-Pyrénées, la Haute Vienne (dans certains de ces départements la pauvreté des personnes âgées est élevée, et il y a moins de jeunes qu'ailleurs). Aussi la Haute-Corse. A l'inverse les départements tirant vers le rouge ont trop de votes FN pour leur niveau de pauvreté : Var et Alpes-Maritimes, Ain, Haute-Saône, Eure et Oise.
Manifestement il manque beaucoup de variables pour aboutir à quelque chose de plus satisfaisant : pour comprendre la spécificité du Sud-Est des facteurs historiques comme l'importance des rapatriés d'Algérie, le taux d'urbanisation, la proportion d'électeurs issus de l'immigration (pas directement mesurable), d'autres variables économique comme la dynamique de l'emploi, bien sûr le chômage etc. Au final pas certain que la pauvreté (des jeunes) tienne le choc! A suivre, si je trouve de meilleures données

mardi 27 septembre 2016

Popularité des partis et des Présidents depuis 1984


Je consulte régulièrement le site de TNS-Sofrès pour les séries longues de popularité des partis et des personnalités (malheureusement les enquêtes ne sont plus réalisées mensuellement). Celles concernant les partis me semblent les meilleures pour prédire les résultats électoraux. Pour les hommes et femmes politiques la popularité est très souvent plus une conséquence qu'une cause de la performance aux élections.

Voici, mis à jour avec les données de l'enquête de début septembre : 

-Une comparaison des côtes de popularité (opinions favorables) du principal parti de la gauche depuis les années 80, le PS, du principal parti de la droite républicaine, LR (anciennement RPR, puis UMP), et du principal parti d'extrême droite, le FN. 
Des carrés avec une croix indiquent les victoires aux Présidentielles ou aux Législatives (sauf celles suivant immédiatement une Présidentielle), en rose pour le PS, en bleu pour la droite. Ils sont positionnés avant le premier tour.

On voit que le parti le plus populaire gagne en général mais que quand les deux grands partis gouvernementaux sont au coude à coude, l'avantage va plutôt à la droite.
Les victoires électorales, surtout si elles ne sont pas anticipées de longue date apportent un gain de popularité. Voire en particulier la victoire de la gauche en 1997, après la dissolution de l'Assemblée Nationale par le Président Chirac.
L'élection Présidentielle de 2002 fait exception : dans l'enquête précédant le 21 avril 2002, début avril 2002, le PS de Lionel Jospin était plus populaire que le RPR de Jacques Chirac. Même si l'écart se resserrait entre les deux partis, le 21 avril 2002 semble bien un accident électoral.
La montée de la popularité du FN présidée par Marine Le Pen, de septembre 2009 à juin 2012, conduit à une convergence des trois principaux partis... à des niveaux de popularité exceptionnellement faibles : de 21% d'opinions favorables pour le FN à 25% pour le PS en septembre 2016.

-Une comparaison des popularités des deux derniers Présidents, Nicolas Sarkozy et François Hollande, du PS et de LR/UMP. Les dates des victoires (sondages avant la victoire) sont indiquées là encore par des carrés.


La côte de confiance de François Hollande est la même en septembre 2016 et en mars 2014, à 17%. La chute de popularité de François Hollande a débuté très tôt après son élection. En mai 2013 Hollande n'avait plus que 24% de popularité, soit une chute de 37 points de % en 12 mois (32% pour Nicolas Sarkozy en mai 2008 après une chute de 32 points depuis son pic de juillet 2007). La chute de popularité de François Hollande intervient pendant une période difficile économiquement, la crise de la zone euro (sans que les décisions de la nouvelle majorité, bonnes ou mauvaises, aient pu avoir beaucoup d'effet), mais il est probable que bien d'autres facteurs (plus personnels?) dominent. Concernant Nicolas Sarkozy la chute de popularité intervient d'ailleurs avant la crise mondiale, quand le chômage est au plus bas en France.

mardi 6 septembre 2016

Emploi par département sur 25 ans

Je n'ai pas trouvé de données électorales par département facilement exploitables à mettre en relation avec des données sur la situation économique comme je souhaitais le faire (si quelqu'un a ça je suis preneur!).
En attendant je propose ici quelques cartes sur l'emploi par département entre 1989 et 2014. Les données sont de l'INSEE. Les cartes sont réalisées avec Philcarto, que je recommande vivement.

Emploi total 2009-2014 : la taille des cercles indique le nombre d'emplois dans le département en 2009, la couleur le taux de croissance (annuel moyen) entre 2009 et 2014 du bleu (baisse) au rouge (plus forte hausse)
 

Avec le même principe, de gauche à droite et du haut en bas : toujours sur 2009-2014 croissance de l'emploi successivement total (même carte que ci-dessus), dans les services marchands, dans l'industrie puis (en bas à droite) dans les services non marchands.
<images ci-dessous trop compressées: amélioration à venir...>

Enfin des cartes par sous-périodes : 1989-1997 en haut à gauche, 1997-2007 en haut à droite, 2007-2009 en bas à gauche, 2009-2014 en bas à droite

-Pour l'industrie :
1989-1997: l'industrie quitte l'Ile de France, décline plus que la moyenne dans d'autres métropoles comme Lyon et Lille. Façade Est (Alsace) et Nord-Ouest résistent mieux. Progression de l'emploi à l'Ouest de la Bretagne, à partir d'une base industrielle très faible (filière agro-alimentaire?) 

-L'agriculture :
 Notez le rebond de l'emploi agricole dans certains départements, en particulier viticoles après un déclin marqué (notamment dans l'Ouest dans les 2 premières périodes)

 -Les services marchands :
Polarisation de l'emploi de service dans les métropoles. Déclin initial de Paris au profit de sa périphérie puis progression comme la moyenne des autres métropoles. Dynamisme durable de l'emploi de services dans les départements des façades Atlantique et Méditérrannée + Rhône-Alpes

Dernière carte : emploi total non marchand, 2000-2014. Cette fois les cercle donnent l'emploi en 2014


vendredi 29 janvier 2016

30 ans de chômage et de Front National



Pour inaugurer ce blog, dans lequel je compte mettre quelques travaux statistiques ou économétriques extra professionnels qui ne se résument pas bien en 130 caractères voici un peu de "politicométrie". Que les économètres excusent un manque de rigueur (je ne sais pas encore faire tout ce que je voudrais avec R! aucun relecteur à la publication sur ce site). Que les gens normaux excusent le jargon. Pour une lecture rapide : le résumé ci-dessous, le premier graphique, et le dernier.

Résumé :  La série chronologique du chômage en France et celle des résultats électoraux du Front National entre 1984 et 2015 sont faiblement corrélées. Mais dans modèle tenant compte de deux ruptures on obtient qu'un point de chômage en plus est associé à environ un point de côte de popularité en plus pour le FN, puis environ un point de vote en plus. A taux de chômage donné, à partir de 2011, c’est-à-dire sous la présidence de Marine Le Pen, le FN gagne près de 10 points de popularité. Entre l’élection de Nicolas Sarkozy à la Présidence de la République en 2007 et sa défaite en 2012, le FN perd en moyenne 5 points de pourcentage des votants. Par ailleurs les élections Présidentielles mais aussi Régionales sont les plus favorables au FN.   

Le chômage est souvent avancé comme facteur explicatif du vote pour le Front National. Voyons dans quelle mesure 30 ans d’histoire électorale de ce parti permettent de valider cette hypothèse.
Un premier graphique superpose les scores du FN depuis les élections Européennes de juin 1984 jusqu’aux élections Régionales de décembre 2015 (cercles rouges) et la série du taux de chômage (ligne noire). Sont prises en comptes les élections Européennes, Régionales, Présidentielles, Législatives (repérables sur le graphique car le score du FN y est systématiquement moins élevé qu’aux Présidentielles qui les précèdent immédiatement, sauf en 1995 (Jacques Chirac ne dissout pas l’Assemblée Nationale en débutant son premier septennat) ; apparaissent donc deux cercles à peu près alignés verticalement). Sont exclues les élections Cantonales et Municipales dans lesquelles le FN n’a pas de candidats sur tout le territoire. Seul le premier tour de chaque élection est pris en compte.
La capacité du chômage à rendre compte de la variabilité du vote pour le FN semble modérée. Avec une régression économétrique simple, en contrôlant pour le type d’élection (on y reviendra) on trouve qu’un point de chômage en plus et associé à 1,8% de vote en plus pour le FN. Mais ce chiffre est très imprécis, il se situe dans un intervalle de confiance (à 95%, pour les connaisseurs) allant environ de 0 (pas d’impact du chômage) à 4 (très fort impact du chômage).
Trois périodes en particulier expliquent le faible pouvoir explicatif d’un modèle simple : Présidentielles et Législatives de 2002  (scores élevés du FN malgré un taux de chômage assez bas –en hausse cependant), score à nouveaux très élevés en 2012 et surtout 2014-2015 alors que le chômage est élevé mais à peu près au même niveau que vingt ans auparavant.

La côte de popularité du FN 

L’économètre est confronté au problème du manque d’observations : 25 élections donc 25 observations.
Pour disposer de plus de points nous pouvons utiliser une mesure de popularité du FN issue du baromètre TNS-Sofres / Figaro-Magazine. Dans le cas du FN une enquête mensuelle recueille depuis 1984 les réponses à la question suivante : « Avez-vous une opinion très bonne, plutôt bonne, plutôt mauvaise ou très mauvaise du parti suivant : Front National ? ». Nous exploitons ici la somme des opinions favorables.
Cette mesure est assez bien corrélée avec le vote FN.
 

On notera cependant qu’à la fois en 2002-2004 et 2014-2015 le vote FN apparaît « anormalement » élevé au regard de la popularité le mois précédant l’élection. Il apparaît aussi que la popularité bénéficie des succès électoraux comme l’illustre l’élection Présidentielle de 1995 qui précède un pic de popularité exceptionnel mais de courte durée.
Qu’en est-il de la corrélation entre popularité et taux de chômage ? :
Il semble au regard de ce graphique possible d’expliquer une part importante de la popularité du FN. Pour parvenir à une équation satisfaisante nous allons cependant tenir compte de deux enseignements du graphique : (i) il est possible que la relation entre popularité et taux de chômage soit non linéaire, dans le sens où l’impact du chômage serait différent selon que son niveau est plus ou moins élevé ; plus simplement à la fois le niveau et l’évolution du taux de chômage pourrait avoir un rôle ; (ii) la très forte popularité du FN depuis 2011 ne semble pas pouvoir être expliquée par le chômage seul.
Le second point est le plus important. En effet cette forte popularité « explique » potentiellement bien le vote FN, qui on l’a vu a été très élevé dans les dernières années. Nous proposons une hypothèse, qui devrait être validée autrement que par la capacité explicative de note modèle : l’arrivée à la tête du FN de Marine Le Pen a fortement accru les opinions favorables à l’égard de ce parti, et par suite les votes qu’il a pu recueillir. Techniquement nous introduisons simplement une variable indicatrice en « marche d’escalier » (en février 2011) dans une régression de la popularité du FN sur le taux de chômage (en niveau, niveau au carré, variation et variation au carré comme le suggère l’appréciation faite dans le point (i)).

Le graphique suivant montre l’ajustement statistique qui en résulte.
Il apparaît que si la forte variabilité à court terme de la popularité du FN, en particulier dans les années 80 et au début des années 90 ne peut être expliquée, le modèle (aidé bien évidemment « mécaniquement » par la variable « Marine Le Pen » !) rend assez bien compte des inflexions de la popularité du FN. On observe toutefois, et sans surprise, que pic de popularité de 1995 n’est que très partiellement expliqué par le chômage. Peut-être du fait des tensions au sein du FN qui conduisent à la scission (MNR du Bruno Mégret, dont nous ajoutons les scores à ceux du FN) le FN est « anormalement » peu populaire à la fin des années 90 et au début des années 2000. A la veille du 21 avril 2002 la popularité du FN était en dessous de sa moyenne de long terme et la popularité « prédite » par le modèle (donc en fonction du chômage) était en forte hausse mais elle aussi à un niveau relativement bas. La hausse de popularité suivant la qualification de Jean-Marie Le Pen pour le second tour est éphémère même si la tendance à la hausse de la popularité se poursuit, suivant la courbe du chômage. Lors du mandat de Nicolas Sarkozy la popularité du FN apparaît inférieure à son niveau prédit.

Pour revenir sur le modèle on pourra noter qu’il explique environ 69% de la variance de la popularité du FN (R² ajusté –pour tenir compte du nombre de variables prises en compte– de 0,68). Au niveau de chômage actuel un point de chômage en plus entraîne une hausse d’environ un point de la popularité du FN. Les variations du chômage sont amplifiés dans la popularité du FN : une forte hausse (ou baisse) du chômage sur un an cause une hausse (baisse) plus que proportionnelle de la popularité du FN.
L’arrivée à la tête du FN de Marine Le Pen, si on accepte cette interprétation, « cause » une hausse de la popularité du FN d’environ 10 points de % (9,6%, avec un intervalle de confiance à 95% allant de 8,8 à 10,4%).
La capacité d’un FN dirigé par Marine Le Pen à surmonter le handicap qu’avait le parti dirigé par son père vis-à-vis de l’électorat féminin pourrait être une des explications de ce « bonus » élevé observé. Marie Merdrignac (Ouest-France) note ainsi qu’ « aux dernières régionales, en 2010, selon un sondage CSA réalisé sur 2 000 personnes, les femmes auraient voté à 10 % pour le parti d’extrême droite. Cette année, avant le premier tour, elles étaient 28 % à indiquer à Opinion Way, leur intention de voter Front national (sondage effectué sur un échantillon de 8 000 personnes). ». Plus généralement la « dédiabolisation » du FN paraît avoir réussi à élargir l’électorat potentiel (et effectif) de ce parti. Ce processus a sans doute été graduel, ce dont par souci de parcimonie notre modèle ne rend pas compte. On ne peut exclure toutefois que la rupture introduite en 2011 capte autre chose que les changements de stratégie et de leadership au FN. Les lecteurs de cet article sont invités à faire des suggestions !

Vote pour le FN

Dans un deuxième temps nous utilisons la série de popularité prédite par notre modèle (spécification préférée parmi celles n’utilisant pas d’information sur la popularité passée ou les scores passés du FN) ainsi que des variables indicatrices pour le type d’élection. Avec seulement 25 observations il est difficile à ce stade d’ajouter d’autres variables.
Il ressort de cette estimation qu’une hausse de 1 de la popularité prédite (donc indirectement du chômage) entraîne une hausse de 1 du score du FN (0,92 avec un intervalle de confiance entre 0,6 et 1,3). Le FN réalise en moyenne des scores très différents selon les scrutins : si on prend comme référence l’élection Européenne alors le score aux élections Législatives est de -0,6 (mais non significatif), les Régionales et Présidentielles sont entre +3,2 et +3,5.
Le graphique suivant présente les résultats du modèle. Les carrés rouges sont les estimations, les points bleus les scores du FN.

Les principaux écarts entre estimation et réalisé sont observés en 2002 (21 avril), 2014 (Européennes) et 2015 (Régionales) pour les cas de sous-estimation du FN par le modèle, en 2007 (surtout Législatives) et 2012 pour les sur-estimations du FN.

Modèles « augmentés » :

Si on introduit en 2011  la même rupture que dans le modèle de popularité, celle-ci ressort avec un coefficient d’environ -10 (mais non significatif aux niveaux usuels) dans le modèle de vote. Ce nouveau modèle, très proche en termes d’ajustement des données (R² ajusté de 0,595 au lieu de 0,586), conduit toujours à un gain d’environ 10 points de % aux élections après 2011 car la réponse du vote au chômage doublé, passant de 0,9 à 1,8. Un point de popularité (donc de chômage puisque la popularité répond environ un pour un au taux de chômage) se traduirait par près de 2 points de vote en plus. A partir de 2011 les 10 points supplémentaires de popularité conduisent à 8 points de vote aux élections pour le FN : 10*1,8 – 10. L’écart type associée au coefficient de 1,8 est toutefois très fort : l’intervalle de confiance à 95% s’étend de 0,3 à 3,5. Nous retrouvons ainsi les résultats obtenus dans un modèle expliquant directement le vote FN par le chômage, avec une incertitude légèrement moindre. Un coefficient très supérieur à sur la popularité pose problème puisqu’il implique que le vote FN peut théoriquement dépasser la population des personnes en ayant une opinion favorable. Le modèle correspondant donne par ailleurs des prévisions peu satisfaisantes à certaines périodes comme des Européennes de 2004 aux Régionales de 2010.

Le meilleur modèle parmi ceux testés comprend une variable indicatrice en « touche de piano » des Présidentielles de 2007 jusqu’aux Législatives de 2012. Cette période correspond à la campagne Présidentielle et au mandat de Nicolas Sarkozy (y compris Législatives de 2012 pour ne pas perturber l’estimation de l’indicatrice élections Législatives présente par ailleurs dans le modèle). La capacité de Nicolas Sarkozy à capter une partie de l’électorat frontiste est souvent discuté (voir par exemple Gilles Kepel, 2015). Nous proposons ici, en faisant l’hypothèse que cette capacité n’est effective qu’à partir de 2007 et seulement jusqu’à 2012, d’apporter une quantification de ce phénomène. Contrairement à l'"effet Marine Le Pen" l'"effet Nicolas Sarkozy" dans notre stratégie de modélisation affecte directement le vote, sans modifier la popularité du FN.

Il ressort de ce dernier modèle que la déperdition de voix pour le FN dans la période 2007-2012 était de 5 points de % (dans un intervalle de confiance de 2,6 à 7,4). Le coefficient de la popularité prédite est presque exactement de 1 (intervalle de confiance de 0,75 à 1,25). Les coefficients des différents types d’élections sont eux aussi plus précisément estimés. Toujours avec pour référence les Européennes, on obtient Législatives -0,1 (non significatif), Régionales +3,2 et Présidentielles +4,8.

"meilleur" modèle de vote pour le FN:

lm(formula = Score ~ PopuPred + ELEC + Sarkozy)

Residuals:
    Min      1Q  Median      3Q     Max
-4.7389 -1.3127 -0.2271  1.5043  3.7170

Coefficients:
               Estimate Std. Error t value Pr(>|t|)   
(Intercept)     -0.5684     1.9077  -0.298 0.768970   
PopuPred         1.0047     0.1283   7.829 2.31e-07 ***
ELECLegisl        0.1283     1.3131   0.098 0.923204   
ELECPresid       4.7952     1.4575   3.290 0.003850 **
ELECRegio        3.2378     1.3561   2.388 0.027505 * 
Sarkozy            -5.0345     1.1841  -4.252 0.000431 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.434 on 19 degrees of freedom
  (358 observations deleted due to missingness)
Multiple R-squared:  0.823,     Adjusted R-squared:  0.7765
F-statistic: 17.67 on 5 and 19 DF,  p-value: 1.461e-06

L’ajustement est de bonne qualité avec un R² ajusté de 0,78 et des écarts pour la plupart faibles entre prévisions et réalisations, comme on peut le voir dans le graphique ci-dessous :

On remarquera que la surprise du 21 avril 2001 avec un score de l’extrême droite (Jean-Marie Le Pen + Bruno Mégret) de 19,2% contre 15,5% prédit (à partir du chômage et du type d’élection) est atténuée mais demeure. L’écart est moins fort avec le score de Jean-Marie Le Pen seul, qui était de 16,86% (16,18% pour Lionel Jospin qui ne se qualifie pas pour le second tout).

Les scores prédit en 2012 demeurent trop élevés tandis que ceux de 2014 et 2015 sont sous-évalués 
(25,3 contre 27,7 pour les dernières Régionales) mais ces écarts pourraient sans doutes être réduit en considérant des effets « Marine Le Pen » et/ou Sarkozy moins « abrupts » (progressivité dans le changement d’image du FN sous la présidence de Marine Le Pen, déclin de la capacité de Nicolas Sarkozy à capter un électorat FN).

L’utilisation faite ici du terme prévision est certainement abusive dans la mesure où les modèles utilisés sont estimés en prenant en compte les résultats du FN, sa popularité et le taux de chômage de 1983 à 2015 et non la seule information disponible avant chaque scrutin.
L’utilisation d’un modèle estimé sur les données jusqu’en 2014 pour prédire le résultat du FN aux Régionales de 2015 aurait donné un résultat satisfaisant mais probablement peu différent de ceux donnés par les sondages classiques. Les ruptures possibles telle celle que nous suggérons autour de 2011 et de 2007 à 2012, que nous ne modélisons pas à l’aide de variables observables ex-ante, réduisent beaucoup le potentiel prédictif d’une telle approche. 
Reste que les résultats suggèrent que les sondages sur la côte de popularité des partis, réalisés avec une méthodologie suffisamment stables pendant de longues périodes, sont sans doute utiles pour « prédire » à court terme et surtout analyser ex post les trajectoires électorales.