La série des Documents de Travail présente des travaux menés au sein de la DG Trésor, diffusés dans le but d’éclairer et stimuler le débat public. Ces travaux n’engagent que leurs auteurs.

Les modèles à facteurs sont de plus en plus utilisés pour la prévision de court terme du PIB par les banques centrales et les grands organismes internationaux. Ces modèles permettent en effet de résumer l’information apportée par un grand nombre de variables en un petit nombre de variables latentes appelées facteurs. Sous leur forme dynamique, ces modèles permettent rendre compte des évolutions conjointes des indicateurs qui les constituent. De plus, en recourant à des techniques d’estimation appropriées, il est possible de résoudre les problèmes posés par les différences de délais de publication des variables utilisées. De cette façon, il n’est pas nécessaire de développer différents modèles en fonction de la date de prévision et des variables disponibles à cette date-là.

Dans une précédente étude, avaient été examinées les performances en prévision de ces modèles pour la prévision du taux de croissance du PIB français sur des horizons courts, en utilisant une base constituée d’une centaine de variables parmi lesquelles des variables d’enquêtes, des indicateurs réels, des variables monétaires et financières et des indicateurs sur l’environnement international. Il a cependant été constaté que la présence d’un trop grand nombre de variables, incluant donc des variables sans pouvoir explicatif significatif pour le PIB, pouvait diminuer la qualité de la prévision. À partir d’une base de données élargie, nous étudions ici des stratégies de sélection de variables bâties pour maximiser la qualité des prévisions de la croissance. Ainsi, la constitution d’une base plus restreinte, correspondant à la combinaison optimale de blocs de variables construits par « dire d’expert » à partir de la base initiale, permettrait d’améliorer significativement les performances en prévision des modèles à tous les horizons. En revanche, le recours à un algorithme automatique de sélection des variables, liant variable d’intérêt et variables explicatives, ne semble pas améliorer significativement la qualité des prévisions de la croissance du PIB.