Accueil / Chroniques / Comment utiliser Google pour prévoir l’activité économique des pays ?
π Numérique π Économie

Comment utiliser Google pour prévoir l’activité économique des pays ?

SIMONI Anna
Anna Simoni
directrice de recherche au CNRS et professeure d'Économétrie et Statistiques à l'ENSAE (IP Paris)
En bref
  • Depuis plusieurs années, les données Google issues des recherches effectuées sur leur site sont utilisées pour surveiller ou prévoir l’activité économique des États.
  • Ces données, disponibles de façon hebdomadaire, répondent à un besoin de rapidité car les indicateurs traditionnels, tels que le PIB, mettent plus de temps à être connus.
  • Les recherches Google constituent un indicateur intéressant de santé économique, car elles montrent la capacité, comme la volonté, de consommation des utilisateurs Google.
  • Les indicateurs provenant de Google s’avèrent particulièrement pertinents en temps de crise, car ils réagissent rapidement aux changements de l’économie.

Pourquoi les chercheurs et les institutions, comme l’OCDE, se sont-ils tournés vers les données Google pour prévoir l’activité économique des États ? À quels besoins s’agissait-il de répondre ? 

Habi­tuel­le­ment, pour faire de la pré­vi­sion macro-éco­no­mique, on uti­lise des don­nées qui pro­viennent, par exemple, des banques cen­trales ou d’instituts sta­tis­tiques comme l’INSEE. Ces don­nées sont très infor­ma­tives, mais elles ne sont pas dis­po­nibles tout de suite. C’est pour ça que les gens s’intéressent à d’autres sources de don­nées qui peuvent don­ner des infor­ma­tions en temps réel. 

Si un déci­deur éco­no­mique doit relan­cer l’économie, par exemple, il doit savoir dans quel état nous sommes aujourd’hui. Avec les séries offi­cielles, ce n’est pas pos­sible. Le PIB est une série tri­mes­trielle, qui est publiée, en moyenne, un mois et demi après la fin du tri­mestre concer­né. Il est donc impos­sible d’ajuster ins­tan­ta­né­ment les poli­tiques éco­no­miques. L’idée d’utiliser des sources alter­na­tives, dont Google fait par­tie, c’est vrai­ment afin de répondre à ce pro­blème de retard des don­nées officielles. 

Quels outils de Google sont utilisés dans ce travail de prévision macro-économique ?

Il y a deux types de don­nées issues de Google : Google Trends et Google Search. La source pre­mière de ces deux bases de don­nées est néan­moins la même : les mots tapés sur le moteur de recherche Google. La plu­part des cher­cheurs uti­lisent Google Trends : c’est une page web à laquelle tout le monde a accès. Les don­nées cor­res­pondent aux ten­dances de recherche par pays et par caté­go­rie (diver­tis­se­ment, entre­prise, san­té, science, sport). Google assigne le mot-clé de la recherche à une catégorie. 

Les recherches Google peuvent être vues comme une syn­thèse de la façon dont les gens per­çoivent l’économie.

Google Search four­nit quant à lui des séries issues des recherches sur Inter­net, mises à dis­po­si­tion par Google et don­nées à la Banque cen­trale euro­péenne. Les deux bases de don­nées sont construites de façon dif­fé­rente, Google Trends regarde le volume de recherches tan­dis que Google Search donne des infor­ma­tions sur la varia­tion du volume. Dans mon étude, c’est avec les don­nées de Google Search que nous avons travaillé. 

Il s’agit donc de prévoir la santé des économies, en analysant ce que les utilisateurs de Google tapent dans le moteur de recherche. D’où vient cette idée et en quoi ces données sont-elles pertinentes ? 

Les pre­miers papiers sur la ques­tion ont été publiés par Hal Varian, éco­no­miste en chef chez Google. Ces don­nées sont assez récentes : elles sont dis­po­nibles depuis 2004, mais j’ai com­men­cé mon pro­jet d’utilisation de don­nées Google en 2016. L’intuition et le pré­sup­po­sé der­rière l’utilisation de ces don­nées pour faire de la pré­vi­sion macroé­co­no­mique, c’est que les recherches Google peuvent être vues comme une syn­thèse de la façon dont les gens per­çoivent l’économie. Si l’économie est en bonne san­té, les gens ont ten­dance à faire des recherches sur la culture, les voyages, etc… En revanche, s’il y a des pro­blèmes de chô­mage, il y aura plus de recherches liées à l’emploi.  

Ces données sont-elles efficaces pour prévoir l’activité économique d’un pays ? Est-ce utile pour prédire les périodes de croissance et de récession ? 

Ce que j’ai obser­vé dans ma recherche, c’est que ces outils sont par­ti­cu­liè­re­ment utiles dans les périodes de crise. Pen­dant la crise de 2008–2009, par exemple, les don­nées Google ont bien anti­ci­pé l’activité éco­no­mique car elles sont plus réac­tives au chan­ge­ment, par rap­port aux don­nées officielles.

Cepen­dant, les séries issues de Google sont très peu cor­ré­lées avec le PIB. Sauf en période de crise, les infor­ma­tions offi­cielles res­tent quand même plus infor­ma­tives. Il est, par ailleurs, essen­tiel de faire une pré­sé­lec­tion, car on compte à peu près 300 caté­go­ries par pays. Si on les uti­lise toutes, cela crée du bruit dans le pro­ces­sus d’estimation. Avant de faire de la pré­vi­sion, il faut donc sélec­tion­ner les caté­go­ries de Google les plus cor­ré­lées pour pré­dire le PIB. Si c’est fait, on peut trou­ver des résul­tats inté­res­sants, y com­pris pour les périodes stables, même quand on ne dis­pose pas d’informations officielles. 

Quelles catégories de recherche sont les plus utiles pour prévoir l’activité économique ? 

Les caté­go­ries les plus cor­ré­lées sont sou­vent liées à la consom­ma­tion, comme ce qui est lié aux loi­sirs et au diver­tis­se­ment. Cela s’explique faci­le­ment : si on est dans une bonne période éco­no­mique, les gens ont plus envie d’acheter. Il faut aus­si consi­dé­rer les caté­go­ries liées aux réseaux sociaux. Les gens peuvent être plus ou moins actifs dans leur uti­li­sa­tion des réseaux sociaux, selon l’état éco­no­mique : s’informer sur les pla­te­formes ou consul­ter des sites comme Lin­ke­dIn pour trou­ver des offres d’emploi, par exemple. 

Quels sont les avantages et les limites des données Google par rapport aux données officielles ? 

Le prin­ci­pal avan­tage par rap­port aux don­nées offi­cielles est une ques­tion de temps. En effet, l’aperçu de l’économie est presque ins­tan­ta­né : on écoute les infor­ma­tions, on voit qu’il y a une guerre ou une crise poli­tique, on réagit tout de suite, on adapte notre com­por­te­ment. Mal­gré tout, les indus­tries prennent beau­coup plus de temps à s’adapter à une crise éco­no­mique, cela ne se fait pas du jour au len­de­main. La plu­part des acteurs de l’économie réagissent plus tardivement. 

Le prin­ci­pal avan­tage par rap­port aux don­nées offi­cielles est une ques­tion de temps. 

La prin­ci­pale limite, c’est que ces don­nées sont dif­fi­ciles à exploi­ter. Dans mon étude, nous avons essayé plu­sieurs méthodes, et cer­taines ne fonc­tion­naient pas du tout. Par exemple, la méthode de pré­sé­lec­tion des caté­go­ries de recherche marche seule­ment dans une période stable : en période de crise, il ne faut pas présélectionner. 

Comment imaginez-vous l’avenir de la prévision économique, en termes de sources de données ? Est-ce que vous pensez que l’utilisation Google va continuer à se développer ?

J’imagine qu’il n’y aura pas une seule source de don­nées qui devien­dra meilleure que d’autres : on va conti­nuer à uti­li­ser plu­sieurs sources et plu­sieurs modèles. Selon le contexte éco­no­mique, on aura des meilleures pré­vi­sions avec cer­taines don­nées. Ce qu’il faut faire main­te­nant, en plus d’automatiser encore plus les méthodes qu’on a mises en place, c’est com­pa­rer la per­for­mance des don­nées Google en termes de pré­vi­sion par rap­port à d’autres don­nées alter­na­tives, comme les textes venant des jour­naux qui suivent l’actualité éco­no­mique et finan­cière : c’est ce que j’essaie d’appliquer dans ma recherche.

Propos recueillis par Sirine Azouaoui

Soutenez une information fiable basée sur la méthode scientifique.

Faire un don