Accueil / Chroniques / IA et médias, (r)évolution de l’investigation ? 
π Science et technologies π Société

IA et médias, (r)évolution de l’investigation ? 

ioana manolescu bon formar
Ioana Manolescu
directrice de Recherche à l'Inria et professeure à l'École polytechnique (IP Paris)
Maxime Vaudano
Maxime Vaudano
journaliste au Monde et responsable du pôle enquêtes des Décodeurs
En bref
  • L’IA est un outil d’investigation qui s’intègre progressivement aux métiers de l’information.
  • Elle sait trier des contenus, les organiser et les relier à une base de données existante afin de gagner du temps.
  • Toutefois, elle peut passer à côté d’informations pertinentes pour traiter un sujet et nécessite une vérification humaine.
  • La capacité d’analyse, d’interview, de croisement des sources ou la réalisation d’une enquête approfondie restent des capacités exclusivement humaines à ce jour.
  • Sans être une révolution, l’IA constitue une évolution dans la relation des métiers du journalisme aux technologies.

Désor­mais omni­pré­sente dans l’ensemble des domaines d’activité, l’Intelligence Arti­fi­cielle (IA) s’intègre aus­si pro­gres­si­ve­ment dans les métiers de l’information. L’IA serait-elle la pro­chaine révo­lu­tion dans les médias ? Pas si sûr…

Depuis une dizaine d’années, la presse en ligne teste des IA géné­ra­tives pour rédi­ger auto­ma­ti­que­ment des articles en « aspi­rant » des infor­ma­tions de bases de don­nées fiables. En mars 2015 – avant ChatGPT – le jour­nal Le Monde avait ain­si uti­li­sé une IA de la socié­té Syl­labs pour rédi­ger 36 000 articles cou­vrant les résul­tats des élec­tions dépar­te­men­tales de chaque com­mune, grâce aux don­nées du minis­tère de l’Intérieur. Quelques mois plus tard, France Bleu a sui­vi le mou­ve­ment, cette fois pour les élec­tions régio­nales. Depuis 2021, L’Équipe uti­lise éga­le­ment l’IA pour auto­ma­ti­ser la pro­duc­tion de conte­nus lis­tant les matchs à venir, sui­vis de l’heure et la chaîne de dif­fu­sion. Les jour­na­listes sont-ils en train d’être rem­pla­cés par des robots ?

Cet article a été publié en exclu­si­vi­té dans notre maga­zine Le 3,14 sur l’IA.
Télé­char­gez-le ici.

IA : un outil d’investigation ?

« L’Intelligence arti­fi­cielle est d’abord un outil » tranche Ioa­na Mano­les­cu, cher­cheuse en infor­ma­tique à l’Inria, spé­cia­li­sée dans le trai­te­ment des don­nées à grande échelle et la véri­fi­ca­tion de l’information (fact che­cking).

« Dans les rédac­tions, il y a un mélange de méfiance et de fas­ci­na­tion » pour­suit la cher­cheuse. « Si la géné­ra­tion de texte fonc­tionne bien avec les IA amé­ri­caines – plus entraî­nées – les fran­çaises sont encore mal­adroites. » De plus, la capa­ci­té d’analyse, d’interview, de croi­se­ment des sources ou la réa­li­sa­tion d’une enquête appro­fon­die res­tent des capa­ci­tés exclu­si­ve­ment humaines à ce jour. Aucun risque donc de voir les jour­na­listes rem­pla­cés par des « robots-rédac­teurs » au quo­ti­dien, comme cer­tains l’envisageaient il y a une dizaine d’années.

« En revanche, les IA savent très bien récu­pé­rer des conte­nus, les orga­ni­ser ou les com­pa­rer à une base de don­nées exis­tante » pré­cise Ioa­na Mano­les­cu. C’est d’ailleurs l’origine de l’outil Stat­check, que la cher­cheuse et son équipe déve­loppent en col­la­bo­ra­tion avec Radio France depuis 2021. Cette IA per­met de croi­ser une infor­ma­tion sta­tis­tique trou­vée dans un article avec la base de don­nées de l’INSEE, et plus récem­ment d’Eurostat.

« Pour cela, il a fal­lu entraî­ner l’IA sur beau­coup de textes pour lui per­mettre d’apprendre, par exemple, que les notions “d’emploi” et de “chô­mage” sont liées… » détaille la scien­ti­fique. Aujourd’hui, Stat­Check fait seul le rap­pro­che­ment entre la façon d’écrire des jour­na­listes et les déno­mi­na­tions propres aux sta­tis­ti­ciens. De nou­velles fonc­tion­na­li­tés conti­nuent d’être ajou­tées par les équipes de l’Inria, comme l’ouverture du sys­tème aux bases de don­nées exté­rieures, ou le « désos­se­ment » puis l’uniformisation des sources dans un for­mat unique. Mais l’objectif serait d’aller plus loin…

Trier, organiser, relier

Tout est par­ti d’une enquête, menée par une jour­na­liste du Monde il y a quelques années, qui aurait pas­sé au peigne fin des cen­taines de docu­ments afin d’identifier les liens entre des scien­ti­fiques et des lob­bies indus­triels… Le tout à la main. « C’est un tra­vail colos­sal ! » com­mente Ioa­na Mano­les­cu. L’idée est donc née de créer un outil pour auto­ma­ti­ser le tra­vail. Bap­ti­sé Connec­tion­Lens, il est aujourd’hui capable d’interconnecter des don­nées tirées d’un cor­pus de docu­ments très hété­ro­gènes (PDF, Excel, URL…). « L’IA aspire les infor­ma­tions conte­nues dans ces docu­ments, comme des noms, orga­ni­sa­tions, dates, e‑mails, etc., et les met en rela­tion. Le nom d’une entre­prise qui se retrouve dans les remer­cie­ments d’une thèse sera ain­si relié au nom de l’auteur par exemple », explique la chercheuse.

Mais l’algorithme n’est jamais le der­nier maillon de la chaîne ! Pour Stat­Check comme Connec­tion­Lens, un jour­na­liste repasse sys­té­ma­ti­que­ment pour véri­fier le tra­vail et les sources. « Selon moi, la seule chose qu’il ne faut pas essayer de deman­der à l’IA, c’est de réflé­chir » conclut la chercheuse.

Jamais infaillible ! Le risque des faux-négatifs

Un fonc­tion­ne­ment que les équipes des Déco­deurs du jour­nal Le Monde ont inté­gré dans leur pra­tique. « L’IA est un très bon moyen de tami­ser les infos et de gagner du temps, en pas­sant par exemple de 3 000 noms, aux 200 qui nous inté­ressent » témoigne Maxime Vau­da­no, qui coor­donne la cel­lule d’enquête Les Déco­deurs. Le jour­na­liste, spé­cia­li­sé dans les enquêtes open-source et col­la­bo­ra­tives, avoue qu’ils n’ont pas « un usage très orga­ni­sé ni très impres­sion­nant à ce stade » au sein de la rédaction.

En effet, bien que plu­sieurs enquêtes d’ampleur impli­quant de très grosses bases de don­nées, comme les Pana­ma Papers, ont déjà été réa­li­sées par le pas­sé à l’aide d’algorithmes plus basiques, cela ne garan­tit pas la fia­bi­li­té de l’IA aujourd’hui. « Nous gar­dons en tête que c’est un outil faillible ! Il y a bien sûr les faux-posi­tifs, qui sont les infos gar­dées par l’IA alors qu’elles ne sont pas per­ti­nentes, mais le plus gros risque reste les faux-néga­tifs, témoigne Maxime Vau­da­no. Quand une info passe à la trappe alors qu’elle cor­res­pond à notre sujet. »

L’IA est un très bon moyen de tami­ser les infos et de gagner du temps.

Ain­si, l’usage de l’IA est loin d’être sys­té­ma­tique et plu­sieurs tech­niques « clas­siques » d’investigation sont régu­liè­re­ment uti­li­sées en paral­lèle. « On reste sur des recherches sur le très long terme avec énor­mé­ment d’étapes de véri­fi­ca­tion. » Ain­si, qu’importe la méthode de départ pour obte­nir l’information, elle sera véri­fiée plu­sieurs fois… Par des humains.

Une évolution sans révolution

Alors, de révo­lu­tion à simple évo­lu­tion ? C’est en tout cas l’avis d’Ioana Mano­les­cu qui reste très pru­dente sur les réelles capa­ci­tés des IA, mais éga­le­ment sur celles des hypo­thé­tiques AGI (Intel­li­gence Arti­fi­cielle Géné­rale) du futur. « Oui, l’ordinateur peut battre les humains aux échecs donc dans ce domaine : c’est fini. Mais l’on parle ici d’un sys­tème très spé­ci­fique ! Pour le reste, les robots “intel­li­gents” ne savent pas que l’eau mouille ou que le temps ne s’écoule que dans un sens, alors qu’un bébé le sait… »

Quant à l’IA comme outil d’investigation, la cher­cheuse est plus opti­miste. « Je me dis que les jeunes jour­na­listes vont pou­voir se for­mer à ces tech­niques et les impor­ter dans les rédac­tions. » Car l’utilisation des IA reste cor­ré­lée à une cer­taine culture tech­no­lo­gique au sein des médias, mais aus­si aux for­ma­tions acces­sibles aux jour­na­listes pour prendre en main ces systèmes.

« On manque de temps pour mettre en place ces outils, même si la tech­no­lo­gie est déjà dis­po­nible » ajoute Maxime Vau­da­no. Mais les lignes bougent. Repor­ters sans fron­tières déve­loppe depuis 2023 un pro­to­type d’IA à des­ti­na­tion des jour­na­listes et dédié aux ques­tions envi­ron­ne­men­tales et à la véri­fi­ca­tion d’information. Il est en test depuis avril 2024 au sein de 12 médias par­te­naires. En paral­lèle, le jour­nal Le Monde a noué en mars 2024 un par­te­na­riat finan­cier avec Ope­nAI, la socié­té mère de ChatGPT, pour per­mettre à leurs IA d’avoir accès à leurs archives. Une alliance scru­tée avec pru­dence de la part des équipes de jour­na­listes, mais qui inau­gure un rap­pro­che­ment inédit entre médias et tech­no­lo­gies intelligentes.

Sophie Podevin

Soutenez une information fiable basée sur la méthode scientifique.

Faire un don