3_demystifier
π Science et technologies π Numérique
IA générative : menace ou opportunité ?

Démystifier l’IA générative : le vrai, le faux et l’incertain

avec Laure Soulier, maîtresse de conférences à Sorbonne Université au sein de l’équipe « Machine Learning and Information Access »
Le 7 février 2024 |
6 min. de lecture
Laure Soulier
Laure Soulier
maîtresse de conférences à Sorbonne Université au sein de l’équipe « Machine Learning and Information Access »
En bref
  • Les IA génératives créent du contenu, généralement pertinent et varié (texte, image, vidéo), en se basant sur des probabilités et des modèles de langue profonds.
  • Malgré sa performance, l’IA n’est ni comparable ni équivalente à l’intelligence l’humaine : au détriment de la vérité ce qu’elle vise, c’est la vraisemblance.
  • Le programme perpétue les biais et les erreurs du jeu de données sur lequel il a été entrainé.
  • Cet « outil de travail » ne devrait pas remplacer massivement des emplois, mais pourra même en créer.
  • Son évolution à long terme reste incertaine, mais devra prendre en compte les préoccupations environnementales et tendre vers une l'IA frugale.

#1 L’IA générative : une révolution intelligente ?

L’IA générative, une IA à part – VRAI

Dans le royaume de l’intelligence arti­fi­cielle, il existe de nom­breuses varié­tés. Par­mi celles-ci, l’IA géné­ra­tive, comme son nom l’indique, se dis­tingue par sa capa­ci­té à géné­rer du conte­nu : texte, image, vidéo… Quelques-uns des sys­tèmes actuels les plus connus sont ChatGPT, Bard, Mid­jour­ney ou encore DALL‑E.

Leur prin­cipe repose sur des pro­ba­bi­li­tés : ils pré­disent le mot sui­vant ou le pixel voi­sin, en fonc­tion de ce qui leur semble le plus vrai­sem­blable. Pour cela, l’IA géné­ra­tive s’appuie sur un grand modèle de langue, c’est-à-dire un réseau pro­fond de neu­rones arti­fi­ciels qui a été entraî­né sur une vaste quan­ti­té de don­nées. Ain­si, le logi­ciel iden­ti­fie les cor­res­pon­dances les plus pro­bables selon le contexte.

L’IA générative est intelligente – FAUX

Ce fonc­tion­ne­ment per­met aux IA géné­ra­tives de réa­li­ser des per­for­mances remar­quables. Celles-ci par­viennent à éta­blir des liens entre de mul­tiples élé­ments, à par­tir d’un énorme volume de don­nées. Un pro­ces­sus com­plexe, qui implique un grand nombre d’opérations mathé­ma­tiques, exé­cu­tées très rapidement.

Néan­moins, peut-on par­ler d’ « intel­li­gence » ? Si les résul­tats four­nis peuvent être bluf­fants, le mode opé­ra­toire pour y par­ve­nir n’a rien à voir avec l’intelligence humaine. Il ne s’agit pas non plus d’une « IA géné­rale », qui serait capable d’apprendre n’importe quelle tâche réa­li­sée par un être humain. Aujourd’hui, l’IA géné­ra­tive s’apparente plu­tôt à une mul­ti­pli­ca­tion d’IA étroites, réunies au sein d’un même modèle.

L’IA générative peut tout faire – INCERTAIN

L’IA géné­ra­tive est actuel­le­ment employée dans de nom­breux domaines : cer­tains s’en servent pour créer de la musique, d’autres des pay­sages de jeux vidéo… Quant aux modèles de langue ini­tia­le­ment uti­li­sés pour cap­tu­rer la séman­tique des mots, ils peuvent aujourd’hui géné­rer du texte, répondre à des ques­tions, tra­duire du conte­nu, ou encore géné­rer du code. Mais ces outils pos­sèdent tout de même leurs limites, liées notam­ment aux jeux de don­nées uti­li­sés durant leur appren­tis­sage. Les cor­ré­la­tions iden­ti­fiées à cette étape peuvent, en effet, conduire à des erreurs au moment de la géné­ra­tion. De plus, les éven­tuels biais ren­con­trés lors de la phase d’entraînement trans­pa­raissent dans les résul­tats. Par exemple, un sys­tème de tra­duc­tion aura ten­dance à tra­duire « the nurse » par « l’infirmière », en rai­son des sté­réo­types asso­ciés au métier.

Par ailleurs, les IA géné­ra­tives n’affichent pas tou­jours une grande sta­bi­li­té. Faites le test avec ChatGPT : posez une même ques­tion en variant la for­mu­la­tion, et vous obtien­drez par­fois des réponses dif­fé­rentes ! Les sys­tèmes reposent sur des opé­ra­tions mathé­ma­tiques qui trans­forment l’information en vec­teurs de grande dimen­sion, ce qui rend com­plexe l’explicabilité de ces sys­tèmes. Des recherches sont d’ailleurs en cours sur ce sujet.

#2 Faut-il se méfier de l’IA générative ?

Une IA générative peut se tromper – VRAI

Il faut bien gar­der à l’esprit qu’une IA géné­ra­tive ne vise pas à livrer la véri­té, mais à maxi­mi­ser une vrai­sem­blance, à par­tir de ses don­nées d’entraînement. Elle fait quel­que­fois émer­ger de fausses cor­ré­la­tions entre les mots. De plus, si les don­nées d’entraînement contiennent des erreurs ou des biais, le sys­tème les repro­dui­ra sans aucun doute. Il ne cherche, de toute façon, pas à savoir si l’information four­nie est exacte ou sour­cée ! Ce fonc­tion­ne­ment conduit à l’apparition fré­quente et impré­vi­sible d’ « hal­lu­ci­na­tions », c’est-à-dire de réponses erro­nées ou d’images incohérentes.

Par exemple, d’après une étude de l’université de Hong Kong1, ChatGPT (ver­sion GPT‑3.5) affi­che­rait un taux de per­ti­nence de 64 %. Croi­riez-vous sur parole quelqu’un qui a plus d’une chance sur trois de se tromper ?

Les IA génératives vont se rebeller et prendre le pouvoir – FAUX

Dès que l’intelligence arti­fi­cielle semble fran­chir une nou­velle étape, les fan­tasmes de sou­lè­ve­ment des machines res­sur­gissent, influen­cés par la science-fic­tion. Il ne faut pas tendre vers l’anthropomorphisme à outrance : les IA géné­ra­tives ne font que pré­dire des pro­ba­bi­li­tés – de façon certes com­plexe. Elles ne res­sentent pas d’émotions et n’ont pas davan­tage de conscience. Elles ne peuvent donc pas avoir une « volon­té » de se rebeller.

En 2015, le cher­cheur amé­ri­cain Andrew Ng2, spé­cia­liste de l’IA, décla­rait que craindre une éven­tuelle révolte de l’IA reve­nait à « s’inquiéter de la sur­po­pu­la­tion sur Mars », alors que « nous n’avons encore jamais mis les pieds sur la pla­nète. » Même si la tech­no­lo­gie a sen­si­ble­ment évo­lué ces der­nières années, la com­pa­rai­son paraît tou­jours d’actualité !

L’IA générative pose des problèmes de sécurité et de confidentialité – INCERTAIN

Aujourd’hui, il faut avoir conscience que la plu­part des modèles d’IA géné­ra­tive sont héber­gés sur des ser­veurs amé­ri­cains. Or, en ver­tu du Patriot Act et du Cloud Act, les don­nées envoyées peuvent être récu­pé­rées par les auto­ri­tés amé­ri­caines. De plus, il est cer­tain que les don­nées four­nies à ces IA géné­ra­tives sont réuti­li­sées pour amé­lio­rer les modèles, don­nant la pos­si­bi­li­té de retrou­ver ces don­nées lors de futures inter­ro­ga­tions. Cela peut donc repré­sen­ter un risque, en par­ti­cu­lier pour les entre­prises, qui voient la sécu­ri­té et la confi­den­tia­li­té de leurs don­nées mena­cées. Il existe tou­te­fois des solu­tions d’hébergement avec des espaces dédiés et fer­més, ou encore des alter­na­tives d’IA géné­ra­tives open source pou­vant être ins­tal­lées sur des ser­veurs locaux.

Cepen­dant, comme sou­vent, la régle­men­ta­tion finit par s’adapter au nou­veau contexte tech­no­lo­gique. Ain­si, fin 2023, le Conseil de l’Union euro­péenne et le Par­le­ment euro­péen sont par­ve­nus à un accord quant à une légis­la­tion sur l’intelligence arti­fi­cielle (AI Act)3. Un texte qui sera sans doute affi­né, mais qui pré­voit de mieux enca­drer le recours à l’IA, en confor­mi­té avec le droit euro­péen (dont le RGPD).

#3 L’IA générative : assistant ou menace pour les travailleurs ?

L’IA générative peut remplacer l’être humain sur certaines tâches – VRAI

Les facul­tés de l’IA géné­ra­tive la rendent très utile dans la sphère pro­fes­sion­nelle. Elle peut rédi­ger des conte­nus, écrire des lignes de code, éta­blir le plan d’une for­ma­tion… Mais ce qu’elle pro­duit néces­site géné­ra­le­ment l’œil humain pour en véri­fier l’exactitude, per­son­na­li­ser le mes­sage, y appor­ter une touche plus sen­sible… Il s’agit ain­si d’un outil per­met­tant de gagner en pro­duc­ti­vi­té et donc de libé­rer du temps pour tra­vailler différemment.

Cer­tains métiers pour­raient tou­te­fois dis­pa­raître, faute de valeur ajou­tée suf­fi­sante. Mais n’est-ce pas tou­jours le cas avec le pro­grès tech­nique ? Les allu­meurs de réver­bères, par exemple, n’ont-ils pas dis­pa­ru avec l’arrivée de l’éclairage électrique ?

L’IA générative va mettre des millions de personnes au chômage – FAUX

Res­tons cepen­dant mesu­rés quant aux consé­quences pro­fes­sion­nelles de l’IA géné­ra­tive. Il ne s’agit fina­le­ment que d’un nou­vel outil – très utile – au ser­vice de l’être humain. Et les évo­lu­tions du mar­ché du tra­vail dépendent de nom­breux para­mètres… Les caisses auto­ma­tiques ont-elles fait dis­pa­raître les cais­siers et cais­sières ? La for­ma­tion en ligne a‑t-elle rem­pla­cé les écoles et les enseignants ?

De plus, l’essor de l’IA géné­ra­tive devrait s’accompagner de nou­veaux métiers, à l’image du prompt engi­nee­ring, dis­ci­pline visant à opti­mi­ser les requêtes for­mu­lées à l’IA, de sorte à obte­nir les meilleurs résul­tats pos­sibles. Ain­si, selon l’Organisation inter­na­tio­nale du Tra­vail (OIT)4, « l’IA géné­ra­tive est plus sus­cep­tible d’augmenter que de détruire les emplois en auto­ma­ti­sant cer­taines tâches plu­tôt qu’en rem­pla­çant entiè­re­ment un rôle. »

Jusqu’où ira l’IA générative ? – INCERTAIN

Qu’en sera-t-il à long terme ? Com­ment l’IA géné­ra­tive va-t-elle évo­luer ? Pré­voir son ave­nir est déli­cat : qui aurait réus­si à pré­dire la situa­tion actuelle, il y a quelques années ? Néan­moins, cer­taines ten­dances se des­sinent, comme l’hybridation des sys­tèmes. Par exemple, le RAG (retrie­val-aug­men­ted gene­ra­tion, « géné­ra­tion aug­men­tée de récu­pé­ra­tion ») consiste à com­bi­ner une IA géné­ra­tive avec un moteur de recherche, pour amé­lio­rer la per­ti­nence des résul­tats et limi­ter les hallucinations.

Enfin, l’IA géné­ra­tive ne pour­ra se déve­lop­per sans une remise en ques­tion de son empreinte éco­lo­gique. Ses modèles exigent, en effet, énor­mé­ment de don­nées et de puis­sance de cal­cul. Une nou­velle voie est ain­si déjà explo­rée, afin d’optimiser les res­sources néces­saires : l’IA frugale.

Propos recueillis par Bastien Contreras
1https://​arxiv​.org/​p​d​f​/​2​3​0​2​.​1​2​0​9​5.pdf
2https://​www​.wired​.com/​b​r​a​n​d​l​a​b​/​2​0​1​5​/​0​5​/​a​n​d​r​e​w​-​n​g​-​d​e​e​p​-​l​e​a​r​n​i​n​g​-​m​a​n​d​a​t​e​-​h​u​m​a​n​s​-​n​o​t​-​j​u​s​t​-​m​a​c​h​ines/
3https://​www​.consi​lium​.euro​pa​.eu/​f​r​/​p​r​e​s​s​/​p​r​e​s​s​-​r​e​l​e​a​s​e​s​/​2​0​2​3​/​1​2​/​0​9​/​a​r​t​i​f​i​c​i​a​l​-​i​n​t​e​l​l​i​g​e​n​c​e​-​a​c​t​-​c​o​u​n​c​i​l​-​a​n​d​-​p​a​r​l​i​a​m​e​n​t​-​s​t​r​i​k​e​-​a​-​d​e​a​l​-​o​n​-​t​h​e​-​f​i​r​s​t​-​w​o​r​l​d​w​i​d​e​-​r​u​l​e​s​-​f​o​r-ai/
4https://​news​.un​.org/​f​r​/​s​t​o​r​y​/​2​0​2​3​/​0​8​/​1​1​37832

Soutenez une information fiable basée sur la méthode scientifique.

Faire un don