Accueil / Chroniques / La métagénomique : comment étudier la biodiversité microscopique
π Santé et biotech π Science et technologies

La métagénomique : comment étudier la biodiversité microscopique

Tania Louis
Tania Louis
docteure en biologie et chroniqueuse chez Polytechnique Insights 
En bref
  • La métagénomique est une technique combinant biologie moléculaire et informatique qui permet d’étudier l’ensemble du monde microbien.
  • On peut ainsi analyser les génomes au niveau d’un échantillon entier afin de caractériser des écosystèmes complets.
  • Une étude métagénomique se réalise en deux grandes étapes : la récupération d’échantillons et le séquençage.
  • Séquencer les génomes nécessite une grande maîtrise en bioinformatique, ce qui rend le développement de la métagénomique indissociable du développement du Big Data.
  • Si la métagénomique est coûteuse et lourde à mettre en place, elle reste néanmoins prometteuse et nous permet de découvrir une biodiversité microscopique encore inconnue.

Leur petite taille rend cette réa­li­té dif­fi­cile à per­ce­voir mais les micro-orga­nismes sont, de loin, les enti­tés les plus nom­breuses sur notre pla­nète. Bac­té­ries, archées, virus, cham­pi­gnons et autres euca­ryotes minus­cules sont pré­sents à peu près par­tout et forment des éco­sys­tèmes qui échappent à la fois à nos yeux et à nos éprou­vettes, puisqu’on estime que seule­ment 1 à 2 % des micro-orga­nismes sont faci­le­ment culti­vables en labo­ra­toire. Pour­tant, il est désor­mais pos­sible d’étudier l’ensemble du monde micro­bien grâce à une tech­nique com­bi­nant bio­lo­gie molé­cu­laire et infor­ma­tique : la métagénomique.

Décortiquer les génomes

Comme l’indique ce terme inven­té en 19981, l’idée géné­rale est d’analyser les génomes non plus à l’échelle d’un indi­vi­du ou d’une espèce mais au-delà, au niveau d’un échan­tillon entier. Cela per­met d’accéder à l’ensemble des micro-orga­nismes qu’il contient, dont ceux qu’on ne sait pas culti­ver, et de carac­té­ri­ser des éco­sys­tèmes com­plets. Mais, si des pro­grès tech­no­lo­giques récents font de la méta­gé­no­mique une approche en plein essor, sa mise en œuvre reste complexe.

Pre­nons un peu de recul pour remettre les choses en pers­pec­tive. Le pre­mier génome à avoir été séquen­cé, en 1977, est celui d’un virus bac­té­rio­phage qui mesu­rait envi­ron 5 300 nucléo­tides2. Ont sui­vi les bac­té­ries3 et les levures4 puis, fina­le­ment, le génome humain : publié au début des années 2 000, des cen­taines de mil­lions d’euros et des années de tra­vail ont été néces­saires pour décryp­ter la majeure par­tie de ses 3 mil­liards de nucléo­tides5. La pre­mière séquence vrai­ment com­plète d’un génome humain n’a quant à elle été publiée qu’en avril 20226 !

Ain­si, le séquen­çage est une tech­nique rela­ti­ve­ment récente, qui ne cesse de s’améliorer… Si bien qu’il est aujourd’hui pos­sible de séquen­cer un génome humain avec une qua­li­té satis­fai­sante pour « seule­ment » 1 000 €, en une seule jour­née. Il existe en fait dif­fé­rentes tech­niques de séquen­çage dit « de nou­velle géné­ra­tion », dont la pré­ci­sion, la vitesse et le coût varient, et il est désor­mais pos­sible de récu­pé­rer en paral­lèle des mil­lions voire des mil­liards de séquences pour ana­ly­ser des dizaines de mil­liards de nucléo­tides chaque jour. C’est le pre­mier pro­grès tech­no­lo­gique qui per­met l’étude simul­ta­née des génomes de com­mu­nau­tés de micro-orga­nismes… Mais ce n’est pas le seul.

En effet, séquen­cer beau­coup de nucléo­tides conduit à récu­pé­rer beau­coup de don­nées numé­riques, qu’il faut ensuite être capable de mani­pu­ler. Le déve­lop­pe­ment de la méta­gé­no­mique se fait donc en paral­lèle de celui du Big Data. Sto­ckage, capa­ci­tés de cal­cul, déve­lop­pe­ment d’outils ou ges­tion de bases de don­nées : faire par­ler les génomes néces­site des équi­pe­ments et des com­pé­tences solides en bioinformatique.

Exemple d’une cel­lule d’écoulement uti­li­sée pour du séquen­çage mas­si­ve­ment paral­lèle : des mil­liers de mor­ceaux d’ADN sont fixés sur la cel­lule et séquen­cés simul­ta­né­ment. Pho­to par Eplisterra.

La méta­gé­no­mique se situe ain­si au car­re­four de deux domaines en pleine évo­lu­tion, et ses pos­si­bi­li­tés ne cessent de s’améliorer. Il peut être ten­tant d’y voir un nou­veau Graal de la micro­bio­lo­gie, per­met­tant de décou­vrir un monde micro­sco­pique qui, jusqu’ici, nous échap­pait. Néan­moins cette approche reste lourde, coû­teuse et semée d’embûches. Avant de la mobi­li­ser, mieux vaut avoir bien affû­té la ques­tion à laquelle on essaye de répondre et peau­fi­ner son pro­to­cole pour évi­ter d’être ense­ve­li sous un mon­ceau de don­nées inexploitables.

La métagénomique pas à pas

La pre­mière étape d’une étude méta­gé­no­mique est la récu­pé­ra­tion d’échantillons. Qu’on s’intéresse aux micro-orga­nismes d’un sol, d’un point d’eau ou du micro­biote humain, il faut tra­vailler sur des échan­tillons adap­tés à la ques­tion qu’on se pose, com­pa­rables entre eux (la com­po­si­tion du sol ne sera par exemple pas la même à des endroits dif­fé­rents, à des pro­fon­deurs dif­fé­rentes ou pen­dant des sai­sons dif­fé­rentes), suf­fi­sam­ment nom­breux et divers pour être repré­sen­ta­tifs, et assez volu­mi­neux pour pou­voir y récu­pé­rer les quan­ti­tés d’ADN néces­saires à la suite du protocole.

Dif­fé­rents pro­cé­dés peuvent être uti­li­sés pour cette extrac­tion, dont le pro­to­cole est opti­mi­sé selon le milieu d’origine, les types d’organismes d’intérêt et le maté­riau qu’on veut récu­pé­rer. En effet, la pré­pa­ra­tion de l’échantillon est l’occasion de trier les orga­nismes étu­diés (par exemple en fil­trant pour ne gar­der que ceux fai­sant une cer­taine taille) et de sélec­tion­ner le type d’acides nucléiques qui seront séquen­cés ensuite. Il est notam­ment pos­sible de puri­fier les ARN mes­sa­gers plu­tôt que l’ADN géno­mique pour ana­ly­ser l’activité réelle d’une com­mu­nau­té micro­bienne : on parle alors de méta­trans­crip­to­mique plu­tôt que de métagénomique.

La pré­pa­ra­tion de l’échantillon est l’occasion de trier les orga­nismes étu­diés et de sélec­tion­ner les acides nucléiques à séquencer.

Arrive ensuite l’étape du séquen­çage, avec deux approches pos­sibles : la méta­gé­no­mique ciblée ou la méta­gé­no­mique glo­bale. La méta­gé­no­mique ciblée est prin­ci­pa­le­ment uti­li­sée pour iden­ti­fier et clas­ser les espèces pré­sentes dans un échan­tillon. Dans ce cas, seules cer­taines par­ties des génomes, consi­dé­rées comme spé­ci­fiques d’un type d’organismes ou d’une gamme de fonc­tions, sont ampli­fiées, séquen­cées et ana­ly­sées. La méta­gé­no­mique glo­bale per­met quant à elle de carac­té­ri­ser fine­ment des com­mu­nau­tés de micro-orga­nismes, mais sa mise en œuvre est plus lourde. Elle consiste à récu­pé­rer tout l’ADN conte­nu dans un échan­tillon, le frag­men­ter pour obte­nir des mor­ceaux assez courts pour être séquen­cés, séquen­cer l’ensemble de ces por­tions de génomes puis recons­ti­tuer au mieux les génomes d’origine.

Cela revient à prendre plu­sieurs puzzles, en mélan­ger toutes les pièces (avec quelques pertes) puis essayer de recons­ti­tuer chaque puzzle à par­tir de ce tas dis­pa­rate. Pour les orga­nismes dont les génomes sont déjà réper­to­riés, c’est rela­ti­ve­ment facile car on a des modèles à suivre. C’est plus déli­cat pour les orga­nismes incon­nus, qui peuvent repré­sen­ter 90 % de cer­tains échan­tillons7. Des astuces ont été ima­gi­nées pour faci­li­ter la réso­lu­tion de ce casse-tête8 9, mais la majeure par­tie de la bio­di­ver­si­té micro­sco­pique nous est encore incon­nue : la méta­gé­no­mique per­met tout juste de com­men­cer à la défri­cher en mesu­rant l’ampleur de notre ignorance. 

Métagénomique et bioprospection

Cela dit, cette approche n’est pas seule­ment des­crip­tive, elle ouvre aus­si de nou­velles pos­si­bi­li­tés pour iden­ti­fier des com­po­sés micro­biens actifs. En effet, après frag­men­ta­tion des génomes pré­sents dans un échan­tillon, on peut pro­duire des bac­té­ries conte­nant cha­cune un des mor­ceaux d’ADN obte­nus et voir si cer­taines acquièrent une capa­ci­té inté­res­sante (récu­pé­rer telle souche d’énergie, dégra­der tels com­po­sés, avoir une acti­vi­té anti­bio­tique…). Le tout sans culti­ver, ni même iden­ti­fier, les orga­nismes qui pos­sé­daient cette com­pé­tence au départ !

Au-delà de la recherche fon­da­men­tale, le ver­sant fonc­tion­nel de la méta­gé­no­mique élar­git donc le champ de la bio­pros­pec­tion. Cela reste de la méta­gé­no­mique, coû­teuse et lourde à mettre en place… Mais appe­lée à se déve­lop­per au fil des pro­grès tech­no­lo­giques. L’existence d’applications directes dans des domaines aus­si fon­da­men­taux que la méde­cine et l’agronomie consti­tue une rai­son sup­plé­men­taire de suivre les avan­cées de la méta­gé­no­mique et les décou­vertes asso­ciées dans les années à venir.

1https://www.cell.com/cell-chemical-biology/pdf/S1074-5521(98)90108–9.pdf
2https://​www​.nature​.com/​a​r​t​i​c​l​e​s​/​2​6​5​687a0
3https://​pub​med​.ncbi​.nlm​.nih​.gov/​7​5​4​2800/
4https://​pub​med​.ncbi​.nlm​.nih​.gov/​8​8​4​9441/
5https://​www​.genome​.gov/​h​u​m​a​n​-​g​e​n​o​m​e​-​p​r​oject
6https://​www​.mede​ci​nes​ciences​.org/​e​n​/​a​r​t​i​c​l​e​s​/​m​e​d​s​c​i​/​f​u​l​l​_​h​t​m​l​/​2​0​2​2​/​0​6​/​m​s​c​2​2​0​1​0​4​/​m​s​c​2​2​0​1​0​4​.html
7https://​www​.scien​ce​di​rect​.com/​s​c​i​e​n​c​e​/​a​r​t​i​c​l​e​/​a​b​s​/​p​i​i​/​S​0​1​6​8​1​7​0​2​1​6​3​08012
8En cher­chant des modèles dans les séquences virales inté­grées dans les génomes d’autres orga­nismes qui, eux, ont été séquen­cés : https://​www​.ncbi​.nlm​.nih​.gov/​p​m​c​/​a​r​t​i​c​l​e​s​/​P​M​C​6​9​6​6834/
9En com­bi­nant dif­fé­rents jeux de don­nées méta­gé­no­miques pour cher­cher des frag­ments dont le nombre d’exemplaires est com­pa­rable : https://​www​.ncbi​.nlm​.nih​.gov/​p​m​c​/​a​r​t​i​c​l​e​s​/​P​M​C​4​1​1​1155/

Soutenez une information fiable basée sur la méthode scientifique.

Faire un don