Comment l’évolution construit des gènes à partir de rien

Certaines espèces de morue ont un gène nouvellement frappé impliqué dans la prévention de la congélation.Crédit : Paul Nicklen/NG Image Collection

Au plus profond de l’hiver, les températures de l’eau dans l’océan Arctique recouvert de glace peuvent descendre en dessous de zéro. C’est assez froid pour geler de nombreux poissons, mais ces conditions ne perturbent pas la morue. Une protéine présente dans son sang et ses tissus se lie à de minuscules cristaux de glace et les empêche de se développer.

L’origine de ce talent chez le cabillaud était une énigme que la biologiste évolutionniste Helle Tessand Baalsrud voulait résoudre. Elle et son équipe de l’université d’Oslo ont fouillé les génomes de la morue de l’Atlantique (Gadus morhua) et de plusieurs de ses plus proches parents, pensant retrouver les cousins du gène antigel. Aucun n’est apparu. Baalsrud, qui était à l’époque un nouveau parent, s’inquiétait que son manque de sommeil lui fasse manquer quelque chose d’évident.

En savoir plus sur la formation de novo des gènes.

Votre navigateur ne prend pas en charge l’élément audio.

Mais elle est tombée sur des études suggérant que les gènes n’évoluent pas toujours à partir de ceux existants, comme les biologistes l’ont longtemps supposé. Au contraire, certains sont façonnés à partir de tronçons désolés du génome qui ne codent pour aucune molécule fonctionnelle. Lorsqu’elle s’est penchée sur les génomes des poissons, elle a vu des indices que cela pouvait être le cas : la protéine antigel – essentielle à la survie de la morue – avait apparemment été construite à partir de rien1. À ce moment-là, un autre chercheur était parvenu à une conclusion similaire.2

Le cabillaud est en bonne compagnie. Au cours des cinq dernières années, les chercheurs ont trouvé de nombreux signes de ces gènes « de novo » nouvellement créés dans toutes les lignées qu’ils ont étudiées. Il s’agit d’organismes modèles tels que les mouches à fruits et les souris, de plantes cultivées importantes et d’humains ; certains de ces gènes sont exprimés dans le cerveau et les tissus testiculaires, d’autres dans divers cancers.

Les gènes de novo incitent même à repenser certaines parties de la théorie de l’évolution. La sagesse conventionnelle voulait que de nouveaux gènes aient tendance à apparaître lorsque des gènes existants sont accidentellement dupliqués, mélangés à d’autres ou brisés, mais certains chercheurs pensent maintenant que les gènes de novo pourraient être assez courants : certaines études suggèrent qu’au moins un dixième des gènes pourrait être fabriqué de cette manière ; d’autres estiment que plus de gènes pourraient émerger de novo que de la duplication de gènes. Leur existence brouille les frontières de ce qui constitue un gène, révélant que le matériau de départ de certains nouveaux gènes est de l’ADN non codant (voir « Naissance d’un gène »).

La capacité des organismes à acquérir de nouveaux gènes de cette manière témoigne de la « plasticité de l’évolution pour rendre possible quelque chose d’apparemment impossible », déclare Yong Zhang, généticien à l’Institut de zoologie de l’Académie chinoise des sciences à Pékin, qui a étudié le rôle des gènes de novo dans le cerveau humain.

Mais les chercheurs doivent encore travailler sur la manière d’identifier définitivement un gène comme étant de novo, et des questions subsistent sur la manière exacte – et la fréquence – de leur naissance. Les scientifiques se demandent également pourquoi l’évolution prendrait la peine de créer des gènes à partir de rien alors qu’il existe déjà tant de matériel prêt à l’emploi. Des questions aussi fondamentales témoignent de la jeunesse de ce domaine. « Il ne faut pas remonter à tant d’années pour que l’évolution de novo des gènes soit rejetée », dit Baalsrud.

Nouveaux arrivants

Dans les années 1970, les généticiens voyaient l’évolution comme un processus plutôt conservateur. Lorsque Susumu Ohno a exposé l’hypothèse selon laquelle la plupart des gènes évoluaient par duplication3, il a écrit que « Au sens strict, rien dans l’évolution n’est créé de novo. Chaque nouveau gène doit avoir surgi d’un gène déjà existant. »

La duplication d’un gène se produit lorsque des erreurs dans le processus de réplication de l’ADN produisent plusieurs instances d’un gène. Au fil des générations, les versions accumulent les mutations et divergent, de sorte qu’elles finissent par coder des molécules différentes, chacune ayant sa propre fonction. Depuis les années 1970, les chercheurs ont trouvé une foule d’autres exemples de la façon dont l’évolution modifie les gènes : des gènes existants peuvent être fragmentés ou « transférés latéralement » entre espèces. Tous ces processus ont quelque chose en commun : leur principal ingrédient est le code existant d’une machine moléculaire bien huilée.

Crédit : Nik Spencer/Nature

Mais les génomes contiennent bien plus que des gènes : en fait, seuls quelques pour cent du génome humain, par exemple, codent réellement des gènes. On trouve également d’importantes portions d’ADN – souvent appelées « ADN poubelle » – qui semblent dépourvues de toute fonction. Certains de ces tronçons partagent des caractéristiques avec les gènes codant pour des protéines sans être réellement des gènes eux-mêmes : par exemple, ils sont parsemés de codons à trois lettres qui pourraient, en théorie, indiquer à la cellule de traduire le code en une protéine.

Ce n’est qu’au XXIe siècle que les scientifiques ont commencé à voir des indices selon lesquels les sections non codantes de l’ADN pourraient conduire à de nouveaux codes fonctionnels pour les protéines. Le séquençage génétique ayant progressé au point que les chercheurs pouvaient comparer des génomes entiers de parents proches, ils ont commencé à trouver des preuves que les gènes pouvaient disparaître assez rapidement au cours de l’évolution. En 2006 et 2007, le généticien évolutionniste David Begun, de l’Université de Californie, à Davis, a publié ce que beaucoup considèrent comme les premiers articles démontrant l’existence de gènes particuliers apparaissant de novo chez les mouches des fruits4,5. Ces études établissaient un lien entre ces gènes et la reproduction mâle : Begun a constaté qu’ils étaient exprimés dans les testicules et la glande du liquide séminal, où il semblait que la puissante force évolutive de la sélection sexuelle entraînait la naissance des gènes.

Peu de temps avant, la génomicienne évolutionniste Mar Albà, de l’Institut de recherche médicale Hospital del Mar à Barcelone, en Espagne, avait montré que plus un gène est jeune, d’un point de vue évolutif, plus il a tendance à évoluer rapidement6. Elle a émis l’hypothèse que cela pouvait s’expliquer par le fait que les molécules codées par les gènes plus jeunes sont moins bien définies et nécessitent davantage d’ajustements, et que cela pouvait être une conséquence de l’apparition de ces gènes de novo – ils n’étaient pas liés à une fonction antérieure aussi étroitement que ceux qui avaient évolué à partir de gènes plus anciens. Albà et Begun se souviennent qu’il a été difficile de publier leurs premiers travaux sur le sujet. « Il y avait beaucoup de scepticisme », dit Albà. « C’est incroyable comme les choses ont changé. »

Les études ont également commencé à décortiquer ce que font les gènes de novo. Un gène permet à la plante de cresson (Arabidopsis thaliana) de produire de l’amidon, par exemple, et un autre aide les cellules de levure à se développer. Comprendre ce qu’ils font pour leurs hôtes devrait permettre d’expliquer leur existence – pourquoi il est avantageux de créer à partir de rien plutôt que d’évoluer à partir de matériel existant. « Nous ne comprendrons pas pourquoi ces gènes évoluent si nous ne comprenons pas ce qu’ils font », dit Begun.

Gènes en attente

L’étude des gènes de novo s’avère être une partie de la génétique, une partie de l’expérience de pensée. « Pourquoi notre domaine est-il si difficile ? » demande Anne-Ruxandra Carvunis, de l’université de Pittsburgh, en Pennsylvanie. « C’est à cause de questions philosophiques ». Au cœur du problème se trouve une question que Carvunis se pose depuis une décennie : qu’est-ce qu’un gène ?

Un gène est communément défini comme une séquence d’ADN ou d’ARN qui code pour une molécule fonctionnelle. Le génome de la levure, cependant, possède des centaines de milliers de séquences, connues sous le nom de cadres de lecture ouverts (ORF), qui pourraient théoriquement être traduites en protéines, mais que les généticiens supposaient être soit trop courtes, soit trop différentes de celles d’organismes étroitement apparentés pour avoir une fonction probable.

Lorsque Carvunis a étudié les ORF de levure pour son doctorat, elle a commencé à soupçonner que toutes ces sections n’étaient pas en sommeil. Dans une étude7 publiée en 2012, elle a cherché à savoir si ces ORF étaient transcrits en ARN et traduits en protéines – et, tout comme les gènes, beaucoup d’entre eux l’étaient – sans toutefois que l’on sache si les protéines étaient utiles à la levure, ou si elles étaient traduites à des niveaux suffisamment élevés pour remplir une fonction. « Alors, qu’est-ce qu’un gène ? Je ne sais pas », dit Carvunis. Ce qu’elle pense avoir trouvé, cependant, c’est « une matière première – un réservoir – pour l’évolution ».

Certains de ces gènes en attente, ou ce que Carvunis et ses collègues ont appelé des proto-gènes, ressemblaient davantage à des gènes que d’autres, avec des séquences plus longues et davantage d’instructions nécessaires pour transformer l’ADN en protéines. Les proto-gènes pourraient constituer un terrain d’essai fertile pour l’évolution, afin de convertir le matériel non codant en véritables gènes. « C’est comme un lancement bêta », suggère Aoife McLysaght, qui travaille sur l’évolution moléculaire au Trinity College de Dublin.

Certains chercheurs sont allés au-delà de l’observation pour manipuler les organismes afin qu’ils expriment du matériel non codant. Michael Knopp et ses collègues de l’université d’Uppsala, en Suède, ont montré que l’insertion et l’expression d’ORF générés de manière aléatoire dans Escherichia coli pouvaient renforcer la résistance de la bactérie aux antibiotiques, une séquence produisant un peptide qui multipliait la résistance par 488. En utilisant une approche similaire, Diethard Tautz et son équipe de l’Institut Max Planck de biologie évolutive de Plön, en Allemagne, ont montré que la moitié des séquences ralentissaient la croissance de la bactérie, et qu’un quart semblait l’accélérer9 – bien que ce résultat soit discuté. De telles études suggèrent que les peptides issus de séquences aléatoires peuvent être étonnamment fonctionnels.

Des chercheurs étudiant la souche de riz Oryza sativa japonica ont constaté que 175 de ses gènes ont été créés de novo.Crédit : Jay Stocker

Mais des séquences aléatoires d’ADN pourraient également coder pour des peptides qui sont « réactifs et méchants et ont tendance à s’agréger et à faire de mauvaises choses », explique la biologiste évolutionniste Joanna Masel de l’Université d’Arizona à Tucson. L’expression de ces séquences à de faibles niveaux pourrait aider la sélection naturelle à éliminer les portions potentiellement dangereuses – celles qui créent des protéines désordonnées ou mal repliées – de sorte que ce qui reste dans une espèce est relativement bénin.

Créer des gènes à partir de régions non codantes pourrait présenter certains avantages par rapport à d’autres méthodes de fabrication de gènes, dit Albà. La duplication des gènes est un « mécanisme très conservateur », dit-elle, qui produit des protéines bien adaptées, taillées dans la même étoffe que leurs ancêtres ; les gènes de novo, en revanche, sont susceptibles de produire des molécules nettement différentes. Cela pourrait rendre difficile leur insertion dans des réseaux bien établis de gènes et de protéines – mais ils pourraient aussi être mieux adaptés à certaines nouvelles tâches.

Un gène nouvellement frappé pourrait aider un organisme à répondre à un changement dans son environnement, par exemple. Cela semble avoir été le cas pour la morue, qui a acquis sa protéine antigel lorsque l’hémisphère nord s’est refroidi il y a environ 15 millions d’années.

Taux de natalité

Pour retracer quels gènes d’un organisme ont été fabriqués de novo, les chercheurs ont besoin de séquences complètes pour l’organisme et ses proches parents. Le riz est une plante cultivée qui répond à ces critères. La chaleur étouffante de Hainan, une île tropicale du sud de la Chine, est l’environnement idéal pour la culture du riz, même si les conditions de travail peuvent être éprouvantes. « C’est horrible », déclare le généticien évolutionniste Manyuan Long, de l’université de Chicago (Illinois). Il fait si chaud « que vous pouvez faire cuire votre œuf dans le sable ».

L’équipe de Long voulait savoir combien de gènes avaient émergé de novo dans la souche Oryza sativa japonica, et quelles protéines ces gènes pourraient fabriquer. L’équipe a donc comparé le génome de cette souche à celui de ses proches parents et a utilisé un algorithme pour repérer les régions qui contenaient un gène chez certaines espèces mais qui en étaient dépourvues chez d’autres. Les chercheurs ont ainsi pu identifier l’ADN non codant qui a donné naissance au gène en question et suivre son parcours jusqu’à ce qu’il devienne un gène. Ils ont également pu totaliser le nombre de gènes de novo apparus dans la souche : 175 gènes sur 3,4 millions d’années d’évolution10 (sur la même période, la souche a gagné 8 fois plus de gènes par duplication).

L’étude aborde l’une des plus grandes préoccupations du domaine : comment dire si un gène est vraiment de novo. Les réponses varient énormément, et les approches évoluent encore. Par exemple, une première étude a trouvé 15 gènes de novo dans l’ensemble de l’ordre des primates11 ; une tentative ultérieure en a trouvé 60 chez les seuls humains12. Une option pour trouver des gènes de novo candidats consiste à utiliser un algorithme pour rechercher des gènes similaires chez des espèces apparentées. Si rien n’apparaît, il est alors possible que le gène soit apparu de novo. Mais le fait de ne pas trouver de parent ne signifie pas qu’il n’y a pas de parent : le gène pourrait avoir été perdu en cours de route ou avoir changé de forme loin de sa parenté. L’étude sur le riz a contourné ce problème en identifiant explicitement les morceaux d’ADN non codant qui sont devenus des gènes de novo.

Sur de longues échelles de temps évolutives – bien plus longues que les quelques millions d’années de l’évolution du riz – il est difficile de distinguer un gène de novo d’un gène qui a simplement divergé trop loin de ses ancêtres pour être reconnaissable, de sorte que la détermination du nombre absolu de gènes qui sont apparus de novo plutôt que par duplication « est une question presque sans réponse », dit Tautz.

Pour démontrer à quel point les résultats de différentes méthodes peuvent être variés, le généticien évolutionniste Claudio Casola de l’Université Texas A&M à College Station a utilisé des approches alternatives pour réanalyser les résultats d’études antérieures, et n’a pas réussi à vérifier 40% des gènes de novo qu’ils avaient proposés13. Pour Casola, cela montre la nécessité de normaliser les tests. Actuellement, dit-il, « il semble qu’il y ait beaucoup d’incohérence ».

Le comptage des gènes de novo dans le génome humain s’accompagne du même cortège de mises en garde. Mais là où des gènes de novo ont été identifiés, les chercheurs commencent à explorer leurs rôles dans la santé et la maladie. Zhang et ses collègues ont découvert qu’un gène propre à l’homme est exprimé à un niveau plus élevé dans le cerveau des personnes atteintes de la maladie d’Alzheimer14, et des travaux antérieurs15 avaient établi un lien entre certaines variantes du gène et la dépendance à la nicotine. Pour Zhang, les recherches qui relient les gènes de novo au cerveau humain sont alléchantes. « Nous savons que ce qui fait de nous des humains, c’est notre cerveau », dit-il, « il doit donc y avoir un kit génétique pour pousser l’évolution de notre cerveau. » Cela suggère une piste pour de futures études. Zhang suggère que les chercheurs pourraient étudier le kit génétique par des expériences avec des organoïdes humains – des cellules cultivées qui servent d’organe modèle.

Les gènes de novo pourraient avoir des implications pour la compréhension du cancer, également. Un tel gène – unique à l’homme et au chimpanzé – a été lié à la progression du cancer dans des modèles murins de neuroblastome16. Et les versions cancérigènes du papillomavirus humain comprennent un gène qui n’est pas présent dans les formes non cancérigènes17.

De nombreux gènes de novo restent non caractérisés, de sorte que l’importance potentielle du processus pour la santé et la maladie n’est pas claire. « Il faudra un certain temps avant que nous comprenions pleinement dans quelle mesure il contribue à la santé humaine et dans quelle mesure il contribue à l’origine de l’espèce humaine », dit Carvunis.

Bien que les gènes de novo restent énigmatiques, leur existence rend une chose claire : l’évolution peut facilement faire quelque chose à partir de rien. « L’une des beautés de travailler avec des gènes de novo, dit Casola, est que cela montre à quel point les génomes sont dynamiques. »

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.