RTFlash

Vivant

Le potentiel d'expression génétique semble déjà largement inscrit dans notre ADN…

C'est une découverte capitale qui n'a pas fini de faire couler beaucoup d'encre et aura de grandes conséquences dans l'ensemble du champ biologique et médical : selon une étude réalisé par des chercheurs de l'Université de technologie de Chalmers, à Göteborg en Suède, nos codes génétiques contrôleraient non seulement les protéines produites par nos cellules, mais aussi – dans une large mesure – la quantité produite.

Ces chercheurs ont d’abord travaillé sur de l'ADN de levure. Ils ont développé des algorithmes d'auto-apprentissage, sous forme de réseaux de neurones artificiels, pour prédire la relation entre ces données génétiques et la quantité moyenne de protéines dans les cellules. Ils ont pu ainsi constater que l’ADN déterminait en grande partie l’expression des gènes, soit la quantité de protéines produite.

Alors que jusqu'à présent, le facteur déterminant la quantité de protéines produite restait mal compris, une seule cellule pouvant contenir de quelques molécules d'une protéine donnée à des dizaines de milliers, cette nouvelle recherche ajoute doublement à la compréhension des processus sous-jacents à l'expression génique : non seulement la recherche décrypte les liens entre le code ADN lui-même et l’expression génique mais démontre que ces données peuvent être lues à l'aide de superordinateurs et de l’IA.

Les chercheurs ont ensuite testé leur principe d’algorithme sur 6 autres organismes, dont les humains, et ont abouti à une association moyenne entre l'expression génique et le code génétique de 60 %. D'autres analyses de l'expression de gènes individuels montrent que ce qui contrôle le niveau est la présence de certaines combinaisons de motifs dans le code ADN, qui peuvent être trouvées dans différentes parties du code – à la fois dans les régions codantes et non codantes.

Des modèles constitués des 4 blocs de construction moléculaires ou nucléobases A, C, G et T, sont associés à l'expression des gènes, c’est-à-dire à la quantité de protéines produites. L’auteur principal, le Professeur Aleksej Zelezniak, du département de biologie et de génie biologique de Chalmers, commente la découverte : « On pourrait comparer cela à une partition d’orchestre. Les notes décrivent les hauteurs que les différents instruments doivent jouer. Mais les notes à elles seules ne font pas la musique. Des informations sur le tempo et la dynamique sont également nécessaires. Ici, la génétique diffuse cette information sur de larges zones de la molécule d'ADN. Auparavant, nous pouvions lire les notes, mais nous ne savions pas comment jouer la musique. Maintenant, nous pouvons faire les deux ».

S’il existe d'autres facteurs qui affectent également l'expression des gènes des cellules (dont les facteurs épigénétiques), ces informations incorporées dans le code génétique représentent environ 80 % du processus. L’équipe valide ce mécanisme sur 7 organismes modèles différents (levure, bactéries, mouche des fruits, souris et humains). « Cette découverte est d'autant plus importante qu'elle est universelle, valable pour toute vie biologique », précise l'étude.

Encore une fois, la découverte n’aurait pas été possible sans le recours à l’IA et aux supercalculateurs qui ont permis l’analyse de milliers de positions en même temps, et la découverte des différents motifs et combinaisons de motifs pertinents pour l'expression des gènes. Une méthode qui pourrait devenir un outil important dans plusieurs domaines de recherche, génétique et recherche évolutive, biologie des systèmes, médecine et biotechnologie. Ces travaux vont permettre de mieux comprendre les nombreuses mutations qui peuvent affecter l'expression des gènes dans la cellule et donc, à terme, comment les cancers apparaissent et se développent.

Article rédigé par Georges Simmonds pour RT Flash

Nature

Noter cet article :

 

Vous serez certainement intéressé par ces articles :

Recommander cet article :

back-to-top