Le génome est le manuel d'instruction du corps. Il
contient les informations brutes, sous forme d'ADN, qui déterminent
tout, même le risque
potentiel de maladie. Or, comme le mentionnent les chercheurs, ce manuel est écrit dans le langage de la biologie, alors donner un sens à tout ce qu'il code s'est révélé difficile. Dans une étude menée par les chercheurs de Columbia University publiée dans Proceedings of the National Academy of Sciences, ces derniers ont développé un outil de
calcul mettant en lumière les segments les plus difficiles à traduire du
génome. Avec cet outil en main, les chercheurs peuvent se rapprocher de la compréhension de l'ADN, de la croissance et du
développement au vieillissement et à la maladie.
Selon les chercheurs, les
génomes d'organismes aussi simples que la mouche à fruits contiennent
120 millions de lettres d'ADN, dont la plupart n'ont pas encore été
décodées parce que les indices fournis sont trop subtils pour que les
outils existants puissent les détecter. Selon eux, le nouvel algorithme permettra de balayer ces millions de
lignes de code génétique et de capter même les signaux les plus faibles, donnant une image beaucoup plus complète de ce que l'ADN code.
Les chercheurs mentionnent que les généticiens ont longtemps cherché des moyens de déchiffrer les mystères cachés dans l'ADN. Un tel mystère a impliqué une classe particulièrement envahissante de gènes connus sous le nom de gènes Hox. Plus concrètement, les gènes
Hox agissent comme des architectes du corps, ils conduisent certains des
aspects les plus précoces et les plus critiques de la croissance et de
la différenciation, comme dans un embryon en développement, la tête et
les membres doivent être positionnés. Or, les chercheurs révèlent que les gènes Hox ont un paradoxe . En effet, même si chaque gène Hox
individuel guidait une caractéristique différente de la croissance, les
facteurs de transcription Hox se liaient fortement et visiblement au
même ensemble de séquences d'ADN facilement identifiables
En 2015, les chercheurs ont découvert que les facteurs de transcription de Hox se liaient également à de nombreux autres endroits,
de façon plus discrète dans les sites dits à faible affinité. Ces derniers ont estimé que ces sites de liaison de faible affinité
étaient la clé des facteurs de transcription Hox capables de conduire un
aspect du développement par rapport à un autre. Or, le problème restait de savoir comment déchiffrer ces sites à partir du génome.
Les chercheurs ont développé une méthode de séquençage génétique appelée SELEX-seq pour
caractériser systématiquement tous les sites de liaison de Hox. Cependant, il fallait que le même fragment d'ADN soit séquencé encore et encore. A chaque nouveau tour, alors que plus d'informations ont été révélées, certaines sur ces sites de liaison à faible affinité critiques
sont restées cachées. Les chercheurs ont
donc développé un nouvel algorithme informatique sophistiqué capable
d'expliquer le comportement de toutes les
séquences d'ADN dans l'expérience SELEX-seq., un algorithme appelé No Read Left Behind, ou NRLB.
Selon les chercheurs, cet algorithme permettra
de couvrir tout le spectre des sites de liaison, de la plus haute
affinité à la plus faible, avec un degré de sensibilité et de précision
beaucoup plus élevé que toute méthode existante, y compris les
algorithmes d'apprentissage en profondeur les plus avancés. Ils espèrent maintenant développer des modèles
biologiques et computationnels plus approfondis pour aider à répondre
aux questions les plus compliquées sur le génome
Aucun commentaire:
Enregistrer un commentaire