mardi 10 avril 2018

Les chercheurs construisent une meilleure méthode de décoder le génome

Le génome est le manuel d'instruction du corps. Il contient les informations brutes, sous forme d'ADN, qui déterminent tout, même le risque potentiel de maladie. Or, comme le mentionnent les chercheurs, ce manuel est écrit dans le langage de la biologie, alors donner un sens à tout ce qu'il code s'est révélé difficile. Dans une étude menée par les chercheurs de Columbia University publiée dans Proceedings of the National Academy of Sciences, ces derniers ont développé un outil de calcul mettant en lumière les segments les plus difficiles à traduire du génome. Avec cet outil en main, les chercheurs peuvent se rapprocher de la compréhension de l'ADN, de la croissance et du développement au vieillissement et à la maladie.

Selon les chercheurs, les génomes d'organismes aussi simples que la mouche à fruits contiennent 120 millions de lettres d'ADN, dont la plupart n'ont pas encore été décodées parce que les indices fournis sont trop subtils pour que les outils existants puissent les détecter. Selon eux, le nouvel algorithme permettra de balayer ces millions de lignes de code génétique et de capter même les signaux les plus faibles, donnant une image beaucoup plus complète de ce que l'ADN code.

Les chercheurs mentionnent que les généticiens ont longtemps cherché des moyens de déchiffrer les mystères cachés dans l'ADN. Un tel mystère a impliqué une classe particulièrement envahissante de gènes connus sous le nom de gènes Hox. Plus concrètement, les gènes Hox agissent comme des architectes du corps, ils conduisent certains des aspects les plus précoces et les plus critiques de la croissance et de la différenciation, comme dans un embryon en développement, la tête et les membres doivent être positionnés. Or, les chercheurs révèlent que les gènes Hox ont un paradoxe . En effet, même si chaque gène Hox individuel guidait une caractéristique différente de la croissance, les facteurs de transcription Hox se liaient fortement et visiblement au même ensemble de séquences d'ADN facilement identifiables

En 2015, les chercheurs ont découvert que les facteurs de transcription de Hox se liaient également à de nombreux autres endroits, de façon plus discrète dans les sites dits à faible affinité. Ces derniers ont estimé que ces sites de liaison de faible affinité étaient la clé des facteurs de transcription Hox capables de conduire un aspect du développement par rapport à un autre. Or, le problème restait de savoir comment déchiffrer ces sites à partir du génome.

Les chercheurs ont développé une méthode de séquençage génétique appelée SELEX-seq pour caractériser systématiquement tous les sites de liaison de Hox. Cependant, il fallait que le même fragment d'ADN soit séquencé encore et encore. A chaque nouveau tour, alors que plus d'informations ont été révélées, certaines sur ces sites de liaison à faible affinité critiques sont restées cachées. Les chercheurs ont donc développé un nouvel algorithme informatique sophistiqué capable d'expliquer le comportement de toutes les séquences d'ADN dans l'expérience SELEX-seq., un algorithme appelé No Read Left Behind, ou NRLB. 

Selon les chercheurs, cet algorithme permettra de couvrir tout le spectre des sites de liaison, de la plus haute affinité à la plus faible, avec un degré de sensibilité et de précision beaucoup plus élevé que toute méthode existante, y compris les algorithmes d'apprentissage en profondeur les plus avancés. Ils espèrent maintenant développer des modèles biologiques et computationnels plus approfondis pour aider à répondre aux questions les plus compliquées sur le génome 

Aucun commentaire:

Enregistrer un commentaire