jeudi 26 novembre 2020

Les secrets des séquences virales chez la COVID-19

Selon une étude menée par Politecnico di Milano publiée dans Nucleic Acids Research, depuis le début de 2020, des laboratoires du monde entier séquencent le matériel à partir de tests positifs de personnes touchées par COVID-19, puis déposent des séquences principalement dans trois points de collecte, soit GenBank, COG-UK et GISAID. Selon les chercheurs, une exploration rapide de cette énorme quantité de données est importante pour comprendre comment le génome du virus évolue. Afin de permettre une «navigation» rapide sur ces données, des chercheurs ont développé ViruSurf, un moteur de recherche fonctionnant au-dessus d'une base de données centralisée stockée à Politecnico. La base de données est périodiquement rechargée à partir des trois sources et contient à ce jour 200 516 séquences de SRAS-CoV-2, le virus responsable de la COVID-19, et 33 256 séquences d'autres espèces virales également associées à des épidémies affectant les humains, telles que le SRAS, le MERS, Ebola et Dengue.

Chaque séquence est décrite sous quatre angles: les caractéristiques biologiques du virus et de l'hôte, la technologie de séquençage, le projet qui a produit les données originales, les mutations de toute la séquence de nucléotides et d'acides aminés spécifiques du gène. L'avantage apporté par ViruSurf est l'utilisation d'un algorithme pour calculer les mutations virales de manière homogène entre les sources, en utilisant le cloud computing. La base de données est optimisée pour donner des réponses rapides aux internautes des moteurs de recherche.



Aucun commentaire:

Enregistrer un commentaire