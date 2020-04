Une équipe multidisciplinaire a mis au point un algorithme de machine learning permettant d’identifier et de classer les virus en fonction des motifs génétiques qui définissent leurs caractéristiques. Un outil qui doit permettre de faciliter et d’accélérer la mise au point de traitements et de vaccin pour les nouveaux pathogènes tels que le SARS-CoV-2.

Pour organiser le vivant, les biologistes se sont longtemps basés sur des critères multiples et observables qui permettent d’affecter un organisme à un règne, un embranchement, une classe, un ordre, etc. Cette méthode traditionnelle est de plus plus délaissée au profit de la classification phylogénétique qui se fonde sur un modèle évolutif et la notion d’ascendance génétique.

Virus de l’hépatite C – Crédit : CDC

Alors que la plupart des espèces végétales et animales disposent d’un génome relativement stable, les virus, notamment les virus à ARN tels que le SARS-CoV-2, sont sujets à des mutations beaucoup plus fréquentes. Une caractéristique qui complique leur classement et leur étude. Une équipe de chercheurs et de spécialistes en bioinformatique viennent de mettre au point un algorithme de classement qui pourrait révolutionner leur étude, ainsi que le développement de remèdes et de vaccins.

Une équipe multidisciplinaire et internationale menée par le biologiste Kahtleen Hill a développé un logiciel capable d’isoler et de reconnaître des motifs génétiques pour organiser les virus en un temps record. Grâce au machine learning (l’apprentissage automatique) et à l’usage d’arbres de décision, l’algorithme identifie les signatures génomiques intrinsèques des virus qu’on lui soumet pour les classer, et en donner une représentation graphique. En seulement quelques minutes, l’application a pu analyser 5000 virus, dont 29 coronavirus, sans commettre aucune erreur.

Tout ce dont nous avions besoin était la séquence d’ADN COVID-19 pour découvrir son propre schéma de séquence intrinsèque. Nous avons utilisé ce modèle de signature et une approche logique pour le faire correspondre le plus étroitement possible à celui d’autres virus et nous avons atteint un niveau de classification précis en quelques minutes, pas en jours, pas en heures, mais en minutes. Kahtleen Hill

MoDMap3D des séquences ADN de virus classés en familles. Crédit: PLOS ONE (2020). DOI: 10.1371/journal.pone.0232391

Le classement génomique pour trouver un traitement ou un vaccin aux coronavirus

Le système de classification « ultrarapide, évolutif et précis » constitue un outil de première importance selon le professeur Kahtleen Hill, notamment pour déterminer les caractéristiques d’un nouveau pathogène afin de concevoir des vaccins et des médicaments. Dans le cas du SARS-CoV-2 humain, la méthode aurait pu déterminer qu’il a pour origine le sarbecovirus des chauves-souris, un sous-groupe du bêtacoronavirus en seulement quelques minutes.

Source : Phys.og