Machine learning : le laboratoire AstraZeneca utilise PyTorch pour découvrir de nouveaux médicaments

Spread the love
Machine learning : le laboratoire AstraZeneca utilise PyTorch pour découvrir de nouveaux médicaments

Depuis son lancement en 2018, la bibliothèque open source de machine learning PyTorch développée par Facebook a été mise à profit, que ce soit pour l’alimentation des voitures autonomes d’Elon Musk ou encore pour la conduite de projets d’agriculture robotisée. C’est désormais au tour du célèbre laboratoire pharmaceutique AstraZeneca de révéler comment ses équipes se reposent sur PyTorch pour simplifier et accélérer la découverte de médicaments.

En combinant PyTorch avec Microsoft Azure Machine Learning, la technologie d’AstraZeneca peut passer au peigne fin d’énormes quantités de données. Le but ? Obtenir de nouvelles informations sur les liens complexes entre les médicaments, les maladies, les gènes, les protéines ou les molécules. Des connaissances qui seront par la suite utilisées pour alimenter un algorithme qui pourra à son tour recommander un certain nombre de cibles médicamenteuses pour une maladie donnée, que les scientifiques pourront tester en laboratoire.

Cette méthode pourrait permettre des avancées considérables dans un secteur comme celui de la découverte de médicaments, qui jusqu’à présent reposait sur des méthodes coûteuses et longues. En général, pour mettre au point un nouveau médicament destiné à combattre une maladie spécifique, les scientifiques doivent tester en laboratoire différentes conceptions et combinaisons de protéines jusqu’à ce qu’ils trouvent une solution efficace. C’est pourquoi il faut parfois dix à quinze ans pour passer à l’étape de la commercialisation d’un médicament.

publicité

Cartographier une infinité d’informations

Ce n’est pas tout : l’algorithme d’AstraZeneca peut immédiatement identifier les dix principales cibles de médicaments que les scientifiques devraient examiner pour une maladie donnée. L’automatisation de la découverte de médicaments est particulièrement utile car la quantité de données auxquelles les scientifiques peuvent accéder pour mener leurs recherches augmente de manière exponentielle chaque année. Analyser des bases de données qui se développent de jour en jour pour comprendre comment elles peuvent documenter la découverte de médicaments est en effet devenu une tâche extrêmement complexe, pour ne pas dire impossible.

C’est là qu’intervient PyTorch. « Chaque année, la quantité d’informations et de données scientifiques dont disposent les chercheurs augmente. En exploitant l’IA et les outils d’apprentissage machine comme PyTorch et Azure, nous pouvons rapidement extraire, combiner et interpréter des informations provenant de sources multiples, dans le but de tirer des conclusions scientifiques meilleures et plus rapides que si nous analysions ces données manuellement », explique en effet Gavin Edwards, ingénieur en machine learning chez AstraZeneca interrogé par la rédaction de ZDNet.

Car une grande partie des données disponibles sont des textes non structurés, ce qui justifie le recours à PyTorch, qui s’avère particulièrement utile pour les développeurs travaillant sur des tâches scientifiques intenses de données dans des domaines comme la vision par ordinateur et le traitement du langage naturel (NPL). Les équipes d’AstraZeneca utilisent PyTorch pour définir et former des algorithmes d’exploration de textes biomédicaux qui peuvent se frayer un chemin à travers les données, trouver des modèles et des tendances, et finalement structurer les informations disponibles.

Les données sont ensuite introduites dans un graphe de connaissances, qui est capable de relier intelligemment entre elles des poches d’informations, de sorte que chaque point de données puisse être contextualisé. Agissant comme un réseau d’informations, le graphique peut refléter les propriétés de chaque donnée – gènes, protéines, maladies, composés – mais aussi les relations entre les différentes catégories. En d’autres termes, le graphique des connaissances organise de manière exhaustive toutes les données scientifiques disponibles. Grâce aux capacités de calcul de Microsoft Azure Machine Learning, les ingénieurs d’AstraZeneca utilisent ensuite le graphe de connaissance pour former un algorithme qui recommande aux scientifiques de nouvelles cibles de médicaments.

Un potentiel énorme

« Nous avons combiné la recherche dans le domaine public et notre recherche interne en un graphe qui encode facilement des informations complexes », explique Gavin Edwards. « En superposant l’apprentissage machine à cela, nous pouvons former des modèles d’apprentissage machine qui recommandent de nouvelles cibles de médicaments et aident à prendre des décisions éclairées. »

Un algorithme de recommandation pour la découverte de médicaments semble certainement être la promesse d’un énorme gain de temps pour les scientifiques qui ont testé sans relâche de nouvelles conceptions de médicaments en laboratoire. Mais les équipes d’AstraZeneca espèrent également que les graphiques de connaissances qu’ils créent pourront aider les chercheurs à trouver de nouvelles connexions, à explorer de nouvelles voies et à tester des théories non éprouvées sans risquer de perdre trop de temps.

« Notre graphique des connaissances permet aux chercheurs de poser des questions clés sur les gènes, les maladies, les médicaments et les informations sur la sécurité afin d’aider à identifier et à hiérarchiser les cibles des médicaments », affirme encore le développeur. Et ce n’est pas fini : « comme nos données et nos connaissances continuent d’évoluer, notre graphique évoluera également, ce qui signifie que chaque nouvelle expérience bénéficiera de tout ce qui a été appris auparavant ».

Source : ZDNet.com

Leave a Reply