La technologie au service d’une économie de la connaissance

La technologie au service d'une économie de la connaissance

Ces derniers mois n’ont pas été tendres avec nous. Les répercussions de la crise de la Covid-19 se font sentir dans le monde entier, et les économies mondiales ont subi un coup dur. Cependant, comme la plupart des choses dans la vie, cette crise a également apporté quelques effets secondaires intéressants.

La méthode pour y faire face, pour la plupart d’entre nous, et notamment les organisations, peut se résumer en un mot à la mode : la transformation numérique. Ce mot peut recouvrer différentes réalités selon la personne à qui vous vous adressez, des appels vidéo et des applications de collaboration à distance à un investissement accru dans les software as a service (SaaS), le cloud et le machine learning.

Quoi que signifie transformation numérique, comme le dit Satya Nadella, PDG de Microsoft, la crise de la Covid a apporté en quelques mois l’équivalent de plusieurs années de transformation numérique. Ceux qui ont investi stratégiquement en récoltent les fruits, et ceux qui ne l’ont pas fait sont hors-jeu, ou se retrouvent avec un patchwork d’initiatives et d’applications disparates.

Il y a cependant un point commun, quelle que soit l’étape à laquelle vous vous trouvez : à mesure que la transformation numérique s’accélère, une part croissante de l’activité des entreprises laisse son empreinte sous forme de données. A terme, chaque interaction avec un employé, un client ou un fournisseur, chaque information et chaque processus se dérouleront numériquement, ou seront documentés numériquement.

Cela signifie qu’en théorie, il devrait être possible non seulement d’obtenir des informations, comme le promettaient le big data et l’analytique, mais aussi de passer des données à l’information et de l’information à la connaissance.

Oui, cela ressemble beaucoup au voyage vers la quatrième révolution industrielle, et à la promesse de l’intelligence artificielle. Dans un avenir proche, les organisations seront axées sur les données et l’économie sera fondée sur la connaissance. Voici une courte liste de technologies et de processus susceptibles de soutenir cette évolution, et ce dont il s’agit.

publicité

La pyramide des données : de la donnée à la connaissance

La représentation des relations entre les données, les informations, les connaissances et, finalement, la sagesse, connue sous le nom de pyramide des données, fait depuis longtemps partie du langage des sciences de l’information. Dans le nouveau monde numérique fondé sur la connaissance, l’encodage et l’utilisation des connaissances commerciales et opérationnelles sont essentiels pour progresser et rester compétitif.

dikw-pyramid-2.png

Alors, comment passer des données à l’information, et de l’information à la connaissance ? Les données sont un ensemble de faits sous une forme brute ou non organisée, comme des chiffres ou des caractères. Sans contexte, les données ne signifient pas grand-chose. Par exemple, “18122020” n’est qu’une suite de chiffres. Mais si nous définissons cette séquence comme une date au format JJMMAAAA, nous pouvons alors l’interpréter comme le 18 décembre 2020. Grâce à ce contexte supplémentaire, les chiffres acquièrent une signification.

Les informations sont des données qui ont été traitées de manière à faciliter leur mesure, leur visualisation et leur analyse, dans un but précis. Par exemple, il est possible d’organiser les données de manière à mettre en évidence les relations entre divers points, apparemment disparates et déconnectés. On peut aussi analyser les performances de l’indice Dow Jones en créant un graphe de points de données pour une période donnée, sur la base des données de clôture de chaque jour.

La connaissance est une information qui a été traitée, organisée et structurée d’une certaine manière, appliquée ou mise en œuvre. Par exemple, en capturant et en exprimant la signification des relations relatives aux points de données, il est possible d’automatiser les analyses et d’extraire de nouvelles connaissances. Un graphe de connaissances des relations sémantiques peut aider à expliquer comment certaines actions influencent l’indice Dow Jones, et comment différents événements peuvent affecter leurs prix.

L’ajout de contexte aux données les transforme en informations. Le traitement des informations les transforme en connaissances. Les clés de ces transformations sont les connexions et les métadonnées. Mais une autre progression bien connue est en jeu ici.

La classification des différentes formes d’analyse, de la plus simple à la plus avancée, est également bien connue et comprise. La théorie qui sous-tend cette classification est que les formes d’analyses les plus avancées mènent à l’intelligence artificielle. Bien sûr, il y a là une question implicite : de quoi parlons-nous lorsque nous parlons d’IA ?

Selon la sagesse conventionnelle d’aujourd’hui, la réponse est l’apprentissage automatique (machine learning), ou plus précisément l’apprentissage profond (deep learning). Cela n’a cependant pas toujours été considéré comme une vérité évidente. Elle ne le sera probablement pas toujours non plus. Et elle ne l’est certainement pas pour tout le monde.

L’analyse des graphes

Quelle est la manière optimale de parcourir un certain nombre de ponts ? L’histoire de la théorie des graphes est liée à cette question. Les ponts en question sont les ponts de Königsberg. Nous sommes en 1736. Et la personne qui a formulé un modèle pour répondre à cette question est Leonhard Euler. Ce dernier était un scientifique et ingénieur suisse, et une grande partie de son travail est à la base de la science moderne. Sa solution sur les ponts de Königsberg est la base de la théorie des graphes. Il y a une ligne qui relie Leonhard Euler à la science moderne des données.

Ce scientifique a modélisé les ponts et les chemins qui les relient comme des nœuds et des arêtes dans un graphe. Il a formalisé les relations entre les nœuds et les arêtes. Tout ceci a constitué la base de nombreux algorithmes, qui peuvent s’attaquer à des problèmes comme les ponts de Königsberg.

bookshelf-of-knowledge.jpg

L’algorithme de la théorie des graphes le plus célèbre est probablement PageRank – le fondement de l’empire de Google. PageRank modélise les documents du web comme un graphe, et utilise les liens entre eux pour en déduire la pertinence pour une requête spécifique. Mais le succès de Google avec PageRank n’est que la partie émergée de l’iceberg.

Du 18e siècle à aujourd’hui, un certain nombre d’algorithmes de la théorie des graphes ont été développés. La recherche de chemins, la centralité, la détection de communautés et la similarité sont quelques-unes des principales classes de ces algorithmes. Ces derniers ont de nombreuses applications dans l’analyse des données.

D’eBay à la NASA, en passant par les journalistes d’investigation et les scientifiques indépendants, l’analyse des graphes alimente des cas d’utilisation réels et fait la différence tous les jours dans des domaines allant des recommandations et de la détection des fraudes à l’analyse des réseaux et au traitement du langage naturel. C’est pourquoi le cabinet d’analystes Gartner prévoit que « l’analyse des graphes va se développer au cours des prochaines années en raison de la nécessité de poser des questions complexes sur des données complexes ».

Les bases de données de graphes

L’exploitation des connexions dans les données est un moyen important d’en tirer de la valeur. Le graphique est le meilleur moyen de tirer parti des connexions, et les bases de données de graphes excellent dans ce domaine. Les bases de données de graphes permettent d’exprimer et d’interroger les connexions de manière simple et puissante.

C’est pourquoi les bases de données de graphes conviennent parfaitement aux cas d’utilisation qui nécessitent l’exploitation des connexions dans les données : anti-fraude, recommandations, Customer 360 ou Master Data Management. Des applications opérationnelles aux analyses, et de l’intégration des données au machine learning, les graphes vous donnent un avantage.

Il existe une différence entre les analytiques des graphes et leurs bases de données. Les analytics peuvent être effectuées sur n’importe quel back-end, car elles ne nécessitent que la lecture de données en forme de graphe. Les bases de données sont capables de prendre entièrement en charge la lecture et l’écriture, en utilisant un modèle de données de graphes, une API et un langage de requête.

Les bases de données de graphes existent depuis longtemps, mais l’attention qu’elles suscitent depuis 2017 est hors normes. L’arrivée d’AWS et de Microsoft dans le domaine, avec respectivement Neptune et Cosmos DB, les a exposées à un public plus large.

Ce domaine jusqu’alors de niche est depuis lors le plus tendance de la gestion des données. Toutefois, au-delà des tendances, il existe des raisons réelles pour lesquelles les bases de données de graphes sont intéressantes, et des cas d’utilisation réels auxquels elles peuvent contribuer. Pour citer à nouveau Gartner : « l’application du traitement des graphes et des bases de données orientées graphes connaîtra une croissance annuelle de 100 % jusqu’en 2022, afin d’accélérer continuellement la préparation des données et permettre une science des données plus complexe et adaptative. Les magasins de données de graphes peuvent modéliser, explorer et interroger efficacement des données présentant des interrelations complexes entre des silos de données ».

Graphes de connaissances

La connexion des silos de données est une condition préalable à la gestion des connaissances, et les graphes de connaissances excellent dans ce domaine. Les graphes de connaissances sont une sous-classe spécifique de graphes, également connus sous le nom de graphes sémantiques. Ils sont dotés de métadonnées, d’un schéma, d’un identifiant global et de capacités de raisonnement, ce qui les rend idéaux pour la capture et la gestion des connaissances.

Il est compréhensible que de nombreuses personnes considèrent les graphes comme une nouvelle technologie. La vérité, cependant, est que cette technologie a au moins 20 ans. Elle a été largement initiée par nul autre que Tim Berners-Lee, également considéré comme l’inventeur du web.

Ce dernier a publié son manifeste sur le web sémantique en 2001. Bien qu’ils aient été mis de côté au fil des ans, ces principes et cette technologie sont toujours largement à l’origine de la renaissance des graphes de connaissances. Google a joué un rôle clé dans l’essor des graphes, et des graphes de connaissances. Comme le web lui-même est un cas d’utilisation privilégié pour les graphes, le PageRank est né.

gartnerhypeai2020.png

Malgré le succès de PageRank, l’exploration et la catégorisation du contenu sur le web est un problème très difficile à résoudre sans sémantique ni métadonnées. C’est pourquoi Google a adopté la technologie sémantique et inventé le terme “Knowledge Graph” (graphes de connaissance en français) en 2012.

Cet événement, ainsi que l’adoption généralisée de schema.org qui a suivie, a marqué le début de l’ascension fulgurante de la technologie des graphes et des graphes de connaissances. Ces derniers peuvent répondre à des défis clés comme la gouvernance et l’intégration des données.

En définitive, les graphes de connaissances peuvent servir de substrat numérique pour unifier la philosophie de l’acquisition et de l’organisation des connaissances, avec la pratique de la gestion des données à l’ère numérique. Et les ontologies, les schémas élaborés qui régissent les graphes de connaissances, sont désormais utilisées par les Morgan Stanley du monde entier.

Graphes, IA et traitement du langage naturel

Vous seriez tenté de penser que les graphes de connaissances sont la panacée pour capturer et gérer les connaissances ; vous auriez tort. Les graphes de connaissances excellent dans la capture des connaissances de manière explicite, de façon descendante. Les graphes de connaissances font partie de l’IA, la soi-disant bonne vieille IA, ou IA symbolique. C’est la raison pour laquelle Gartner a inclus les graphes de connaissances dans son cycle de popularité de l’IA pour 2020, au plus fort des attentes, rien de moins.

Les graphes de connaissances et les ontologies sont peut-être plus efficaces que toute autre technologie pour gérer les connaissances explicites et les a priori, mais qu’en est-il des connaissances implicites, émergentes et évolutives ? C’est là que le machine learning fonctionne bien. Mais là aussi, les graphes peuvent avoir un coup de main à donner.

Qu’est-ce que les graphes ont à voir avec le machine learning ? Beaucoup de choses, en fait. Et cela va dans les deux sens. Le machine learning peut aider à amorcer et à alimenter les graphes de connaissances. Les informations contenues dans les graphes peuvent renforcer l’efficacité des approches de machine learning.

oaagraph-ga-ml-1.jpg

Le machine learning, et son sous-domaine de deep learning, se marient parfaitement avec les graphes. Le machine learning sur les graphes est encore une technologie naissante, mais pleine de promesses. Amazon, Alibaba, Apple, Facebook et Twitter ne sont que quelques-unes des organisations qui l’utilisent en production, et qui font progresser l’état de l’art. Plus de 25 % des recherches publiées dans les principales conférences sur l’IA sont liées aux graphes.

Enfin et surtout, selon Fabio Petroni, chercheur en IA chez Facebook, les graphes ne sont peut-être pas le meilleur moyen d’obtenir des connaissances : « en tant qu’êtres humains, nous avons déjà inventé la meilleure façon de représenter la connaissance – le texte. Grâce aux progrès récents du traitement du langage naturel, nous disposons désormais de machines capables de récupérer des éléments de contexte, de raisonner par-dessus et de résoudre des tâches à forte intensité de connaissances sans utiliser de base de connaissances, simplement en utilisant du texte et en le comprenant ».

La boucle étant bouclée, cette référence renvoie au type d’approche holistique de l’IA, de la représentation des connaissances et du raisonnement que la vision de Gary Marcus expose. Nous avons suivi l’évolution de ce domaine, et nous continuerons à le faire et à en rendre compte ici.

Source : ZDNet.com

Leave a Reply

Your email address will not be published. Required fields are marked *