Posted on
Spread the love
Tendances 2020 : le futur, c'est le Knowledge Graph

La “persistance polyglotte” – l’expression désignant le fait de faire coexister plusieurs systèmes de bases de données interchangeables selon la tâche à exécuter – devient la nouvelle norme. Après les bases de données relationnelles, l’évolution des structures de données mène au Graph. Depuis quelques années, les bases de données Graph et les Knowledge Graphs sont intégrés dans les “hype cycles”.

De nombreuses personnes ont tendance à considérer les Graph comme une toute nouvelle technologie, même si elle existe en réalité depuis au moins vingt ans. Cette technologie a été initiée pour l’essentiel par Tim Berners Lee, qui n’est autre que l’inventeur du web, avec la publication en 2001 de son manifeste sur le web sémantique dans le Scientific American. Tim Bernes Lee a également inventé le terme “Giant Global Graph” pour décrire la prochaine étape de l’évolution du web.

Quand on s’intéresse à cette technologie depuis le début des années 2000, c’est exaltant de la voir évoluer au gré des progrès techniques, des financements successifs et des cas d’usage qui s’accumulent pour faire un effet boule de neige. C’est aussi amusant de voir émerger le “graph-washing”. Bref, l’évolution du graph suit la même trajectoire que le machine learning.

publicité

Tirer parti des connexions entre les données est un bon moyen d’en extraire de la valeur, et le Graph est un outil très performant pour ça

Ce n’est pas tant le fait qu’il y ait eu une percée majeure dans la technologie qui l’a rendu possible, mais plutôt une conjoncture de conditions favorables. Un certain nombre de concepts, de formats, de normes et de technologies nécessaires au bon fonctionnement des bases de données Graph et des Knowledge Graphs ont en effet été élaborés sur plus de vingt ans. Le résultat n’est autre qu’une combinaison de plusieurs facteurs.

Comme pour l’intelligence artificielle, l’explosion des données a contribué à l’essor des bases de données Graph. Maintenant que “Big” n’est plus un qualificatif pour parler des données – et parce que nous avons à présent maîtrisé l’art d’en stocker beaucoup -, la question est plutôt de savoir comment exploiter de la valeur. Tirer parti des connexions qui existent entre les données est un bon moyen d’en extraire de la valeur, et le Graph reste un outil très performant pour ça.

C’est pourquoi les bases de données Graphs sont efficaces lorsqu’il s’agit de trouver des connexions au coeur des données, comme c’est le cas en matière de lutte anti-fraude par exemple. Le système d’analyse des Graphs, qui emploie des algorithmes, tel que le PageRank, peut offrir des informations précieuses sur les ensembles de données connectés. La terminologie n’est pas encore fixée, alors une courte leçon d’histoire et des bases en sémantique s’imposent.

Les Knowledge Graphs, dits aussi “Graphs sémantiques”

Les analyses de Graph comme PageRank peuvent être appliquées aux données stockées dans n’importe quel arrière-plan. Les bases de données Graphs sont conçues pour s’adapter aux structures de données graphiques, qui adressent des langages de requête spécialisés, des API ou des structures de stockage. Les Knowledge Graphs, quant à eux, forment une sous-catégorie spécifique de Graphs, également appelés “Graphs sémantiques”, et qui impliquent des métadonnées, des schémas et des capacités d’identification étendues.

Google a joué un rôle important dans le développement des Graphs et des Knowledge Graphs. Comme le web constitue à lui seul un cas d’usage des Graphs, PageRank est né. Puisque l’indexation et la catégorisation de contenu sur le web sont des problèmes difficiles à résoudre sans le recours à la sémantique et aux métadonnées, Google adressa ces problématiques, puis inventa le terme Knowledge Graph en 2012. Cette invention, et l’adoption massive de schema.org qui en découla, marqua le début de l’ascension fulgurante de la technologie des Graphs et des Knowledge Graphs.

Les Knowledge Graphs affrontent des défis majeurs, tels que la gouvernance des données, mais peuvent aussi tout à fait service de substrat numérique pour unifier la philosophie de l’acquisition et de l’organisation des connaissances à la pratique de la gestion des données à l’ère numérique.

Les Graphs et les Knowledge Graphs se retrouvent aussi dans l’IA

Les Graphs et les Knowledge Graphs se retrouvent aussi dans l’IA. Une grande partie du matériel et des logiciels déployés dans l’IA dans les années à venir utiliseront des structures de données Graphs. Une combinaison de techniques de reconnaissance et d’approches basées sur la connaissance forme le moyen le plus prometteur de d’assurer les progrès de l’IA.

Comme le dit Nathan Benaich, auteur du rapport sur l’état de l’IA, “la connaissance dans un domaine spécifique peut faciliter efficacement l’apprentissage d’un système de deep learning, au lieu de forcer le modèle à engranger des savoirs généraux”. Les Knowledge Graphs sont la meilleure technologie en notre possession pour encoder des connaissances sur des domaines spécifiques, et la base de connaissance la plus complète du monde, le web, fonctionne déjà de cette manière.

En somme, le Knowledge Graph offre la possibilité à d’autres technologies d’accélérer leur croissance et permet à l’Homme de prendre la mesure de ses propres connaissances.

Cet article fait partie de notre dossier sur les 5 technologies de la future décennie. Pour aller plus loin, lire aussi :

Advertisements

Leave a Reply