Bob Muglia, ex-Microsoft : les graphes de connaissances relationnels vont transformer les entreprises

 Bob Muglia, ex-Microsoft : les graphes de connaissances relationnels vont transformer les entreprises

Bob Muglia affirme que vingt ans de travail sur l’innovation en matière de bases de données vont amener le calcul relationnel d’E.F. Codd aux graphes de connaissances, ce qu’il appelle les “graphes relationnels de connaissances”, pour révolutionner l’analyse commerciale. Relational AI

Bob Muglia est en quelque sorte le barde des bases de données, capable de dérouler des récits radicaux sur l’évolution de la technologie.

C’est ce que Muglia, ancien cadre de Microsoft et ancien PDG de Snowflake, a fait la semaine dernière lors de son discours d’ouverture à la Knowledge Graph Conference à New York. Le sujet de son intervention, “From the Modern Data Stack to Knowledge Graphs”, a réuni environ cinquante ans de technologie des bases de données sous une nouvelle forme.

Voici l’histoire telle que racontée par Muglia : Cinq entreprises ont créé des plates-formes modernes d’analyse de données, Snowflake, Amazon, Databricks, Google et Azure, mais ces plates-formes ne peuvent pas faire de l’analyse commerciale, y compris, et surtout, représenter les règles qui sous-tendent la conformité et la gouvernance.

publicité

Les algorithmes basés sur SQL  ne peuvent pas effectuer des requêtes “récursives” aussi complexes

“L’industrie sait que c’est un problème”, a déclaré Muglia. Les cinq plates-formes, dit-il, qui représentent “la pile de données moderne, ont permis de construire une “nouvelle génération de ces applications de données très, très importantes.” Cependant, “lorsque nous examinons la pile de données moderne, et que nous regardons ce que nous pouvons faire efficacement et ce que nous ne pouvons pas faire efficacement, je dirais que le problème numéro un que les clients rencontrent avec ces cinq plateformes est la gouvernance.”

Muglia, qui a dirigé l’activité SQL Server chez Microsoft, entre autres exploits au cours d’une carrière de 30 ans dans la construction de bases de données, a donné des exemples de règles commerciales que les plates-formes de données ne peuvent pas modéliser.

“Si vous vouliez effectuer une requête pour dire : ‘Hey, dites-moi toutes les ressources auxquelles Fred Jones a accès dans cette organisation’ – c’est une requête difficile à écrire”, a-t-il dit. “En fait, c’est une requête qui ne peut probablement pas être exécutée efficacement sur une base de données SQL moderne si l’organisation est très grande et complexe.”

Le problème, selon Muglia, est que les algorithmes basés sur le langage de requête structuré, ou SQL (structured query language), ne peuvent pas effectuer des requêtes “récursives” aussi complexes.

bob-muglia-may-4th-2022-kgc-keynote.png

En tant que barde de la technologie des bases de données, Muglia transmet souvent les détails techniques avec des fioritures rhétoriques : jointure binaire, jointure binaire, jointure binaire !

“Qu’est-ce qu’un graphe de connaissances ?”

“Il y a eu de nombreuses générations d’algorithmes qui ont tous été créés autour de l’idée d’un binaire”, a déclaré Muglia. “Ils ont deux tables avec la clé pour joindre les deux, et ensuite vous obtenez un ensemble de résultats, et l’optimiseur de requête prend et optimise l’ordre de ces jointures – jointure binaire, jointure binaire, jointure binaire !”.

Les problèmes récursifs tels que les permissions de Fred Jones, a-t-il dit, “ne peuvent pas être résolus efficacement avec ces algorithmes, point final.” La bonne structure pour le business, par opposition aux relations de données, a déclaré Muglia, est un graphe de connaissances (knowledge graph).

“Qu’est-ce qu’un graphe de connaissances ?” a demandé Muglia, pour la forme. Il a proposé sa propre définition de ce qui peut être un concept parfois mystérieux. “Un graphe de connaissances est une base de données qui modélise les concepts commerciaux, les relations entre elles, ainsi que les règles et contraintes commerciales associées.”

Muglia, qui est aujourd’hui membre du conseil d’administration de la startup Relational AI, a déclaré à l’auditoire que l’avenir des applications d’entreprise sera fait de graphes de connaissances construits sur des analyses de données, mais avec la particularité qu’ils utiliseront le calcul relationnel qui remonte au pionnier des bases de données relationnelles, E.F. Codd.

“Revenez au début”, a insisté Muglia. “Quelle est la capacité algorithmique fondamentale de la technologie relationnelle, que peut-on faire avec elle ?”.

muglia-from-modern-data-stack-to-knowledge-graphs-5-1-22-slide-9.jpg

Il existe cinq plates-formes d’analyse basées sur SQL, note Muglia, mais aucune d’entre elles n’est capable de faire de l’analyse commerciale, par opposition à l’analyse de données. Relational AI

“Si nous regardons ce que Codd créait dans les années 1970, le théorème disait que l’algèbre relationnelle et les requêtes relationnelles sont précisément équivalentes en termes de puissance expressive – tellement intéressant ! J’ai toujours su que c’était intéressant, et maintenant je sais pourquoi.”

En utilisant la technologie de Relational AI, en particulier la technologie développée par le fondateur et PDG Molham Aref pour l’optimisation des requêtes, combinée avec les graphes de connaissances, il est possible d’apporter la même algèbre relationnelle à l’organisation des concepts business.

“Si nous passons aux graphes de connaissances relationnels, nous allons maintenant aux principes fondamentaux du calcul relationnel, et nous émettons des déclarations de calcul relationnel qui ne sont pas ordonnées et qui contiennent des règles et des contraintes commerciales.”

muglia-from-modern-data-stack-to-knowledge-graphs-5-1-22-slide-15.jpg

SQL n’est pas en voie de disparition, mais il ne peut pas vraiment gérer les requêtes de l’analyse commerciale, a déclaré Muglia. Relational AI

Les travaux visant à “redéfinir fondamentalement la façon dont nous pouvons utiliser l’algèbre relationnelle”, a déclaré Muglia, durent depuis environ 20 ans, mais ont pris de l’ampleur en 2010 avec les travaux d’Aref, et au sein de nombreuses universités et entreprises, avec des centaines d’articles publiés sur le sujet, a-t-il dit.

“Il s’agit d’un effort de coopération incroyable entre les communautés de chercheurs du monde entier”, a-t-il déclaré. “Materialize l’utilise de manière fondamentale. LinkedIn a adopté une partie de cela à travers une base de données de graphes appelée Liquid.”

Le graphe de connaissances relationnel introduit un nouveau langage, appelé Rel, bien que “SQL reste important”, a déclaré Muglia, “SQL ne disparaît pas”, car il sert en quelque sorte de rampe de lancement vers le nouveau monde du graphe de connaissances relationnel.

“Je peux même affirmer que les meilleurs jours de SQL sont devant lui”.

Muglia prévoit “un potentiel incroyable, incroyable du point de vue du développement de logiciels, et toutes sortes de choses en découlent”, a-t-il déclaré à propos du graphe de connaissances relationnel. “Au fur et à mesure que la technologie arrive à maturité – et je veux me concentrer sur le fait qu’elle n’est pas encore mature – mais au fur et à mesure que la technologie arrive à maturité, nous allons voir des choses que nous pouvons faire avec elle dont nous ne pourrions même pas rêver.”

Cela inclut une utilisation beaucoup plus importante de l’apprentissage automatique au sein de l’analyse d’entreprise, comme l’indique le nom Relational AI. En outre, le modèle d’entreprise, a déclaré Muglia, ne sera plus “juste quelque chose que nous mettons sur un tableau blanc qu’un ingénieur doit regarder pour écrire un code Java.”

“Le modèle”, a déclaré Muglia, “devient le programme, et donc les analystes commerciaux peuvent s’impliquer, et apporter des modifications aux structures de données.”

Pour l’instant, la technologie de Relational AI est “plutôt en gant blanc”, a-t-il dit. “Nous avons un certain nombre d’organisations avec lesquelles nous faisons des essais limités”, et la société espère “l’ouvrir en libre-service” l’année prochaine avec “une bêta pour les développeurs afin que les gens puissent s’inscrire et commencer à utiliser le système.” C’est la même trajectoire, a-t-il dit, que lorsqu’il dirigeait Snowflake en 2014 et qu’elle a publié les premières versions de son code.

“Nous sommes au début d’une toute nouvelle ère”, a déclaré Muglia. “C’est comme la pile de données moderne en 2013, 2014 – c’est là où nous sommes dans ce cycle de vie.

“Et tout comme la pile de données moderne a révolutionné l’analytique, je suis totalement convaincu que les graphes de connaissances, et, en particulier, les graphes de connaissances relationnels, vont transformer la façon dont les entreprises fonctionnent.”

Source : “ZDNet.com”

Leave a Reply

Discover more from Ultimatepocket

Subscribe now to keep reading and get access to the full archive.

Continue reading