À propos

ConnectionStudio intègre des données très hétérogènes sous la forme de graphes, enrichis d’entités extraites. Les utilisateurs du Studio peuvent découvrir les entités dans leurs données, les explorer et les interroger de différentes façons ainsi que parcourir les connexions entre les ensembles de données. Le Studio prend actuellement en charge : CSV, JSON, XML, RDF, PDF, texte (.txt), les graphes de propriétés (Neo4j) et tous les formats Office (Word, Excel, …).

ConnectionStudio est une nouvelle interface pour ConnectionLens, Abstra et PathWays (sites Web respectifs en liens). Les nouvelles fonctionnalités de ConnectionStudio ont été démontrées dans un article à CoopIS 2023.

Créer un projet

Chaque projet correspond à un ensemble de jeux de donnés, qui peuvent être hétérogènes au niveau du modèle et/ou du schéma.

Charger des données

Après avoir créer un projet, les utilisateurs peuvent ajouter leurs données. Ceci va charger leurs données en un unique graphe intégré, qui préserve les apsects initiaux des donnés. Ensuite, de l’information d’extraction va permettre d’extraire les entités nommées des valeurs textuelles.

Statistiques

Pour avoir une première vue de leurs données, les utilisateurs ont une vue d’ensemble statistique, montrée via différents diagrammes.

Abstraction

Ensuite, utilisant Abstra, les utilisateurs peuvent inspecter le contenu et la structure de leurs jeux de données via des diagrammes Entité-Relation, calculés à partir de n’importe source semi-structurée.

Exploration des chemins

Les utilisateurs peuevent aussi explorer les connexions entre les entités nommés trouvées dans les données. Cette exploration orientée entité est implémentée par PathWays.

Vue de données

Quand les utilisateurs se sentent confiants, ils peuvent entre dans la page « vue des données » et requêter le graphe. Ici, l’utilisateur crée la liste de tous les députés, avec leur type de mandat t la date de début de leur mandat.

Les utilisateurs peuvent aussi chercher des informations inter-sources en requêtant plusieurs jeux de données à la fois, e.g., ici nous cherchons tous les députés français qui ont déclaré avoir des intérêts financiers dans des entreprises du CAC40, i.e. les 40 entreprises françaises les plus influentes.

Visualisation de graphe

Enfin, après avoir inspecté leurs données, les utilisateurs peuvent creuser le graphe de données lui-même en utilisant des requêtes par mot-clés.

Essayer ConnectionStudio

Le code de ConnectionStudio et les instructions pour l’installer sont ici: https://gitlab.inria.fr/cedar/connection-studio

Plus d’informations

L’équipe qui a développé ConnectionStudio comprend : Nelly Barret, Simon Ebel, Théo Galizzi, Ioana Manolescu et Madhulika Mohanty (prenom.nom@inria.fr). Nous remercions aussi Camille Pettineo (maintenant à l’INA) pour ses suggestions !

Contactez Ioana Manolescu (ioana[.]manolescu[@]inria[.]fr) pour discuter de futures opportunités !

Les commentaires sont clos.