Soutenance de thèse de Pauline FOLZ
12 octobre 2017 @ 14 h 00 min - 17 h 00 min
Pauline Folz (équipe GDD) soutiendra sa thèse intitulée : « Collaboration dans une fédération de consommateurs de données liées »
jeudi 12 octobre à 14h, sans l’amphithéâtre du bâtiment 34 (FST).
Membres du jury : Pascal Molli (directeur de thèse), Hala Skaf-Molli (co-encadrante), Catherine Faron Zucker (rapporteur, U. Sophia Antipolis), Esther Pacitti (rapporteur, LIRMM Montpellier), Marc Gelgon, Hubert Naacke (U. Paris 6), Hervé Jaigu (Nantes-Métropole, invité).
Résumé :
Les producteurs de données ont publié des millions de faits RDF sur le Web en suivant les principes des données liées. N’importe qui peut récupérer des informations utiles en interrogeant les données liées avec des requêtes SPARQL. Ces requêtes sont utiles dans plusieurs domaines, comme la santé ou le journalisme des données. Cependant, il y a un compromis entre la performance des requêtes et la disponibilité des données lors de l’exécution des requêtes SPARQL.
Dans cette thèse, nous étudions comment la collaboration des consommateurs de données ouvre de nouvelles opportunités concernant ce compromis. Plus précisément, comment la collaboration des consommateurs de données peut : améliorer les performances sans dégrader la disponibilité, ou améliorer la disponibilité sans dégrader les performances.
Nous considérons que les données liées permettent à n’importe qui d’exécuter un médiateur compact qui peut interroger des sources de données sur le Web grâce à des requêtes SPARQL. L’idée principale est de connecter ces médiateurs ensemble pour construire une fédération de consommateurs de données liées. Dans cette fédération, chaque médiateur interagit avec un sous-ensemble du réseau. Grâce à cette fédération, nous avons construit : (i) un cache décentralisé hébergé par les médiateurs. Ce cache côté client permet de prendre en charge une part importante des sous-requêtes et d’améliorer la disponibilité des données avec un impact faible sur les performances. (ii) un algorithme de délégation qui permet aux médiateurs de déléguer leurs requêtes à d’autres médiateurs. Nous démontrons que la délégation permet d’exécuter un ensemble de requêtes plus rapidement quand les médiateurs collaborent. Cela améliore les performances sans dégrader la disponibilité des données.
Mots clés : Web Sémantique, Cache collaboratif, Equilibrage de charge, Fédération, P2P.