Gestion de la collaboration et compétition dans le crowdsourcing : une approche avec prise en compte de fuites de données via les réseaux sociaux
Managing collaboration and competition in crowdsourcing : approach that takes into account data leakage via social networks
par Ben Amor Iheb sous la direction de Benbernou Salima
Thèse de doctorat en Informatique
École doctorale Informatique, Télécommunications et Electronique

Soutenue le Thursday 27 November 2014 à Université Paris Descartes ( Paris 5 )

Sujets
  • Algorithmes
  • Crowdsourcing
  • Optimisation combinatoire
  • Protection de l'information (informatique)
  • Réseaux sociaux

Depuis le 1er janvier 2012, les thèses de doctorat soutenues ou préparées à l’Université Paris Descartes sont déposées au format électronique, sous licence Creative Commons.

Consultation de la thèse sur d’autres sites :

Theses.fr (Version intégrale de la thèse (pdf))
TEL (Version intégrale de la thèse (pdf))

Description en anglais
Description en français
Mots clés
Crowdsourcing, Réseaux sociaux, Fuite de données, Classification, Optimisation combinatoire
Resumé
Le crowdsourcing est une pratique permettant aux entreprises de faire appel à l'intelligence humaine à grande échelle afin d'apporter des solutions à des problématiques qu'elles souhaitent externaliser. Les problématiques externalisées sont de plus en plus complexes et ne peuvent être résolues individuellement. Nous proposons dans cette thèse une approche appelée SocialCrowd, contribuant à améliorer la qualité des résultats de crowdsourcing. Elle consiste à faire collaborer les participants afin d'unir leur capacité de résolution et apporter des solutions aux problèmes externalisés de plus en plus complexes. Les groupes collaboratifs sont mis en compétition, via des rétributions attrayantes, afin d'obtenir de meilleures résolutions. Par ailleurs, il est nécessaire de protéger les données privées des groupes en compétition. Nous utilisons les réseaux sociaux comme support de fuite de données. Nous proposons une approche basée sur l'algorithme Dijkstra pour estimer la probabilité de propagation de données privées d'un membre sur le réseau social. Ce calcul est complexe étant donné la taille des réseaux sociaux. Une parallélisation du calcul est proposée suivant le modèle MapReduce. Un algorithme de classification basé sur le calcul de propagation dans les réseaux sociaux est proposé permettant de regrouper les participants en groupes collaboratifs et compétitifs tout en minimisant les fuites de données d'un groupe vers l'autre. Comme ce problème de classification est d'une complexité combinatoire, nous avons proposé un algorithme de classification basé sur les algorithmes d'optimisation combinatoires tels que le recuit simulé et les algorithmes génétiques. Etant donnée le nombre important de solutions possible, une approche basée sur le modèle du Soft Constraint Satisfaction Problem (SCSP) est proposée pour classer les différentes solutions.