Automatic learning and extraction of malicious behaviors
Apprentissage et extraction automatique de comportements malicieux
par Khanh Huu The DAM sous la direction de Tayssir TOUILI
Thèse de doctorat en Informatique
ED 386 Sciences Mathematiques de Paris Centre

Soutenue le mardi 03 juillet 2018 à Sorbonne Paris Cité

Sujets
  • Apprentissage automatique
  • Protection de l'information (informatique)
  • Systèmes informatiques -- Mesures de sûreté
  • Virus informatiques

Les thèses de doctorat soutenues à Université Paris Cité sont déposées au format électronique

Consultation de la thèse sur d’autres sites :

Theses.fr (Version intégrale de la thèse (pdf))

Description en anglais
Description en français
Mots clés
Détection de malware, Information retrieval, API call graph
Resumé
Cette thèse s'attaque au problème de détection de malware. Les techniques existantes nécessitent un effort énorme d'analyse manuelle du code malicieux pour découvrir, extraire et mettre en évidence les comportement malicieux. Pour éviter cette tâche fastidieuse, nous proposons dans cette thèse deux approches: (1) appliquer des techniques de Information Retrieval pour extraire de manière complètement automatique les comportements malicieux à partir d'un ensemble de malwares et de programmes bénins, et (2) appliquer des techniques d'apprentissage pour apprendre de manière automatique les malwares. Nous avons implémenté nos techniques dans 2 outils de détection de malware. Les résultats que nous avons obtenus sont très encourageants. En particulier, nos outils ont permis de détecter des malwares que des antivirus connus, tels que Panda, Avira, Kaspersky, Avast, Qihoo360, McAfee, AVG, BitDefender, ESET-NOD32, F-Secure et Symantec, n'ont pas pu détecté.