Resumé |
Cette thèse s'attaque au problème de détection de malware. Les techniques existantes nécessitent un effort énorme d'analyse manuelle du code malicieux pour découvrir, extraire et mettre en évidence les comportement malicieux. Pour éviter cette tâche fastidieuse, nous proposons dans cette thèse deux approches: (1) appliquer des techniques de Information Retrieval pour extraire de manière complètement automatique les comportements malicieux à partir d'un ensemble de malwares et de programmes bénins, et (2) appliquer des techniques d'apprentissage pour apprendre de manière automatique les malwares. Nous avons implémenté nos techniques dans 2 outils de détection de malware. Les résultats que nous avons obtenus sont très encourageants. En particulier, nos outils ont permis de détecter des malwares que des antivirus connus, tels que Panda, Avira, Kaspersky, Avast, Qihoo360, McAfee, AVG, BitDefender, ESET-NOD32, F-Secure et Symantec, n'ont pas pu détecté. |