Analysis framework of distributed thread and malware data-sources

Gremlich, Giuliano (2017) Analysis framework of distributed thread and malware data-sources. Bachelor thesis, Scuola Universitaria professionale della Svizzera italiana (SUPSI).

[img] Slideshow
POSTER_Gremlich.pptx

Download (263kB)

Abstract

Riassunto. L’obbiettivo principale di questo progetto é sfruttare l’enorme potenzialitá degli Honeypot, creando una struttura per processare ed analizzare i dati da essi creati. Questo per avere un’immagine chiara dei vari attacchi avvenuti. Questa struttura dovrá comprendere una raccolta e uno stoccaggio dei dati in modo performante e la possibilitá di analizzare i dati in maniera molto semplificata. Le tecnologie che ho utilizzato sono tutte open source e utilizzate a livello professionale. Possono essere divise in due tipologie, ovvero quelle che mi hanno permesso di raccogliere e immagazzinare i dati dai vari devices, e quelle che vanno a ricoprire l’esigenza di analizzarli. Per quanto riguarda la prima parte ho utilizzato due librerie di Apache, completamente compatibili tra di loro, Kafka e Hadoop. Mi hanno permesso di creare un sistema clusterizzato per integrare i dati, con tutte i vantaggi del caso, alte performance,scalabilitá orizzontale,fault tollerance. Mentre per l’analisi dei dati ho utilizzato Elasticsearch, un progetto molto attuale e in continua evoluzione che permette di eseguire analisi su grandi mole di dati con alte performance. Grazie a questo progetto sono riuscito a creare un sistema che sfrutta i dati degli Honeypot, dati fondamentali per la sicurezza informatica, dando la possibilitá ad un team di IT-security, composto da tecnici o anche da semplici analisti, di accedervi in maniera efficiente e semplificata. Abstract. The main purpose of this project is to exploit the enormous potential of the Ho-neypot, creating a structure to process and analyze the data created by them. I am going to give a clear picture of the various attacks that have occurred. This structure must include efficient data collection and storage and the possibility to analyze the data in a very simplified way. The technologies I have used are all open source and professional. They can be divided into two types, namely those that have allowed me to collect and store data from the various devices, and those that cover the need to analyze them. As far as the first part is concerned, I used two fully compatible Apache libraries, Kafka and Hadoop. They have permes- know how to create a cluster system to integrate data, with all the advantages of the case, high performance, horizontal scalability and fault tolerance. To analyze the data I used the Elastic which is a very current and constantly evolving project that allows to perform analysis on large amounts of data with high performance. Thanks to this project, I was able to create a system that exploits Honeypot data, fundamental data for cyber security, giving the possibility to an IT-security team, composed of technicians or even simple analysts, to access it in an efficient and simplified way.

Item Type: Thesis (Bachelor)
Supervisors: Consoli, Angelo and Bovino, Cristian
Subjects: Informatica
Divisions: Dipartimento tecnologie innovative > Ingegneria informatica
URI: http://tesi.supsi.ch/id/eprint/1745

Actions (login required)

View Item View Item