Real-time 3D reconstruction using multiple depth cameras

Diaz Lopez, Marco (2016) Real-time 3D reconstruction using multiple depth cameras. Bachelor thesis, Scuola Universitaria professionale della Svizzera italiana (SUPSI).

[img] Slideshow
POSTER_MARCO_DIAZ.pptx

Download (470kB)

Abstract

Dispositivi che permettono di rilevare la cinematica dei corpi vengono largamente utilizzati negli ultimi anni per i più svariati compiti, sia nel mondo dei giochi, sia in ambienti professionali (ad esempio per il settore medico o sportivo) fino ad altri più lucrativi come la domotica. In questo progetto si utilizza il Kinect di Microsoft il quale offre una propria SDK tramite la quale è possibile capire la posizione dell’utente e tenere traccia dei suoi movimenti. Il Kinect, per ricavare queste informazioni, richiede una visione diretta dell’utente (senza la presenza di ostacoli). Con il presente lavori si vuole ovviare alla problematica appena citata, in questo contesto è stata sviluppata un’applicazione distribuita la quale unifica le coordinate dei corpi rilevate da diversi Kinect. La struttura di comunicazione utilizzata per il trasferimento è basata sulla strategia pull-push. Il server, dopo aver collezionato i dati, ricostruisce la scena Per fare ciò i dati in entrata devono essere elaborati in modo che tutti abbiano lo stesso sistema di riferimento e qualora un elemento sia mancante in un Kinect, vien ripreso da un altro. Oltre alla gestione dei dati ricavati dai diversi Kinect, questi vengono anche visualizzati a schermo facendo uso della libreria grafica OpenGL in modo da poter avere una visualizzazione real-time della cinematica del corpo. L’architettura proposta offre anche la possibilità di scalare aggiungendo un numero imprecisato di Kinect in modo da poter rendere il sistema efficace nei più svariati ambienti. The appliances that reproduce the kinematics of bodies have been widely used in recent years in a range of fields, such as video games, in professional settings like in medicine or sports and in more lucrative fields like domotics. In this project, the Microsoft Kinect, which has its own SDK, is used to identify the user's position and to track his movements. However, as this technology requires a direct view of the user without obstacles to be effective, the goal of this project is to overcome this setback. In order to solve this issue, an application that unifies the data generated from several Kinect machines has been developed. Once the data is collected from several Kinects, the application rebuilds it, merging the data and rendering a result free from obstacles. The communication structure used to transfer the data is based on the pull-push strategy: the server, after collecting the data, rebuilds the scene. In order to do so, all the entering data have to be elaborated ensuring that all the machines have the same reference system, so that whenever an element is missing in one of the Kinects, it can be recover from another. Besides the data management obtained from the different Kinects, this can be visualized as a screen using the Graphic library Open GL so that you can have a real-time view of the kinematics of the body. The propose architecture demonstrates the possibility of a variable number of Kinects being used, in order to make the system more efficient, depending on the morphology of the space.

Item Type: Thesis (Bachelor)
Subjects: Informatica
Divisions: Dipartimento tecnologie innovative > Ingegneria informatica
URI: http://tesi.supsi.ch/id/eprint/935

Actions (login required)

View Item View Item