Machine learning for disambiguation of clinical trial scientist names

Bresciani, Matteo (2019) Machine learning for disambiguation of clinical trial scientist names. Bachelor thesis, Scuola Universitaria Professionale della Svizzera Italiana.

[img] Text
DOC_BRESCIANI.pdf

Download (1MB)
[img] Text
POSTER_M_BRESCIANI.pdf

Download (452kB)

Abstract

L’AND (noto come author name disambiguation) è un problema noto, non essendo diffuso l’uso di identificatori univoci per gli autori, è quindi difficile discernere se due autori con lo stesso cognome e con la stessa iniziale del nome siano la stessa persona o meno. In passato sono stati creati molti algoritmi per cercare di risolvere questo problema, gli algoritmi creati non risolvono però ancora il problema con sufficiente precisione. Gran parte di essi è stata realizzata confrontando solo coppie di articoli presi da MEDLINE. Lo scopo del mio lavoro è quello di creare algoritmi in grado di risolvere il problema dell’AND con sufficiente precisione, ma confrontando gli autori degli articoli di MEDLINE con quelli degli studi clinici. Come vedremo, il confronto dà come risultato una precisione paragonabile ai precedenti algoritmi realizzati confrontando articoli provenienti esclusivamente da MEDLINE. *** Author name disambiguation (AND) is a known problem. There is no widespread use of unique identifiers for the authors, thus it is difficult to discern whether or not two authors with the same last name and with the same first name initial are the same person. In the past, there have been many attempts to solve this problem. The algorithms that were created do not still solve the problem with enough precision. The vast majority of them have been made comparing only pairs of articles taken from the MEDLINE library. The purpose of my work is to make an algorithm that can solve the AND problem with enough precision, but comparing authors from MEDLINE articles with authors from clinical trials. As we will see, the comparison yields a precision comparable to the previous algorithms made comparing articles from the same library.

Item Type: Thesis (Bachelor)
Corso: UNSPECIFIED
Supervisors: Rinaldi, Fabio and Gambardella, Luca Maria
Subjects: Informatica
Divisions: Dipartimento tecnologie innovative > Ingegneria informatica
URI: http://tesi.supsi.ch/id/eprint/3082

Actions (login required)

View Item View Item