Giornate di Studio sulla Popolazione (Popdays), Giornate di Studio sulla Popolazione 2013

Font Size: 
L’archivio della popolazione semisuper e supercentenaria: integrazione fra fonti diverse
Giorgia Capacci, Marco Battaglini, Gianni Corsetti

Date: 2013-02-07 11:00 AM – 12:30 PM
Last modified: 2013-01-23

Abstract


A partire dal 2009 l’Istituto Nazionale di Statistica ha avviato un’indagine che ha portato alla creazione di un archivio di persone residente con un’età superiore ai 104 anni. La fonte dell’indagine è quindi la Posas, ma a partire dal 2012 è stata affiancata, con finalità di controllo e validazione, una nuova fonte, quella dell’indagine delle Cause di Morte. È stato quindi creata una procedura di record linkage fra l’archivio delle Cause di Morte e quello dei supercentenari, al fine di integrare i dati provenienti dai due archivi. Il primo record linkage è stato effettuato sui dati del 2009, gli ultimi diffusi dall’indagine sulle Cause di Morte. Tale procedura di abbinamento esatto è stata svolta, in una prima fase, sulle variabili “Nome”, “Cognome” e “Comune di residenza”; in una seconda fase si è proceduto all’applicazione di tecniche di record linkage non esatto sulle variabili “Nome” e “Cognome” con il calcolo di alcune funzioni di distanza tra stringhe, considerando sia la somiglianza tra le parole che le compongono che l’uguaglianza tra terzine corrispondenti. L’esperienza di record linkage ha permesso di recuperare 81 individui, su un totale di 504, che non erano stati inseriti nell’archivio tramite la fonte Posas. 


Keywords


archivio, fonti, record linkage