Gran angular

Frederic Udina

director de l'Institut d'Estadística de Catalunya (Idescat)

“L'Idescat s'ha de nodrir dels registres i menys de les enquestes de l'INE”

Tenir estadística ben feta i tractada és molt útil per al progrés de la societat
Històricament, els instituts d'estadística han treballat les dades de forma aïllada

El big data és un repte per a l'estadística oficial?

És més aviat una l'oportunitat de situar-nos en un nivell molt més proper a les necessitats de la societat. Interpreto el big dada com la capacitat de recollir molta més informació i integrar-la. Històricament els instituts oficials d'estadística han treballat la informació d'una manera molt aïllada i descontextualitzada. Avui dia això no té cap sentit perquè tenim una gran capacitat d'accés a la informació i unes eines que permeten tractar-la i fer-la treballar conjuntament.
Què vol dir?

Doncs, per exemple, que avui dia podem creuar dades sobre l'educació dels individus amb les d'ocupació o amb les de productivitat i arribar a conclusions. A base de fer aquesta tasca podem obtenir noves dades molt útils per a les administracions i els polítics, o per als periodistes i els investigadors. És una informació de base que només pot recollir l'institut d'estadística perquè és una informació molt sensible.
Per tant, proposa alimentar l'Idescat de noves fonts de dades. De quines?

L'Idescat ha de canviar la manera de produir. En el centre han de deixar d'estar en les enquestes i ha de situar-se la informació d'origen administratiu que és la que et dóna un retrat de la societat, de les empreses i del territori. Un cop tens aquesta fotografia a les teves bases de dades pots decidir si vols fer una enquesta per aspectes més concrets que no pots trobar enlloc.
Quins canvis cal abordar per fer això que proposa?

Aquest canvi de model de producció té una sèrie d'accions per fer a tres nivells. En primer lloc, cal convèncer els polítics dient-los que si ens faciliten informació nosaltres els la tornarem molt més enriquida. Després hi ha una fase de repte tecnològic i administratiu sobre com recollim aquesta informació i com l'actualitzem regularment. Finalment, la fase més estadística de com aprofitem aquesta informació.
Passar de les enquestes als registres farà que l'Idescat sigui menys dependent de l'INE?

En part sí. No és que sigui el motiu, però sí que és una de les estratègies guanyadores. El problema que tenim és que l'Idescat és molt petit i no té els recursos per produir informació estadística per si mateix. Mentre l'organització de l'estat sigui la que és, l'Idescat ha d'aprofitar la informació de l'INE perquè si no seria duplicar els esforços i malbaratar els diners públics. Però això ens limita en alguns aspectes. El que tenim al nostre abast és mobilitzar aquesta informació administrativa i utilitzar-la per enriquir la informació que ens arriba de l'INE. En aquest sentit, ens farà menys dependents.
Com es relaciona aquest procés que comenta amb el d'obertura de dades en què està la Generalitat?

Quan estem parlant de recollir la informació més individual i més granulada, hem de vigilar que aquesta informació només estigui tractada d'una manera que no s'escapi informació personal. Però amb aquesta informació pots elaborar informació agregada i creuada que aquesta sí la pots posar a disposició de l'administració, d'investigadors i del públic en general. La major part de la informació que genera l'Idescat es d'accés obert.
Posa molt èmfasi en la privacitat de les dades, però una de les característiques d'aquesta eclosió és que és una informació identificable i no gaire ben protegida. Aparentment són dos món força diferents?

Sí, en aquest aspecte sí. El món del big data tal i com està evolucionant avui dia la privacitat queda molt poc protegida i definida. No se sap cap a on va això. Segurament s'hi hauran de trobar límits o ens haurem d'acostumar a viure amb un altre tipus de privacitat. L'estadística oficial aquí sí que ho tenim clar i descartem la possibilitat d'identificar individus.
Cal elevar el nivell de formació en estadística de la població?

Això és així a resultes de l'evolució recent però també era així al segle XX. El saber llegir dades, interpretar gràfics i conèixer conceptes com el de mitjana o de dispersió, ja en el segle XX eren conceptes importants d'alfabetització de la gent. Ara entra aquest aspecte de la producció massiva d'informació que fa dels individu generadors massius d'informació i que hi ha gent disposada a utilitzar-la per fer negoci. Moltes vegades revertirà en el propi bé: la publicitat personalitzada no té per què ser dolenta. Però té altres aspectes més perillosos en posar la teva privacitat en mans d'altra gent. D'això n'hem d'aprendre.
Des del punt de vista de la ciència estadística quin és el repte?

Penso que estem en un canvi de paradigma. Les eines de la probabilitat permeten fer això que els estadístics en diem inferència: amb una mostra petita, conèixer què passa a la població. Això és el que ha permès a l'estadística entrar en molts camps. Aquest paradigma de l'estadística canvia des del moment que tens gran quantitat de dades i ja no necessites mirar dades d'una mostra perquè tens dades de tothom.
Els països del nord d'Europa són referents en aquest camp com també en educació, en idiomes, en protecció social... ¿Són bons en aquests aspectes i per això es preocupen de tenir bona informació estadística, o perquè tenen bona informació del que fan que han millorat?

És una pregunta molt difícil de contestar. Què és causa de què? Es evident que una bona informació estadística ben recollida, ben tractada i ben estructurada per fer-se'n servir és molt útil per al progrés de la societat i perquè els polítics prenguin decisions correctes. Segur que té conseqüències i que l'organització de l'educació es fa en base a l'avaluació dels resultats. Però també és cert que la cultura d'aquests països ha facilitat molt que la informació estadística sigui molt rica i molt ben estructurada.


Identificar-me. Si ja sou usuari verificat, us heu d'identificar. Vull ser usuari verificat. Per escriure un comentari cal ser usuari verificat.
Nota: Per aportar comentaris al web és indispensable ser usuari verificat i acceptar les Normes de Participació.