Gran angular

El tsunami de les dades

Comprar, veure la televisió, parlar pel mòbil, navegar per internet... els actes quotidians poden ser rastrejats i analitzats pel vestigi digital que deixen. Treballar aquesta informació és una nova forma de coneixement i poder

El model basat en la probabilitat, en la mostra estadística, està en qüestió

Quan un ciutadà incorpora alguna novetat tecnològica a la seva vida -mòbil intel·ligent, tauleta, perfil en una xarxa social, cerca per internet, etcètera- el seu rastre digital augmenta sense que en sigui conscient. Això vol dir que deixa anar més pistes sobre el que fa, el que li agrada i el que no, amb qui es relaciona o què opina sobre un tema. A més de facilitar-nos la vida, aquests enginys esdevenen noves font d'informació personal que empreses, investigadors de diversos camps i administracions intenten aprofitar amb finalitat molt diversa.

I no calen eines molt sofisticades. La nostra petjada és fàcil de seguir, tractar, aprofitar i difondre. Això malgrat que es tracta de quantitats ingents d'informació que cada dia són més i més grans, per això, a aquest fenomen se l'anomena big data, o revolució de les dades massives. Però el coneixement al voltant de què fer amb aquestes dades i la capacitat de tractament també estan creixent d'una manera vertiginosa.

Cal recordar que el 1990 el Projecte Genoma Humà de seqüenciació de l'ADN va suposar un enorme repte de tractament, en haver de gestionar 3.000 milions de dades. S'hi van invertir 2.700 milions de dòlars i van caldre 13 anys per desxifrar-lo. Quatre anys després, l'esforç es reduïa fins als 100 milions de dòlars i els quatre anys de treball. I l'any 2012, fer la seqüenciació del genoma d'una persona costava 10.000 dòlars en dues setmanes de feina. “En un futur pròxim serà el regal de Reis que li podem fer al nostre ésser estimat”, apunta Àlex Sánchez, del grup de recerca en estadística i bioinformàtica de la UB, que el 28 de novembre passat va participar en una jornada de la UOC sobre el Big Data, dins de l'Any de l'Estadística.

La biologia, però també la sociologia, el màrqueting, l'astronomia, l'economia i moltes altres disciplines i camps d'activitat estan descobrint el potencial de les dades per fer coses fins ara impensables. La policia de Los Ángeles utilitza tota la informació de què disposa per predir en quina part de la ciutat es produirà el pròxim crim; i els investigadors de la Universitat de Califòrnia analitzen el comportament al mòbil dels malalts del cor per detectar quan el pacient està sent víctima d'un atac.

I això no ha fet res més que començar: les càmeres de reconeixement òptic, els nous sistemes de monitorització de les xarxes socials, els xips RFID... cada cop hi ha més formes de generar informació que expliquen coses de nosaltres a temps real i a una freqüència altíssima. L'empresa Eixos ha fet un cens de tots els locals comercials a peu de carrer de les poblacions catalanes de més de 10.000 habitants. Cap administració no sap tant de cartografia comercial com aquesta firma, que ha creat diversos productes a partir d'aquesta informació -un dels clients és Nokia- entre els quals, dos indicadors sobre el grau d'ocupació dels locals i l'atractiu comercial d'una localitat. La firma té deu treballadors, però gràcies al mòbil i a les xarxes socials corporatives són capaços de mobilitzar persones per recollir les dades. Gràcies a això han pogut pentinar 100.000 establiments de tot Catalunya en només dos mesos. “Cada cop ens acostem més al treball científic d'examinat tot el continu”, explica David Nogué, màxim executiu.

Certament un dels canvis estructurals del big data és l'accés a informació de tot l'univers objecte de l'estudi. El model probabilístic, és a dir, l'explicació dels comportaments d'una població a partir d'una mostra, que va ser la gran aportació de l'estadística a la resta de disciplines científiques, ara, està en qüestió. “Estem davant un canvi de paradigma”, assegura Frederic Udina, director de l'Idescat. Aquest canvi, però té resistències: “Treballar sobre el 100% de l'objecte d'estudi trenca amb el romanticisme de que les dades es generen d'una forma màgica; però ¿què té més valor estadístic, la gigafoto de la via catalana o les enquestes del CIS?”, es pregunta Nogué.

Conscients d'aquests canvis, l'Idescat s'està replantejant l'ús de les enquestes (la font principal dels seus treballs) per la captació de dades que genera l'administració. És un exemple del gran canvi que ja es comença a intuir. Les dades són la nova frontera del segle XXI i el seu control, una nova forma de coneixement però també de poder.

Les piulades ‘indepes' i els patrons de vot

Camilo Cristancho és doctorand en ciència política a la UAB i membre del grup de recerca en democràcia, eleccions i ciutadania. Ara està investigant el rastre que les onades de protesta ciutadana deixa en els mitjans digitals i com això té el seu reflex en els patrons de vot. “És una forma de fer prediccions alternativa als sondejos tradicionals”, diu. Cristancho, que estudia mobilitzacions com la independentista de la darrera diada de Catalunya o la indignada del 15-M, fa un seguiment de les converses a Twitter i rastreja els continguts digitals que consulten els usuaris. Ho fa amb programes que detecten paraules però també sentiments; “mineria de textos” l'anomena Cristancho. L'investigador és conscient que a Twitter només hi ha una part de la població, amb una representativitat difícil de determinar, però que solen ser creadors d'opinió. Amb aquesta informació està establint patrons de vot i aspira a definir tendències i fer prediccions.

L'èxit d'un programa i el ressò a la xarxa

The Data Republic és una empresa que va néixer el 2011 especialitzada a escoltar les xarxes socials i treure'n conclusions per a les marques comercials o els programadors de continguts televisius. Elabora estudis de mercat complementaris als tradicionals perquè es fan en temps real i amb una valoració del consum diferent, ja que és espontània i no forçada. En el cas dels programes de televisió, el cofundador de la firma, Carlos Sánchez, explica que no es tracta de saber quantes persones tenen sintonitzat un determinat espai, sinó que observen la relació que s'estableix amb els espectadors, que a més de veure el programa, hi interactuen: “Proporcionem informació que complementa la convencional”, assegura. De fet, classifiquen els comentaris, si són crítics, despectius, admiratius, d'alegria, decebuts o, directament, insults. Sánchez pensa que amb la informació que gestionen poden començar a preveure l'èxit d'audiència d'un programa.



Identificar-me. Si ja sou usuari verificat, us heu d'identificar. Vull ser usuari verificat. Per escriure un comentari cal ser usuari verificat.
Nota: Per aportar comentaris al web és indispensable ser usuari verificat i acceptar les Normes de Participació.