Ecco “Crowd Pulse”, il software creato all'università che scova l'odio in rete
Gli hanno dato un nome inglese che significa “il battito cardiaco della folla”. È stato utilizzato all'Aquila per tastare il polso dei cittadini abruzzesi che hanno vissuto il post terremoto. Viene sperimentato in fase embrionale con il comune di Bari per analizzare le percezioni di sicurezza nei quartieri del capoluogo pugliese. È “Crowd Pulse” il nome con cui è stato battezzato il software elaborato nel Dipartimento di Informatica dell'Università “Aldo Moro” di Bari. È una piattaforma di social network analytics & sentiment anaysis che permette di analizzare e geolocalizzare i “cinguettii” su Twitter sulla base dei significati e dei contenuti. Se “i dati sono il nuovo petrolio” allora Crowd Pulse funziona proprio come una trivella: buca dove c'è il giacimento ed estrae. Non il greggio ma i tweet. È con questo esempio che lo definisce Cataldo Musto, ricercatore barese dell'Aldo Moro, che il 25 giugno ha parlato del “cuore tecnologico” alla base de “Le mappe dell'intolleranza” in Italia: terza edizione del progetto di Vox - Osservatorio italiano sui diritti per monitorare l'odio su twitter verso donne, omosessuali, musulmani, ebrei, immigrati e disabili.
Come funzionano gli algoritmi elaborati nell'ateneo pugliese? “Il concetto basilare non è diverso da una ricerca effettuata a mano nel motore di ricerca interno a twitter – spiega Musto –. Il software automatizza questa operazione estraendo a intervalli regolari, ogni 24 ore, tutti i tweet che contenevano per esempio espressioni come 'muso giallo', 'negro' o 'rabbino' nel caso di contenuti razzisti o antisemiti”. C'è un problema: l'espressione “rabbino” si presta a sfumature semantiche. Può essere usata in maniera dispregiativa ma anche indicare gli studiosi della Torah. “Serve il contesto – spiega Musto anticipando l'obiezione –. Non analizziamo la singola parola estrapolata ma sulla base di quelle che la circondano”. Un esempio banale? “Se attorno alla parola 'nano” compaiono i nomi di Messi o Brunetta e non iPod, allora “c'è un'alta probabilità statistica che il termine sia usato come insulto o nella sua accezione d'intolleranza”. Ci sono altre tecniche più sofisticate che “si basano sulla analisi sintattica e costruzione della frase – aggiunge il ricercatore – servono a riconoscere e se l'uso di un insulto si riferisce a una persona e non ad una esclamazione di rabbia o disappunto”. Sono tutti informatici gli otto membri del gruppo di lavoro pugliese, fra docenti e ricercatori, che hanno sviluppato e reso applicativo “Crowd Pulse” sotto la guida del professore Giovanni Semeraro, ma “cinque persone del gruppo si occupano di elaborazione del linguaggio naturale e semantica oltre a collaborazioni nel campo della linguistica computazionale” dichiara Musto.
Se la lista di 76 termini offensivi, che gli informatici definiscono “semi” e con cui il software ha tracciato i tweet dell'intolleranza, è stata messa in campo dal Dipartimento di psicologia dinamica e clinica della Sapienza, l'attuale direzione di ricerca è quella “evolvere la piattaforma per unire i dati che provengono dal web con quelli del mondo reale” come “centraline, posizioni gps, correlazioni fra mondi online e offline”. Nel progetto dell'Osservaotrio italiani sui diritti, questo continuo dialogo fra i due mondi è messo in luce dall'analisi dei picchi di tweet legati ai fatti di cronaca. “Nessuno si sveglia al mattino e twitta un messaggio razzista” afferma Musto, ma al contrario c'è sempre un detonatore: casi di cronaca, titoli dei giornali, reality show. “Nelle prime edizioni del progetto l'analisi dei picchi non c'era ma due anni fa ci siamo accorti di una salita vertiginosa dopo la lite fra gli allenatori Roberto Mancini e Maurizio Sarri durante un Napoli-Inter di Coppa Italia”. Il caso è quello dell'allenatore del Napoli che apostrofa con parole omofobe il suo omologo nerazzurro. È proprio il calci a essere uno dei detonatori più frequenti. Per Musto è “durante le partite che si assiste a un aumento dei 'zingaro' o 'negro”.
“Crowd Pulse” è utilizzato ora in pianta stabile da Vox e le quattro università – Statale e Cattolica di Milano, Aldo Modo di Bari e la Sapienza di Roma, che lavorano alle mappe dell'intolleranza, ma un suo passato. Nel 2013 è stato utilizzato in collaborazione con l'Università di Chieti e prevedeva una connessione fra virtuale e reale. Spiega Cataldo Musto che “era previsto un community promoter che prendeva l'output prodotto dalla piattaforma, per esempio il calo del senso di appartenenza a quartiere, e venivano previste delle azioni per migliorare questa situazione: un incontro con l'assessore, una festa, un convegno-dibattito”. I contenuti social venivano classificati sulla base di indicatori sociali come senso di sicurezza, capacità di fare rete sul territorio, senso di appartenenza. Sono gli indicatori “che nel caso di una città terremotata sono quelli con il punteggio più basso: a causa da un lato della dispersione delle persone e dall'altro per dinamiche interne al post terremoto”. Ad esempio “ogni volta che un amministratore locale finiva indagato o inquisito alcuni indicatori andavano a decrescere”. Ma è proprio su Bari che sta prendendo forma una delle applicazioni più interessanti anche se in fase embrionale: perché si tratta di monitorare il “sentiment” dei cittadini a un livello di “granularità ancora più fine” come la definisce il ricercatore, “sui singoli quartieri della città”. Non più basandosi su parole chiave bensì “sulle interazioni, i retweet, i commenti con gli account dei personaggi o delle istituzioni più note: dal governatore di regione, fino all'azienda del trasporto pubblico locale” chiude Musto. (Francesco Floris)