La crescente digitalizzazione delle interazioni sociali ha portato i social network a divenire enormi contenitori di dati, offrendo opportunità inedite per lo studio dei fenomeni sociali.
L’attività dell’Università degli Studi di Bari nell’ambito del progetto Mappa dell’Intolleranza, ha portato a sviluppare nuove strategie di ricerca sulla caratterizzazione delle nuove connotazioni dell’odio online. Le metodologia adottate utilizzano avanzate tecniche di Intelligenza Artificiale (IA) e Natural Language Processing (NLP) per individuare e analizzare le espressioni di hate speech presenti in Rete. L’obiettivo principale è quello di comprendere come l’intolleranza si sviluppi e si diffonda attraverso la rete, fornendo strumenti utili per contrastarla.
Fasi della Metodologia
1. Connessione ai social network
Il primo passo consiste nella raccolta di dati testuali pubblicati sulle principali piattaforme social. L’estrazione avviene attraverso API pubbliche e strumenti di web scraping, nel rispetto delle normative vigenti sulla privacy e sull’uso dei dati. Questo processo consente di raccogliere un vasto insieme di dati rappresentativo delle dinamiche comunicative online, catturando conversazioni, commenti e post pubblicati in contesti diversi.
I contenuti raccolti vengono analizzati per individuare le principali categorie di intolleranza (es. razzismo, misoginia, islamofobia, omotransfobia, antisemitismo, etc.). Tale classificazione è basata su studi linguistici e sociali che definiscono il perimetro semantico di ogni forma di odio. Per garantire un’analisi accurata, vengono utilizzati dizionari tematici e modelli linguistici avanzati in grado di riconoscere espressioni offensive, termini dispregiativi e contesti in cui vengono usati.
2. Individuazione dell’hate speech
L’identificazione dei messaggi d’odio avviene attraverso una combinazione di:
- Tecniche di NLP e Comprensione Semantica: vengono impiegati algoritmi avanzati per interpretare il significato dei testi, riducendo l’errore dovuto all’ambiguità linguistica. La capacità di riconoscere l’ironia e il sarcasmo rappresenta una sfida importante in questo processo, poiché molti contenuti offensivi vengono espressi in modo implicito.
- Analisi del Sentiment: l’analisi della polarità emotiva dei contenuti consente di distinguere i messaggi negativi da quelli neutri o positivi. L’uso di modelli di sentiment analysis permette di filtrare i contenuti non intolleranti, concentrandosi su quelli che manifestano una chiara connotazione ostile.
- Machine Learning e IA: vengono addestrati modelli di apprendimento automatico su dataset di testi etichettati manualmente, migliorando progressivamente la capacità di identificare i contenuti d’odio con elevata precisione.
3. Visualizzazione dei risultati
I dati elaborati vengono rappresentati graficamente al fine di mostrare l’evoluzione temporale dei fenomeni di intolleranza. L’obiettivo è fornire un quadro chiaro e aggiornato delle tendenze legate all’odio online. Oltre alle timeline, l’utilizzo di word cloud semantiche, basate su hashtag e concetti, permettono di analizzare gli argomenti e gli stereotipi maggiormente utilizzati nella diffusione di odio online. I periodi in cui l’intolleranza raggiunge picchi significativi, spesso correlati a eventi sociali, politici o di cronaca. Inoltre, l’analisi spaziale consente di rilevare le aree geografiche più colpite, contribuendo alla progettazione di interventi mirati.
Risultati
Nell’ultima edizione della ricerca sono stati analizzati circa 1.980.712 contenuti, di cui 1.126.278 identificati come hate speech. La variazione temporale dei fenomeni d’odio suggerisce che particolari eventi possano fungere da catalizzatori, amplificando la diffusione di messaggi intolleranti. Inoltre, l’analisi ha rivelato la presenza di cluster tematici, in cui determinati argomenti risultano maggiormente associati a discorsi d’odio.
Conclusioni e Implicazioni Sociali
L’applicazione di tecniche di Intelligenza Artificiale, NLP, analisi semantica e sentiment analysis ha permesso di sviluppare un sistema di monitoraggio avanzato dell’odio online. Grazie all’uso di Open Source Intelligence (OSINT) e predictive analytics, la Mappa dell’Intolleranza consente non solo di descrivere fenomeni sociali emergenti, ma anche di anticipare possibili escalation, fornendo uno strumento utile per policy maker, associazioni e ricercatori impegnati nella lotta contro l’intolleranza e la discriminazione. Inoltre, questa metodologia apre nuove prospettive di ricerca nel campo dell’analisi predittiva dei fenomeni sociali, permettendo di identificare in anticipo segnali deboli (weak signals) di potenziali crisi sociali. La possibilità di integrare questi dati con altre fonti, come notizie di cronaca e studi sociologici, potrebbe ampliare ulteriormente la comprensione dell’intolleranza e favorire interventi più efficaci per combatterla.
Cataldo Musto
Giovanni Semeraro
Dipartimento di Informatica, Università degli Studi di Bari