Oggi la diffusione e la crescita delle applicazioni Web 2.0 hanno creato un nuovo mondo di comunicazione e collaborazione. Più di un miliardo di persone in tutto il mondo sono collegate da social network e messaggeri istantanei. Si sostengono da soli attraverso wiki, podcast, post di discussione, commenti e messaggistica istantanea. La nuova generazione di social network online è resa possibile dalla diffusione capillare di Internet ad alta velocità e si è addirittura affermata come una modalità di comunicazione e interazione mainstream con un significato sempre maggiore nella società dell’informazione in cui viviamo oggi. Facebook, Instagram, Twitter, LinkedIn e altri siti simili di social network online forniscono spazi online dove gli individui possono creare un profilo e collegarlo ad altri per creare una rete personale. Nei siti di social networking online, l’obiettivo è l’interazione e la connessione sociale. Questi siti di social network online offrono a tutti un luogo dove condividere le proprie storie personali, in parole, immagini e video con i propri amici. Mettono anche in contatto le persone con gli amici e con altre persone che lavorano, studiano e vivono intorno a loro. Aiutano le persone a saperne di più su eventi, feste e altre funzioni sociali. La partecipazione e la continuazione nei social network online rappresentano un nuovo fenomeno sociale che dipende in gran parte dalle interazioni con gli altri utenti di una rete personale. I social media sono diventati un importante mezzo di comunicazione aperto per comprendere le opinioni degli utenti e valutare le tendenze in diversi campi di ricerca. Siamo nell’era della condivisione di milioni di immagini sui social media. I siti di social media più popolari sono Facebook, Instagram, Twitter e Pinterest. Questo aspetto ha motivato molto lavoro sull’analisi dei dati dei social media utilizzando tecniche di machine learning e deep learning. L’analisi dei sentimenti è stata definita come lo studio computazionale delle opinioni e dei sentimenti espressi nei testi, con una definizione semplificata: “un sentimento o un’opinione personale positiva o negativa”. La ricerca in quest’area classifica il testo secondo la sua polarità: positivo, negativo e neutro (non esprimendo alcun sentimento). In generale, ci sono due approcci principali all’analisi del sentimento: il primo approccio consiste in modelli basati sul lessico, e il secondo riguarda i metodi basati sull’apprendimento automatico. I metodi basati sull’apprendimento automatico usano diverse caratteristiche del testo come input per un modello di formazione e poi prevedono il sentimento del testo usando queste caratteristiche. Tra le tecniche di machine learning supervisionate, semi-supervisionate e non supervisionate che eseguono la classificazione del sentiment, le più popolari sono gli algoritmi basati su reti neurali profonde e reti generative antagoniste. Le tecniche di apprendimento profondo permettono alle macchine di imparare a classificare i dati da sole; per esempio, uno strumento di analisi delle immagini di apprendimento profondo può imparare a riconoscere le immagini che contengono gatti, senza che venga detto specificamente l’aspetto di un gatto. Con le soluzioni automatizzate di Deep Learning-powered per il monitoraggio dei social media è possibile accedere a intuizioni utilizzabili per gestire efficacemente l’immagine dell’utente e scoprire il feedback degli utenti (anche quando non era previsto che venisse ascoltato inizialmente, che è la parte migliore del tutto) in modo tempestivo. Le sfide principali sono le difficoltà intrinseche di tracciare e quantificare la quantità enorme e non strutturata di dati. Un ampio corpus di ricerche in corso utilizza le sintesi quantitative dei contenuti generati dagli utenti (UGC), come la valenza complessiva e il volume delle valutazioni degli utenti, per rappresentare le opinioni degli utenti. Per raggiungere questo obiettivo, una serie di immagini e di post vengono raccolti attraverso ricerche automatizzate di hashtag e post. Ad esempio, le persone scattano foto e inseriscono testo nelle foto con l’aiuto di un software di fotoritocco. Per valutare il significato di un’immagine, è essenziale non solo giudicare gli elementi visivi, ma anche capire il significato del testo inserito. In generale, una piattaforma di social media (Instagram, Twitter e Facebook) ha diversi modi per introdurre i messaggi dei suoi utenti. Il contenuto principale del post è spesso il testo accompagnato da hashtag. Di conseguenza, un post comprende di solito tre elementi principali: testo, hashtag e immagine. L’approccio per stimare il sentimento complessivo di un’immagine basato su informazioni sia visive che testuali viene eseguito valutando il sentimento di un’immagine da un classificatore di apprendimento automatico basato su caratteristiche visive e testuali estratte da due Reti Neurali Convoluzionali Profonde (DCNN) appositamente addestrate. L’estrattore di caratteristiche visive si basa sull’architettura di rete VGG16 ed è addestrato attraverso la messa a punto di un modello previamente addestrato sul dataset di ImageNet. Mentre l’estrattore delle caratteristiche visive viene applicato all’intera immagine, l’estrattore delle caratteristiche testuali rileva e riconosce i testi prima di estrarre le caratteristiche. L’estrattore delle caratteristiche testuali è basato sull’architettura DCNN e viene creato dalla messa a punto di un modello che è stato precedentemente. Con queste features, sei classificatori dello stato dell’arte chiamati kNearest Neighbors (kNN), Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), Naive Bayes (NB) and Artificial Neural Network (ANN) sono utilizzati per valutare il sentiment globale.