Informacje i dezinformacje na temat Covid-19: rola sztucznej inteligencji.

Celem tego artykułu jest omówienie zagadnienia fake newsów w kontekście sztucznej inteligencji, jednego z najważniejszych tematów w mediach społecznościowych.

Obecna sytuacja spowodowana pandemią Covid-19 wzbudziła w naszym społeczeństwie wiele obaw i niepewności. W ostatnich miesiącach ludzie z całego świata polegali na mediach w celu wyszukiwania najnowszych wiadomości, śledzenia tendencji rozprzestrzeniania się wirusa, stosowania środków profilaktycznych i metod leczenia zakażenia.

Z tego powodu obserwujemy obecnie gwałtowny wzrost ilości informacji, które mogą być prawdziwe i wiarygodne lub wręcz przeciwnie – fałszywe. Tak zwane „fake newsy” od zawsze były tworzone i rozpowszechniane celowo, a obecnie stały się istotnym problemem, dlatego że wiele serwisów społecznościowych, takich jak Facebook, Instagram, Google, Twitter, Tik Tok i YouTube nie pozwala na kontrolę i filtrowanie treści stosowanych w standardowym procesie publikacji. Tym samym użytkownicy mediów społecznościowych mogą publikować poglądy i rozpowszechniać wiadomości poprzez udostępnianie, polubienia i retweety. Mimo, że cały świat nagli potrzeba znalezienia skutecznej metody leczenia Covid-19, to rozpowszechnianie fałszywych informacji, zwłaszcza dotyczących opieki zdrowotnej, stale rośnie i stanowi poważne zagrożenie dla publicznej służby zdrowia. Zautomatyzowany system funkcjonujący głównie na portalach społecznościowych, który jest w stanie wykryć i blokować fake newsy, mógłby okazać się bardzo przydatny w zapobieganiu szybkiemu rozprzestrzenianiu się nieprawdziwych informacji.

Sztuczna inteligencja pełni ważną rolę w ograniczaniu rozpowszechniania fake newsów w mediach społecznościowych, ponieważ jest w stanie weryfikować dużą liczbę postów i szybko rozpoznawać te, które próbują obejść filtry wprowadzając niewielkie zmiany w fałszywych treściach. Zadaniem sztucznej inteligencji jest zatem rozpoznanie fake newsów poprzez sklasyfikowanie informacji w „Skali Prawdy”, określającej czy informacja jest wysoce, średnio, czy mało prawdopodobna.

Uczenie głębokie (ang. Deep Learning) służy do analizy treści zawartych w mediach społecznościowych i weryfikacji ich autentyczności. Koncepcja autentyczności obejmuje wiele ważnych informacji, takich jak: cechy użytkownika, rodzaj używanego portalu społecznościowego i zróżnicowanie treści, a także ocena „prawdziwości” reakcji użytkowników. W rzeczywistości generatory fake newsów mogą pokazać nadzwyczajne zachowania przy udostępnianiu treści oraz tendencje do udostępniania bardziej kontrowersyjnych materiałów. Wszystkie te informacje zebrane razem sprawiają, że ocena autentyczności jest bardziej rzetelna.

Algorytmy stosowane w uczeniu głębokim odpowiedzialne za wykrywanie fake newsów zazwyczaj wykorzystują zestaw danych utworzony ze źródeł pozyskanych z treści różnych portali społecznościowych, takich jak Instagram, Facebook, Twitter. W konsekwencji metoda rozpoznawania fake newsów polega na klasyfikacji wykonywanej w oparciu o pojedynczy obraz, konkretny tekst lub kombinację tekstu i obrazu. Algorytmy klasyfikacji oparte na uczeniu głębokim są wykorzystywane przy rozpoznawaniu fake newsów.

System wykorzystujący multimodalną metodę rozpoznawania fake newsów

Aby odróżnić wiadomości prawdziwe od fałszywych, algorytmy te przechodzą pierwszą fazę szkolenia, podczas której wprowadza się do nich całą gamę przykładów wiadomości prawdziwych i fałszywych (zestaw danych treningowych). Dzięki zestawowi danych treningowych algorytm uczy się rozpoznawać określone cechy typowe dla fake newsów. W ten sposób jest w stanie odróżnić wiadomości prawdziwe od fałszywych. W sumie model uczenia głębokiego składa się z 3 elementów: sieci do klasyfikacji obrazów, sieci do klasyfikacji tekstu oraz sieci do klasyfikacji łącznej (tekst + obraz). Kiedy wyuczony algorytm zostanie użyty do przeanalizowania nowych wiadomości, będzie w stanie wykryć fake newsy zgodnie z tym, czego nauczył się na zestawie danych treningowych. Celem stosowanej metody, działającej w oparciu o sieci neuronowe, jest ograniczenie konieczności manualnej weryfikacji, a zarazem wykorzystanie jej do dalszego uczenia się. 

W przyszłości systemy te osiągną taką precyzję, że będą w stanie bezpośrednio blokować i usuwać fake newsy dotyczące COVID-19 i innych kwestii (przemoc, nienawiść…).

UCZENIE GŁĘBOKIE JAKO SYSTEM ROZPOZNAJĄCY FAKE NEWSY

Schemat algorytmu rozpoznającego fake newsy

Najbardziej zaawansowane techniki uczenia głębokiego wykorzystują wielowarstwowe sieci neuronowe, imitujące działanie biologicznych neuronów. Zadaniem algorytmu uczenia głębokiego rozpoznającego fake newsy jest automatyczne wyodrębnienie i zaklasyfikowanie cech treści multimedialnych (tekstu/obrazu/tekstu + obrazu) pochodzących z najpopularniejszych portalów społecznościowych. System obejmuje fazę szkolenia, mającą na celu zgromadzenie obszernych zestawów danych i pozyskanie z nich informacji. W dzisiejszych czasach możliwość dokonywania analizy dużych zbiorów danych wymaga korzystania z zaawansowanych technik oraz mocy obliczeniowej komputerów połączonych równolegle lub pracujących w prywatnych chmurach.