China ontwikkelt AI die ‘gevoelige informatie’ op het internet efficiënt censureert

AP Photo/Andy Wong/Isopix

De duimschroeven van het Chinese internet worden verder aangedraaid. Chinese onderzoekers ontwikkelden AI die met 91 procent zekerheid gevoelige onderwerpen en informatie in het online landschap kan herkennen en censureren.

Het internet in China kent meer dan 900 miljoen gebruikers en een hele hoop gecensureerde onderwerpen. Meestal informatie over onafhankelijkheidsbewegingen in Tibet, politiek discours uit Taiwan, religieuze groepen zoals Falun Gong en natuurlijk de bloedige gebeurtenissen van 1989 op het Tiananmenplein. Maar eveneens worden statistieken over de ongelijkheidskloof in het land en voedselveiligheid liever onttrokken aan het publiek.

Toch glipt er vaak informatie door de mazen van het net. Chinese internetgebruikers zijn bijzonder handig in het omzeilen van censuur en gebruiken de ‘dark web’ en alternatieve apps zoals Signal en Telegram om verboden onderwerpen aan te kaarten.

Daar willen onderzoekers in China nu een stokje voor steken met een geavanceerde tekstfilter die via AI ‘gevoelige informatie’ kan identificeren en censureren. Daarvoor zal de AI voornamelijk ‘key words’ gebruiken, de zoektermen die u ingeeft in een zoekrobot zoals Google, of Baidu voor de Chinezen.

De huidige instrumenten van de Chinese regering zouden dit maar met 70 procent accuraatheid kunnen doen. De AI zit op dit moment al boven de 80 procent nauwkeurigheid.

AI die tussen de regels door kan lezen

De onderzoekers van de Shenyang Ligong University denken dat cijfer zeker naar de 91 procent op te kunnen krikken. Naar eigen zeggen ontwikkelt de AI zich recent zelf verder en doet die dat beter dan verwacht. De 91 procent nauwkeurigheid zou binnen het bereik zijn.

Vooral de Chinese taal vormt een grote uitdaging voor de AI. Het vereenvoudigde Chinese schrift telt ongeveer 10.000 verschillende karakters. In woorden die vaak gecensureerd worden, zoals ‘vuurwapen’, kunnen karakters gebruikt worden die in een totaal andere context onschuldige woorden vormen.

De Chinezen zijn zelf ook heel creatief met hun taal en gebruiken vaak jargon om toch verboden woorden te gebruiken. Ook die jargon zou de AI kunnen herkennen en censureren. De AI leert met andere woorden om tussen de regels door te lezen.

De AI zou eerst ingezet worden om online nieuws te controleren dat op dit moment zichtbaar is in China. Volgens chinafirewalltest.com, een site waar u kan testen of uw site gecensureerd of geblokkeerd is in China, is Business AM op dit moment nog toegankelijk. Als de nieuwe AI zijn werk inderdaad goed doet, zou dit mogelijk niet lang meer het geval zijn.

(lb)