Om aan de top te blijven, moeten de AI-bots voortdurend worden getraind met nieuwe gegevens. Anders lopen ze het risico verouderd te raken en de concurrentiestrijd met andere spelers te verliezen. Maar wat gebeurt er als ze geen gegevens meer binnenkrijgen?
De essentie: Zonder nieuwe bronnen dreigen AI-tools in de nabije toekomst zonder inspiratie te komen zitten.
Duiding: Dankzij de immense hoeveelheden gegevens slagen AI-tools erin de illusie te wekken dat ze creatief zijn. In werkelijkheid beantwoorden ze slechts verzoeken op basis van de beschikbare data.
- ChatGPT is bijvoorbeeld getraind met 570 gigabytes aan gegevens, oftewel ongeveer 300 miljard woorden.
Vooruitblik: Het zal niet lang meer duren vooraleer de AI-bots alle beschikbare gegevens geraadpleegd zullen hebben, waarschuwt een groep onderzoekers.
- Deze situatie heeft niets te maken met het feit dat bepaalde bedrijven exclusieve rechten op bepaalde gegevens voorbehouden, met name Musk met X.
- Grote datasets zijn nu eenmaal een beperkte bron, vooral die van hoge kwaliteit.
- De posts op sociale media voeden AI met gegevens, maar die zijn van beperkte kwaliteit vanwege de vooroordelen en nepnieuwsberichten.
- De meest alarmerende voorspellingen wijzen op een tekort tegen 2026, vooral als de huidige trends op het gebied van AI-ontwikkeling zich voortzetten.
- De gegevens van lage kwaliteit – met name van sociale netwerken – zullen tussen 2030 en 2050 uitgeput zijn.
- Alle hoogwaardige beeldgegevens zullen tussen 2030 en 2060 gebruikt zijn.
Een risico voor de markt
Zonder nieuwe gegevens om mee te werken, kunnen AI-algoritmes zichzelf niet meer trainen en zullen ze onnauwkeurige of kwalitatief slechte resultaten produceren.
- Dit is een bekend risico voor ontwikkelaars die oplossingen proberen te vinden.
- En het genereren van nieuwe gegevens met behulp van chatbots is niet noodzakelijkerwijs de beste oplossing, althans niet op dit moment.
- Deze techniek is al eerder onderzocht en toonde al snel zijn grenzen. Wanneer AI’s worden getraind met kunstmatig gegenereerde databases, produceren ze “verwarrende en verontrustende” resultaten.
- OpenAI, het bedrijf achter ChatGPT, heeft al een oproep gedaan. Het vraagt lokale overheden en andere organisaties met grote hoeveelheden gegevens om die te delen.
Samengevat: Een tekort aan data dreigt voor de AI-sector, met een afzwakkende groei voor de sector als gevolg. Dit zou zelfs de koers van de AI-revolutie kunnen veranderen, merkt The Conversation op.
Er is nog hoop
Kunstmatige intelligentie kan echter nog veel verrassingen voor ons in petto hebben en in staat zijn om dit probleem zelf op te lossen. We kunnen ons ook voorstellen dat de exploitatie van de momenteel beschikbare gegevens zal worden verbeterd, zodat ze nog lange tijd AI’s kunnen blijven voeden.
(ns)