Kunstmatige Intelligentie leert menselijk gedrag te voorspellen op basis van video’s

Voorspellen wat iemand gaat doen op basis van zijn lichaamstaal is natuurlijk voor mensen, maar moeilijk voor computers. We weten niet hoe iemand ons zal begroeten; een handdruk, een kus of een vuistje. Maar we kunnen wel de begroeting herkennen en op de juiste manier reageren. Binnenkort kunnen computers dat ook. 

Een studie naar een nieuwe techniek voor computervisie moet machines intuïtiever maken. De studie wordt geleid door researchers van Columbia Engineering. Ze willen dat computers beter verbanden kunnen leggen tussen mensen, dieren en voorwerpen. 

“We willen dat ons algoritme leert om menselijk gedrag te voorspellen. We willen uiteindelijk dat kunstmatige intelligentie (AI) op een natuurlijke manier kan reageren op menselijk gedrag”, zei Carl Vondrick, het hoofd van de studie. “Beeld je alle mogelijkheden in voor robot-mensrelaties, van zelfrijdende auto’s tot virtuele assistenten.”

Beste techniek tot nu

Vondrick zei op 24 juni op de Internationale Conferentie voor Computervisie en Patroonherkenning dat hun techniek de meest accurate resultaten geeft. Met hun technologie kan een computer een video tot enkele minuten in de toekomst voorspellen. 

Daarvoor heeft de computer duizenden uren video’s voor moeten zien. Films, sportwedstrijden en zelfs series als “The Office” kwamen aan bod. De computer kan nu honderden gebaren voorspellen, van handenschudden tot vuistjes geven. Als de AI iets niet herkent, kan het wel een associatie maken, zoals bij het woord “gegroet”. 

De meeste AI’s kunnen dat niet. Het team ontwikkelde al eerdere technieken en ging ook al stapsgewijs te werk. Maar de AI’s konden nooit een gebaar dat ze niet kenden, zoals een knuffel, onder een soortgelijk thema categoriseren. 

Tabula rasa

De wetenschappers hebben wiskunde van de Oude Grieken moeten lenen. De meeste computers hebben wel basiskennis geometrie, maar toch konden ze met die kennis niet veel aanvangen. “AIs denken op een andere manier”, zeggen co-researchers Suris en Liu. “We hadden dus geometrie nodig die AI’s konden begrijpen op hun manier.”

Voorspellingen liggen aan de basis van de menselijke intelligentie. Computers maken fouten die mensen nooit zouden maken. Dat komt omdat computers niet abstract kunnen nadenken. Een AI creëren die zich menselijk gedraagt, is moeilijk omdat je als mens alles vanzelfsprekend vindt. De computer daarentegen is een onbeschreven blad. 

Dit wiskundig raamwerk zou computers moeten helpen om genuanceerder na te denken. Een AI zou zwemmen kunnen herkennen als een activiteitsvorm, omdat het weet dat lopen dat ook is. Op die manier kan de computer een situatie beter inschatten. “Dat is belangrijk voor het vertrouwen tussen mens en computer”, zegt Liu. “Vertrouwen komt pas als je het gevoel hebt dat de robot je begrijpt. Als machines ons beter begrijpen en ons gedrag kunnen anticiperen, dan kunnen ze ons beter assisteren in ons dagelijks leven.”

Nu nog buiten het lab

Het nieuwe algoritme presteert goed in het lab. Vondrick zegt dat de volgende stap zich buiten een labo-omgeving bevindt, om te checken of de computer zich daar ook zo goed gedraagt. Als het systeem in verschillende omgevingen kan werken, dan zijn er enorm veel mogelijkheden. Er zullen robots komen die instaan voor onze veiligheid en gezondheid. 

“Menselijk gedrag is vaak verrassend”, zegt Vondrick nog. “Maar onze algoritmes zullen het steeds beter kunnen anticiperen.”

(am)

Meer