Spraaktechnologie drie keer sneller dan typen

Spraakherkenning op mobiele telefoons werkt drie keer sneller dan eenzelfde boodschap wordt uitgetikt op het klavier van het apparaat.

Dat spreken sneller gaat dan schrijven of typen is al langer geweten, maar wel belangrijk is dat spraakherkenning inmiddels in staat is om het tempo van de gesproken taal te volgen.

Dat is de conclusie van een onderzoek van wetenschappers aan de Stanford University en het Chinese internetbedrijf Baidu bij een dertigtal millennials die meer dan honderd zinnen spraken en intikten met behulp van de spraaktechnologie Deep Speech van Baidu of het toetenbord van de iPhone.

“Niet alleen kan spraakherkenning de snelheid van het gesproken woord volgen, maar ook bleek de technologie opmerkelijk minder fouten te maken dan het klavier,” zeggen de onderzoekers.

Bij gebruikers van het Mandarijns bleek spraakherkenning 1,5 keer minder fouten te maken dan het toetsenbord. Bij Engelstaligen bleek de spraakherkenning zelfs drie keer minder fouten te maken.

“Spraakherkenning belooft al decennia revolutionaire oplossingen, maar is tot nu toe nooit een succes gebleken,” benadrukt onderzoeksleider James Landay, professor computerwetenschappen aan de Stanford University. “De voorbije drie jaar heeft de technologie echter duidelijke vorderingen laten optekenen.”

“De spraakherkenning kon daarbij profiteren van de ontwikkeling van big data en deep learning om zijn netwerken te trainen, zodat snellere en meer accurate resultaten konden worden gegarandeerd.”

“Dat maakte het uiteindelijk ook mogelijk om de technologie met succes bloot te stellen aan de concurrentie van de millennial, die nochtans met digitale media is opgegroeid en bijzonder vertrouwd is met het klavier van de smartphone.” (mah)