Hoe ziet de toekomst van spraaktechnologie eruit?

Steeds meer bedrijven spelen in op spraakgestuurde technologie. Spraak is immers de manier waarop we met elkaar communiceren. De komende jaren zullen we in toenemende mate in gesprek gaan met onze apparaten, onze huizen, onze auto's.

De verwachting is dat dit de belangrijkste manier van communicatie met onze technologie wordt. Gartner schat dat 30% van onze interactie met technologie in 2020 'gesprekken' met slimme apparaten zullen zijn. Ondanks veel recent succes in het verwerken van dagelijks taalgebruik, staat de communicatie tussen mens en machine nog altijd in de kinderschoenen. Spraaktechnologie wordt daarentegen al wel vaak gebruikt om te communiceren met smartphones. Zo blijkt uit onderzoek van Accenture dat 69% van de mensen de Google-assistent, Siri of Cortana op hun telefoon gebruikt. Kijkend naar de frequentie van de interactie, zien we dat meer dan de helft van hen ten minste één keer per maand spraaktechnologie gebruikt en 18% zelfs wekelijks. Naast het gebruik van spraaktechnologie zijn er ook diensten die deze technologie zich eigen kunnen maken. Zo toont ons Chat, Tap, Talk onderzoek, dat wij gezamenlijk met Cisco hebben uitgevoerd, aan dat 73% van de consumenten van mening is dat er nog veel ruimte is voor bedrijven om chatbots in te zetten om de klantervaring te verbeteren. Meer dan een kwart van hen (28%) geeft aan dat spraakgestuurde chatbots hierbij zullen helpen, vooral voor eenvoudige dingen zoals het checken van treintijden, het indienen van meterstanden en inchecken voor een vlucht. Dit betekent niet dat mensen volledig uit het proces moeten worden gehaald. Ondanks dat de consument hier ook een rol ziet voor spraaktechnologie, geeft 74% aan dat zij ervan overtuigd zijn dat menselijke controle en support blijvend moeten zijn.

Taal is een van 's werelds grootste en meest verwarrende datasets
Om een goed gesprek tot stand te brengen, moet de machine kunnen antwoorden – een gesprek is immers tweerichtingsverkeer. Dit vraagt om een verrassend complexe reeks vaardigheden, waaronder spraakherkenning, spraaksynthese, sentimentanalyse, gezond verstand en praktische kennis. Ze moeten allemaal samenwerken om te creëren wat we kennen als een 'gesprek'. Een van de grootste vorderingen in conversatietechnologieën zijn de deep learning algoritmes die door het gebruik van meerdere lagen patronen kunnen herkennen. Deze software zorgt ervoor dat de technologie steeds beter wordt. Ze putten uit enorme hoeveelheden echte menselijke dialogen, genereren verschillende mogelijke antwoorden en rangschikken ze op basis van de overeenkomsten met werkelijke menselijke reacties. Om vooruitgang te boeken, moeten ze echter leren van hun fouten. De fouten zijn soms enorm ongepast, waardoor risicomijdende merken het vaak op veilig spelen. Vaak gebruiken ze ofwel harde coderesponsen ofwel mensen om hun antwoorden op geschiktheid te controleren voordat ze naar klanten gaan. Machines die zijn opgeleid om een beperkt aantal taken uit te voeren, kunnen verrassend goed presteren, maar hun vaardigheden zijn vaak specifiek gericht op de sterke punten van hun fabrikanten. Alexa van Amazon is bijvoorbeeld gespecialiseerd in retail en entertainment, Google is sterk in zoeken en Siri, Bixby en Cortana zijn voornamelijk invoerapparaten voor de hardware waarop de technologie staat geïnstalleerd.

Wat houdt het succes tegen?
De recente demonstratie van Duplex, Google's nieuwe prototype spraakassistent, veroorzaakte veel discussie. Duplex maakte eenvoudige reserveringen via de telefoon waarin realistische menselijke spraak is nagebootst. Dit heeft een ethische discussie veroorzaakt, doordat zij deden alsof een machine menselijk is. Google heeft deze zorgen aangepakt en verzekert consumenten dat Duplex het duidelijk zal maken dat de gesprekspartner een machine is. Zoals ons Chat, Tap, Talk onderzoek aantoont, staan veel dingen de werkelijke toepassing van spraaktechnologie in de weg: onduidelijke verwachtingen, gebrek aan langetermijngeheugen, geen begrip van klantgerichtheid en gebrek aan begeleiding. Gebruikers kunnen hierdoor gefrustreerd raken, wat waarschijnlijk de oorzaak is van de snel teruglopende gebruikersaantallen binnen het huidige aanbod van spraakassistenten.

Tot op de dag van vandaag wordt spraaktechnologie beperkt gebruikt en vindt gebruik vaak plaats in privéruimtes. 22% van de ondervraagden in de studie van J. Walter Thompson en Mindshare Future zegt zich te schamen voor het gebruik van spraakinterfaces in het openbaar. Ook geven ze aan dat ze bang zijn dat andere mensen hen afluisteren (vooral bij gevoelige interacties zoals bankieren). Het kan dus enkele jaren duren voordat er kletsen met Siri of Cortana als sociaal aanvaardbaar wordt gezien.

BTG: Verbinding, verbreding en verdieping

Branchevereniging ICT en Telecommunicatie Grootgebruikers (BTG) behartigt de belangen van Nederlandse bedrijven en instellingen door kennis over te dragen en ervaringen uit te wisselen o.a. tijdens events

BTG in beeld en geluid

Expertsessies

  • Geen evenementen
  • Magazine

    BTG in Business - Voorjaar 2022
    Lees de laatste editie

    Meld je aan voor onze nieuwsbrief!

    Op de hoogte blijven van evenementen en het laatste nieuws? Schrijf je dan nu in voor onze nieuwsbrief.
    • Dit veld is bedoeld voor validatiedoeleinden en moet niet worden gewijzigd.