Thinking Machines, het AI-bedrijf van Mira Murati – voormalig technisch directeur van OpenAI – heeft maandag een baanbrekend project aangekondigd: interactiemodellen. Deze technologie moet de manier waarop mensen met kunstmatige intelligentie communiceren fundamenteel veranderen.

Volgens Thinking Machines zijn huidige AI-systemen beperkt omdat ze de werkelijkheid slechts in één draad verwerken. Zolang een gebruiker typt of praat, wacht de AI zonder inzicht in diens gedrag of intenties. Interactiemodellen doorbreken deze beperking door realtime audio, video en tekst te integreren en direct te reageren op menselijke interacties.

Het bedrijf legt uit: "Tot nu toe ervaren AI-modellen de wereld in een lineair proces. Pas wanneer de gebruiker klaar is met typen of praten, begint de AI met verwerken. Dat verandert met interactiemodellen. Ze nemen continu input waar, analyseren deze in realtime en reageren naadloos, net zoals mensen onderling samenwerken."

Hoe werken interactiemodellen?

De technologie achter deze modellen is gebaseerd op geavanceerde multimodale verwerking. Dit betekent dat AI niet alleen tekst kan begrijpen, maar ook:

  • Geluidsinvoer: Spraakherkenning en -analyse in realtime.
  • Visuele invoer: Camera’s of beeldverwerking om gebaren, gezichtsuitdrukkingen en omgeving te interpreteren.
  • Tekstuele invoer: Traditionele chat- of tekstverwerking, maar nu geïntegreerd met andere inputbronnen.

Deze combinatie stelt AI in staat om contextueel bewustzijn te ontwikkelen: het begrijpt niet alleen wat er wordt gezegd, maar ook hoe het wordt gezegd en in welke situatie. Dat maakt interacties met AI natuurlijker en intuïtiever.

Toepassingen in de praktijk

Thinking Machines ziet talloze mogelijkheden voor deze technologie, waaronder:

  • Klantenservice: AI-assistenten die gesprekken voeren alsof ze met een mens praten, met inbegrip van toon, pauzes en emotie.
  • Onderwijs: Interactieve leeromgevingen waar studenten vragen stellen en directe feedback krijgen, inclusief visuele uitleg.
  • Gezondheidszorg: Medische AI die patiënten observeert via camera’s en spraak, en direct reageert op ongebruikelijke symptomen.
  • Bedrijfsautomatisering: Vergaderingen waar AI notulen maakt, actiepunten identificeert en zelfs suggesties doet op basis van stemgeluid en lichaamstaal.

"We willen AI niet langer zien als een tool die wacht tot de gebruiker klaar is, maar als een partner die actief meedenkt en meewerkt," aldus een woordvoerder van Thinking Machines. "Interactiemodellen maken van AI een écht collaboratief systeem."

Uitdagingen en toekomst

Hoewel de belofte groot is, zijn er nog uitdagingen. Denk aan privacy – realtime verwerking van audio en video roept vragen op over gegevensbescherming. Daarnaast moet de technologie robuust genoeg zijn om in complexe, dynamische omgevingen te functioneren.

Thinking Machines werkt momenteel aan de eerste prototypes en hoopt binnen enkele jaren een werkend product te presenteren. Murati, die eerder een sleutelrol speelde in de ontwikkeling van tools als DALL·E en ChatGPT, benadrukt dat deze stap de AI-industrie naar een nieuw tijdperk kan tillen.

"Dit is geen kleine verbetering, maar een fundamentele verschuiving in hoe we AI benaderen," zegt Murati. "We gaan van systemen die reageren naar systemen die anticiperen."