Компания Thinking Machines, которую возглавляет бывший технический директор OpenAI Мира Мурати, объявила о начале разработки принципиально новой технологии — «интерактивных моделей» (interaction models).

По словам создателей, эти модели позволят пользователям взаимодействовать с искусственным интеллектом так же естественно, как с другим человеком. В отличие от существующих решений, которые требуют завершения ввода текста или речи для начала обработки, новые модели работают в режиме реального времени.

Как объясняют в Thinking Machines, современные модели воспринимают реальность в одностороннем порядке: они ждут, пока пользователь полностью завершит ввод, не имея возможности анализировать его действия или контекст в процессе. Новые же «интерактивные модели» способны:

  • Анализировать аудио — распознавать речь и интонации в режиме реального времени;
  • Обрабатывать видео — отслеживать жесты, мимику и движения;
  • Воспринимать текст — моментально реагировать на ввод, не дожидаясь его завершения;
  • Генерировать ответы и действия — оперативно взаимодействовать с пользователем, адаптируясь к его поведению.

Таким образом, новая технология обещает сделать общение с ИИ более естественным, динамичным и интуитивным, открывая новые возможности для применения искусственного интеллекта в повседневной жизни.

Источник: The Verge