Компания Thinking Machines Lab, основанная бывшим техническим директором Mira Murati, представила новую исследовательскую разработку под названием TML-Interaction-Small. Ее главная особенность заключается в том, что модель работает по принципу "полного дуплекса" – то есть может одновременно слушать собеседника и формировать ответ. Об этом пишет TechCrunch.
Сможет ли ИИ наконец говорить как человек?
Это серьезно отличается от того, как работает абсолютное большинство современных чат-ботов, включая решения от OpenAI и Google. Сейчас взаимодействие с искусственным интеллектом построено по очередному сценарию: пользователь говорит или вводит запрос, система его обрабатывает, после чего генерирует ответ. Другими словами, это напоминает переписку в мессенджере.
Thinking Machines хочет превратить такое взаимодействие в настоящий разговор, больше похожий на телефонный звонок, где собеседники могут реагировать почти мгновенно, перебивать друг друга, уточнять и корректировать сказанное прямо во время диалога.
Почему "полный дуплекс" важен для развития AI?
Технология full duplex давно используется в телекоммуникациях, однако для генеративного искусственного интеллекта это достаточно сложная задача.
Проблема заключается в том, что современные языковые модели преимущественно работают последовательно. Они сначала полностью получают входной сигнал, обрабатывают его, а уже потом начинают формировать ответ. Такой подход создает паузу, которая часто делает разговор неестественным. В Thinking Machines утверждают, что их модель способна отвечать с задержкой что их модель способна отвечать с задержкой всего 0,40 секунды. Это очень близко к естественной скорости человеческой реакции в живом разговоре.
По словам компании, этот показатель превосходит результаты аналогичных систем, которые сейчас разрабатывают крупнейшие игроки рынка. Если эти цифры подтвердятся в реальном использовании, это может означать важный технологический шаг для всей индустрии.
Не готовый продукт, а исследовательский эксперимент
Несмотря на амбициозные характеристики, Thinking Machines пока не запускает продукт для массового пользования. Компания отмечает, что TML-Interaction-Small пока является лишь исследовательским превью. Ограниченный доступ для исследователей и партнеров планируют открыть в течение ближайших нескольких месяцев, а широкий релиз ожидается позже в этом году.
Как пишет The Verge, это означает, что оценить реальный пользовательский опыт пока невозможно. Публичные демонстрации и внутренние бенчмарки могут выглядеть убедительно, но только массовое тестирование покажет, способна ли система работать стабильно в реальных сценариях.
Почему за этим проектом внимательно следит индустрия?
Появление Thinking Machines вызывает особое внимание из-за фигуры ее основательницы. После работы в OpenAI Мира Мурати считается одной из ключевых фигур, участвовавших в развитии современных генеративных моделей.
Тот факт, что ее новая компания сразу фокусируется не просто на увеличении мощности моделей, а на изменении самой природы взаимодействия между человеком и машиной, может свидетельствовать о новом направлении развития отрасли. Главная идея проекта заключается в том, что интерактивность не должна быть дополнительной надстройкой над языковой моделью. Она должна быть заложена в саму архитектуру системы.
Именно это может стать следующим большим этапом эволюции AI – переходом от чат-ботов, отвечающих на команды, к цифровым собеседникам, способных поддерживать настоящий живой диалог. Пока что остается главный вопрос: подтвердятся ли технические заявления компании после выхода модели за пределы лабораторных тестов. Ответ на него рынок может получить уже до конца года.
