На недавней демонстрации Mel AI продемонстрировала новый рубеж в области искусственного интеллекта с видео-персонажами, способными вести беседы и реагировать в реальном времени. В отличие от обычных статических аватаров или чат-боксов, эти персонажи ИИ включают в себя сложный стек взаимодействия, который включает синхронизацию голоса, движения губ и мимику. Их отличает способность распознавать и реагировать на окружение пользователя. Например, если пользователь находится в самолете или в другой обстановке, ИИ может соответствующим образом подстраивать свои ответы, усиливая чувство вовлеченности.
Эта инновация стала логичным продолжением успеха Character AI, основанной бывшими разработчиками Google/LaMDA Ноамом Шазиром и Даниэлем Де Фрейтасом, которые показали, что текстовые взаимодействия с персонажами могут стать полноценной формой развлечений. Однако будущее, похоже, связано с взаимодействиями в реальном времени, которые обеспечивают более насыщенный опыт. Хотя детали о том, сколько видеоконтента генерируется в реальном времени и сколько создается с помощью продвинутых анимационных техник, остаются неясными, влияние этой технологии ощущается весьма значительным.
С ростом спроса на интерактивные развлечения конкуренция среди разработчиков накаляется, стремясь создать персонажей ИИ, которые по-настоящему ощущаются как живые. Этот новый шаг от Mel AI представляет собой значительный прогресс в этой гонке, открывая захватывающие возможности для будущего интерактивных медиа.
Для тех, кто хочет испытать эту технологию на практике, ознакомьтесь с демонстрацией здесь.



