В Токийском университете работа Alter3 соединилась с GPT-4 для возможности его программирования голосом.
30.12.23
Команда исследователей из Токийского университета достигла значительного прогресса в области робототехники, объединив обширную языковую модель GPT-4 и Alter3. Это инновационное сочетание позволяет выполнять более реалистичные жесты и программироваться на естественном языке, отказываясь от традиционных аппаратно-зависимых систем управления. Alter3, гуманоидный робот, получил способность к выполнению сложных движений верхней части тела и имитации эмоций на лице.
Ученые назвали этот прогресс «сменой парадигмы» в области робототехники. Благодаря GPT-4, робот может изучать и выполнять различные задачи, такие как селфи, игра в бейсбол, поедание попкорна или игра на воображаемой гитаре, просто слушая естественные языковые инструкции. Раньше для таких задач нужно было кодировать конкретные инструкции для каждого действия, а теперь робот может взаимодействовать с помощью языка, что делает взаимодействие более эффективным и человекоцентричным.
Ученые высказывают мнение, что сейчас можно осуществлять прямое управление роботом, передавая лингвистические выражения человеческих действий через программный код. Это расширяет способности взаимодействия меж человеком и роботом. Этот прорыв в области робототехники открывает перспективы создания более интеллектуальных, адаптивных и персонализированных робототехнических сущностей. В работе Alter3 установлена камера, позволяющая ему «видеть» людей и совершенствовать свое поведение, анализируя их реакции. В одном сценарии робот демонстрирует, что ест пакет попкорна, но потом оказывается, что попкорн принадлежит сидящему рядом человеку. Выражения лица робота и движения руки передают удивление и стыд.
Использование речевых моделей в исследованиях робототехники делает процесс координации многих суставов работ гораздо проще. Ученые могут давать вербальные инструкции, описывающие варианты движения, и получать программный код для запуска двигателя робота. Это освобождает от рутинной работы, которая заключается в программировании каждого отдельного движения для 43 осей, и позволяет исследователям быстрее, плавнее и точнее настраивать и совершенствовать движения работа со временем.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Лучшие колонки
Топ-5 критериев выбора беспроводной колонки: Мощность – для комнаты хватит 10–20 Вт, для вечеринок лучше 40 Вт и выше. Автономность – оптимально от 12 часов, а если планируешь долгие прогулки или путешествия, ищи модели с 20–30 ч работы. Защита корпуса – стандарты IPX7 или IP67 гарантируют устойчивость к пыли и воде, что важно для использования […]
NVIDIA Blackwell – архитектура с новыми возможностями для ИИ и создания контента
Технологии NVIDIA, которые были доступны только владельцам профессиональных видеокарт, стали открыты для обычных пользователей. Расскажем о возможностях архитектуры Blackwell в области искусственного интеллекта и создания контента.

Garmin Instinct Crossover — гибридные смарт-часы с экраном AMOLED, фонариком и сапфировым стеклом стоят $600 умные часы
Garmin Instinct Crossover получили 1,2-дюймовый AMOLED-дисплей с аналоговыми стрелками RevoDrive, покрытыми люминесцентным составом Super-LumiNova.

