group-telegram.com/ultimate_engineer/536
Last Update:
Прототипы гуманоидных роботов уже умеют делать сальто, носить тяжести и распознавать предметы, но приготовить яичницу им по-прежнему сложно — и дело не только в «железе».
В отличие от больших языковых моделей вроде ChatGPT, которым достаточно текста или изображения, робот должен оперировать реальными объектами. И вот тут начинаются трудности. Без «заземления на среду» он не сможет достать яйца из холодильника и не найдет солонку в шкафу.
Ещё более сложная задача — whole-body control, то есть координация движений всего тела робота. Если человеку взять предмет на ходу не составляет труда, то для гуманоида это настоящий подвиг, требующий быстрых расчётов и идеальной синхронизации механики.
Решения ищут в комбинации подходов: обучение с подкреплением даёт навык, графовые модели помогают ориентироваться в пространстве, а многослойные системы вроде Vision-Language-Action (VLA) учат связывать абстрактные команды с конкретными действиями. Но разрыв между виртуальной симуляцией и реальной средой (sim-to-real gap) пока остаётся.
О том, как гуманоидные роботы осваивают человеческие манипуляции, адаптируются к непредсказуемой среде и учатся на собственных ошибках, мы поговорили с Алексеем Ковалёвым, руководителем группы «Воплощённые агенты» Лаборатории когнитивных систем AIRI и доцентом Центра когнитивного моделирования МФТИ.
Читать интервью
#робототехника #персоны #ML
@ultimate_engineer