Академия Яндекса: Визуально-языковые модели для навигации и манипуляции / Иван Лаптев, MBZUAI, Visio HD

00:41:37
Академия Яндекса: разработка 381 ролик
248 просмотров
Визуально-языковые модели для навигации и манипуляции / Иван Лаптев, MBZUAI, Visio.
В последнее время компьютерное зрение достигло больших успехов в классификации, сегментации и текстовом описании изображений. Но нынешние методы всё ещё далеки от понимания визуальных сцен. Что произойдёт, если стакан сдвинуть за границу стола? Какие действия нужны, чтобы посадить дерево? Создание систем, которые смогут отвечать на подобные вопросы по входным изображениям сцен, откроет большие возможности для будущих приложений робототехники и персональных визуальных ассистентов.
О моделях и методах обучения для визуальной навигации и манипуляции расскажет Иван Лаптев, приглашённый профессор MBZUAI, руководитель исследований в VisionLabs.
Подробнее о докладе и спикере: yatalks.yandex.ru/ru/program/vizualno-yazykovye-modeli-dlya-navigaczii-i-manipulyaczii.
Доклад в текстовом формате — в контент-хабе конференции: yatalks.yandex.ru/ru/hub/vizualno-yazykovye-modeli-dlya-navigaczii-i-manipulyaczii.
О моделях и методах обучения для визуальной навигации и манипуляции расскажет Иван Лаптев, приглашённый профессор MBZUAI, руководитель исследований в VisionLabs.
Подробнее о докладе и спикере: yatalks.yandex.ru/ru/program/vizualno-yazykovye-modeli-dlya-navigaczii-i-manipulyaczii.
Доклад в текстовом формате — в контент-хабе конференции: yatalks.yandex.ru/ru/hub/vizualno-yazykovye-modeli-dlya-navigaczii-i-manipulyaczii.
развернуть свернуть