ИИ еще умнее

На этой неделе в шестой раз вручили научную премию Yandex ML Prize. Награды получили 14 ученых, чьи работы оказались самыми перспективными и значимыми в области машинного обучения, анализа данных и искусственного интеллекта. Среди них и исследования в области когнитивной робототехники, которые могут изменить нашу жизнь.

Когда компания OpenAI, возглавляемая Сэмом Альтманом, представила массовой аудитории большую генеративную модель ChatGPT, это было как гром среди ясного неба. За пять дней после запуска чат-бота им воспользовался 1 млн человек. А Билл Гейтс сравнил создание ChatGPT по значимости с изобретением компьютера и интернета. Однако, несмотря на кажущуюся новизну, нейросети существуют десятки лет. Они старше многих современных исследователей и разрабатывались задолго до сегодняшнего ажиотажа.

Одна из первых в мире нейронных сетей появилась 66 лет назад. Перцептрон — так назвал ее создатель, американский ученый в области психологии, нейрофизиологии и искусственного интеллекта Фрэнк Розенблатт. При этом попытки создать машину, способную имитировать мыслительный процесс человека, уходят корнями еще в 1940-е годы.

Что-то очень похожее ожидает нас в когнитивной робототехнике — науке о создании умных роботов, которые не просто выполняют запрограммированные команды, но и могут учиться на собственном опыте, адаптироваться к изменениям в окружающей среде и принимать решения. Когнитивные роботы уже существуют, но пока они остаются доступными в основном исследовательским лабораториям. Поэтому сейчас и популярны шутки в стиле: «ИИ должен был выполнять задачи по дому, а вместо этого я мою посуду, а нейросеть пишет стихи». Но в обозримой перспективе когнитивные роботы покинут лаборатории и станут частью повседневной жизни. И поначалу вызовут такую же волну удивления, какую в свое время вызвал генеративный ИИ.

Сегодня всё, что отделяет нас от широкого использования когнитивных роботов, — это создание более надежных инструментов, обеспечивающих связь между генеративным искусственным интеллектом, который у нас есть, и физическими роботами, которые у нас тоже давно имеются. Более того, в когнитивную робототехнику сейчас инвестируются колоссальные суммы, крупнейшие корпорации, которые сами по себе богаче многих стран, тоже активно включились в разработки. В 2023 году объем рынка когнитивной робототехники уже оценивался в $5,44 млрд. О заинтересованности в рынке крупных корпораций говорит и недавняя презентация SpaceX, запечатлевшая роботов Илона Маска.

В лаборатории Intelligent Space Robotics Lab «Сколтеха» под научным руководством Дмитрия Тетерюкова мы наделили робота-собаку способностью планировать свое поведение и выполнять сложные задачи. Он продемонстрировал способность воспринимать команды, манипулировать объектами и планировать действия. Например, он может выполнить команду «положить мячик на карту страны, где протекает река Ганг» или «положить банан на салфетку того же цвета». Особенно показателен случай, когда CognitiveDog потребовалось принести одежду, подходящую для погоды. Робот подошел к окну, проанализировал погоду на улице, выбрал подходящую вещь и принес ее. Для робота это невероятно сложная задача, требующая координации множества навыков и данных. Это больше, чем достижение для лаборатории, — это важный шаг в будущее когнитивных роботов для повседневного использования.

Когнитивные роботы смогут найти применение во многих сферах, от тяжелой промышленности до решения бытовых задач. В производственных условиях — автономно проверять оборудование, выявлять неисправности и даже выполнять простое техническое обслуживание. Например, анализировать оборудование на предмет износа и передавать данные для профилактических ремонтных работ, что позволяет минимизировать вероятность поломок и аварийных ситуаций. В фармацевтике такие роботы смогут выполнять сложные задачи контроля качества: мониторить производственные линии, обнаруживать отклонения в производственном процессе (например, изменение температуры или состава химических веществ) и адаптировать свои действия, чтобы минимизировать риски брака.

Еще одной перспективной технологией можно назвать управление роями умных роботов при помощи генеративного искусственного интеллекта, когда задание формируется не для каждого устройства по отдельности, а для всех в целом. Такие рои могут применяться на строительных объектах, в геологоразведке, а также при исследовании других планет, что открывает колоссальные возможности для науки и промышленности. Например, уже сейчас исследователи из университета Аризоны разрабатывают рои роботов для добычи ресурсов на Луне. Эти автономные рои смогут выполнять такие задачи, как бурение и строительство, на поверхности спутника без постоянных инструкций с Земли.

Нашей лабораторией был создан один из первых в мире масштабируемых инструментов для управления роем квадрокоптеров на естественном языке, в котором задание формируется не для каждого квадрокоптера по отдельности, а для всего роя в целом. Мы представили его в работе FlockGPT: Guiding UAV Flocking with Linguistic Orchestration. Ключевой вывод: система управления на основе генеративных нейросетей продемонстрировала высокий уровень контроля над роем со стороны пользователей. Например, роботы смогли сформировать в воздухе такие фигуры, как куб и сфера, создать в небе образ Сатурна с кольцами и даже указать направление на север — всего лишь на основе текстового запроса, такого как «сгенерируй Сатурн» или «покажи, где находится север». А в будущем рои, управляемые пользователями через генеративные нейросети, смогут выполнять самые сложные задачи во многих сферах экономики и повседневной жизни.

Автор — аспирант «Сколтеха», лауреат премии Yandex ML Prize

Позиция редакции может не совпадать с мнением автора

Читайте на 123ru.net