Новости по-русски

Актуальная наука: компьютерное зрение

Актуальная наука: компьютерное зрение

Как научить компьютер хорошо видеть?

Говорят, правильно рассматривать картины именно так – прикрыв один глаз. Мол, так наш мозг лучше улавливает перспективу, игру света и теней. А вот компьютерный интеллект думает по-другому. Для него тоже важно расстояние до предмета, но чем больше он распознает за раз, тем четче воспроизведет на экране увиденное.

Знакомьтесь: Артем Маковецкий, кандидат физико-математических наук. Ученый вместе со своими коллегами и студентами Челябинского госуниверситета занимается как раз этой интересной отраслью знаний. Именно благодаря тому, что однажды математики научили компьютер видеть, сегодня мы можем наблюдать вещи, которые до этого были непостижимы. Например, когда современный автомобиль без помощи своего хозяина самостоятельно находит место для парковки, а потом с невероятной виртуозностью занимает данную позицию.

"Компьютерное зрение – это фактически реализация трехмерного объекта с помощью двумерной матрицы, отражающей интенсивность света данного объекта, – объясняет Артем Маковецкий, кандидат физико-математических наук, доцент ЧелГУ. – Фактически, компьютерное изображение – это матрица чисел".

Получается, чтобы быть посвященным в таинство работы с изображением, главное – научиться разбираться в этих матрицах. В Челябинском госуниверситете организована специальная лаборатория анализа подобной информации. Как и во всем мире сегодня, ее сотрудники ставят перед собой задачи научить компьютер точно распознавать объекты и пространство. Фактически это нужно для того, чтобы автоматически обрабатывать огромные объемы фотографических данных. Которые каждую секунду поступают, например, на сервер Госавтоинспекции с камер наружного наблюдения, или, что, пожалуй, еще интереснее, – снимки со спутников Земли. Для этого в ЧелГУ смоделировали линейный обнаружитель. С помощью него темные квадраты на зеленом фоне или даже туманно-серая неизвестность превращается в автопарковку или толпу хаотично перемещающихся людей.

"Если мы знаем характер искажения и параметры шума, то можно восстановить фотографию практически из мешанины, – делится Артем Маковецкий. – И лицо можно восстановить".

Первые достижения в области компьютерного зрения были связаны с военными и космическими программами. Для первых – нужно было разработать систему ориентации в пространстве баллистических ракет, для вторых – рассчитать точную модель стыковки кораблей при старте и посадке. А началось все в середине прошлого века.

"Наверное, такой первый очевидный факт применения компьютерного зрения связан с появлением искусственных нейронных сетей. И это был прибор, который распознавал написанные вручную цифры от 0 до 10", – рассказывает Владимир Горшенин, руководитель научно-исследовательской группы компании Pressfoto.

Но если абстрагироваться от цифр, аналог компьютерного зрения нужно искать в природе. Ведь у машин все, как у людей, а у людей – как у зверей.

Как видит компьютер... Пожалуй, есть что-то общее со зрением пчелы. Оно похоже на мозаичное: "глаз" компьютера воспринимает лишь частичку поля зрения и целое складывается из сотен ранее запомненных маленьких картинок. Или, например, компьютерное восприятие мира можно сравнить с взглядом мясника, который смотрит на корову.

Понимание этого позволило сначала зарубежным исследователям, а затем и нашим программистам реализовать ряд интереснейших идей. Следующим образовательным этапом для машины стало умение понимать, кто стоит перед ней.

"То есть точность распознавания пола у нас порядка 90-95%, возраста – 80-85%. Он меня определил, что я девушка, и показывает мне женскую рекламу, то есть духи", – демонстрирует Ирина Магденко, руководитель проекта видеоаналитики компании 3DiVi.

Почему рекламу, потому что первыми на эту возможность машины тут же откликнулись маркетологи. И беспроводную систему распознавания не только лица, но еще пола и возраста решили совместить со стационарными стендами видеопрезентаций различных фирм в супермаркетах. Чтобы ролик компании работал на потенциального потребителя и бил точно в цель, а не крутился день напролет без очевидной финансовой выгоды.

А это директор по развитию той же компании. "Это смартфон и очки виртуальной реальности", – показывает Дмитрий Морозов, директор по развитию компании 3DiVi.

Он вовсе не почивает на лаврах и не позволяет себе расслабиться в рабочее время. Вставив смартфон в эти специальные окуляры, он погружается в мир виртуальной реальности по долгу службы. Игры – второй тренд мировых разработчиков, обучающих машины видеть мир. Оба направления объединяет уникальное решение, созданное на Южном Урале. Все это можно сделать без проводов и других специальных устройств, кроме вот этого сенсора.

"Наш сенсор работает в качестве блютус-периферийного устройства, то есть никаких проводов не требуется, компьютеров, не требуется нательных датчиков для того, чтобы распознать движение игрока. Подключаясь к любому андроид-шлему виртуальной реальности, вы имеете возможность увидеть свое виртуальное тело, взаимодействовать с объектами в виртуальном мире и управлять своими жестами, передвижением без каких-то клавиатур или других периферийных устройств", – информирует Дмитрий Морозов, директор по развитию компании 3DiVi.

И не надо относиться к играм легкомысленно. Это пусть пока нам предлагают полетать, как птицы, или прицелиться из лука, года через два разработчики готовы пригласить нас на виртуальный урок танцев или лекцию по химии с непременной возможностью произвести опыт с реактивами.

"Компьютерное зрение – это небольшая часть общего направления, которое называется машинное обучение. Смысл в том, что если мы можем предоставить отдельный образец какого-то объекта. Есть много готовых алгоритмов о том, как научить машину отличать один образец от другого. Это могут быть аудиозаписи, количественные характеристики. Например, мы можем научить машину делать прогнозы курсов валют или котировок акций", – говорит Владимир Горшенин, руководитель научно-исследовательской группы компании Pressfoto.

Все это вопросы ближайшего будущего, ведь через 10 лет подобные технологии, по прогнозам математиков, станут привычной частью нашей жизни. Сейчас Школы машинного обучения работают помимо Челябинска в Екатеринбурге, Москве и Новосибирске. Быть может, программистам в них даже удастся научить компьютер осязать, чувствовать вкус и запах, ведь слышать и, главное, теперь и видеть его уже научили.

Возможности компьютерного зрения безграничны – это уже понимают ученые, правда, пока не все могут претворить в жизнь. Главное из достижений ближайшего будущего – беспилотные грузовики российского производства. Над этим сейчас трудятся наши инженеры. Фантастика? Уже нет!

Читайте на 123ru.net