Машинное обучение в распознавании трехмерных объектов

Машинное обучение в распознавании трехмерных объектов

Машинное обучение в распознавании трехмерных объектов

03 мая
Покажи другу:

За последние годы компьютерные программы значительно преуспели в анализе визуального контента и представлении его в виде данных. Так, например, открытый проект-игра «Quick, Draw» от компании Google использует нейронную сеть в онлайн-приложении способном угадывать объекты по мере составления рисунка пользователем. Однако, на данном этапе развития подобные приложения лучше всего подходят для среды двумерных изображений. Распознавание объектов в трехмерном пространстве – задача посложней.

По заявлению журнала MIT Technology Review, ученые из Стэнфорда, Принстона и Мюнхенского технического университета во всю работают над решением этой проблемы, создавая самую обширную открытую библиотеку доступных аннотированных 3D‑данных, которые, в свою очередь, будут использоваться для обучения нейронных сетей с использованием технологии «глубинного обучения». Библиотека изображений получила название ScanNet и позиционируется как своего рода продолжение проекта ImageNet.

В состав библиотеки входят миллионы объектов с аннотациями, например, «журнальные столики, кушетки, лампы и телевизоры», расположенные в тысячах 3D-сцен. Как описано в научной работе, исследователи собрали ее объединив сканы сцен, сделанных при помощи RGB‑камеры и датчика глубины. Аннотации сцен производились силами добровольцев.

Хорошая новость в том, что команде удалось применить глубинное обучение с весьма обнадеживающими результатами. Обученная нейронная сеть может успешно распознавать множество объектов, используя в качестве источника лишь информацию о глубине.

Хотя пока еще рано говорить о безупречности работы системы, у технологии есть свои четкие цели и области применения. Во-первых, она поможет роботам распознать разницу между двумя объектами: например, кухонным столом, который необходимо избежать, и тем, с которым вы хотите, чтобы робот взаимодействовал, скажем, чашкой на этом столе. Нейронные сети также могут использоваться в проектировании и в приложениях для управления предприятиями, в которых они будут обрабатывать определенный набор 3D‑данных и экспортировать детализированные модели, созданные из дискретных геометрических объектов.

Учитывая скорость, с которой функционируют современные компьютерные программы для работы с визуальной информацией, вполне возможно, что в ближайшем будущем мы сможем стать свидетелями (и пользователями) приложения, способного считывать информацию с 3D‑датчиков в реальном времени и распознавать тип импортируемых данных. Подобная технология обладает большим потенциалом для изменения нашего образа жизни.

Источник: http://www.spar3d.com/blogs/the-other-dimension/giant-library-3d-images-will-teach-machines-recogniz...





Комментарии (0)


Чтобы оставить комментарий вам необходимо авторизоваться


количество
пользователей

1837

количество
работ

4266