Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://imaging.cs.msu.ru/~yurin/Research_problems_for_students.html
Дата изменения: Mon Nov 24 13:02:07 2008 Дата индексирования: Mon Oct 1 19:47:29 2012 Кодировка: Windows-1251 |
Home People Activities Research Publications |
|
Dmitry V. Yurin personal pageНаучно-исследовательские задачи, решением которых могут заняться мои студентыМои научные интересыМои научные интересы включают в себя задачи восстановления трехмерных сцен по набору цифровых изображений, построение мозаик (панорам) и сегментацию изображений. Это также влечет за собой ряд сопутствующих задач.
Краткий обзор методов восстановления трехмерных сценВ настоящее время разработано большое количество разнообразных подходов к решению задачи восстановления трехмерных сцен по их двумерным изображениям. Эти подходы можно подразделить на:
ЗадачиВосстановление 3D по фотографиям, получаемым с помощью стереоприставки "Loreo 3D Lens in a Cap" Поиск и сопоставление плоских фрагментов трехмерной сцены (городские пейзажи) на основе анализа точек пересечения пучков прямых линий, принадлежащих двум разным исчезающим точкам Поиск и сопоставление плоских фрагментов трехмерной сцены на основе объединения подходов поиска характеристических точек (SIFT) и метода, предложенного Zokai, Wolberg 2005 Восстановление 3D по виртуальным точкам, образованным пересечением линий , найденных (Edge detector) на изображениях с эпиполярными линиями Разработка алгоритма детектирования характеристических точек и их сопоставления для цветных изображений Разработка хорошего алгоритма детектирования линий (границ) на изображениях Восстановление 3D по одному изображению на основе анализа прямых линий (миры Манхеттена и Атланты) Обнаружение и маркирование на изображениях областей, соответствующих растительности и водным поверхностям
Восстановление 3D по фотографиям, получаемым с помощью стереоприставки "Loreo 3D Lens in a Cap"Фирма Loreo (www.loreo.com) выпускает стерео насадку, которая устанавливается на ряд моделей фотоаппаратов (в частности Canon EOS) вместо объектива. См. рисунок:Насадка содержит два маленьких объектива (линзы) перед каждым из которых находится по перископу. Таким образом на фоточувствительную матрицу проецируется одновременно два изображения, каждое на свою половину матрицы. Размер стерео насадки (перископов) таков, что две части изображения соответствуют расстоянию между точками наблюдения примерно 7 см., т.е. такому же как и расстояние между глазами человека. Пример получаемого изображения (уменьшенный) приводится на рисунке. Цель работы состоит в том, чтобы научиться создавать по таким изображениям трехмерную модель (например VRML). Первоочередные задачи, которые требуют решения:
Поиск и сопоставление плоских фрагментов трехмерной сцены (городские пейзажи) на основе анализа точек пересечения пучков прямых линий, принадлежащих двум разным исчезающим точкам.На изображениях городских сцен обычно присутствует большое количество прямых линий, многие из которых в трехмерном мире параллельны. Такие параллельные линии на изображениях сходятся в одной точке (vanishing point), которая только в редких случаях оказывается на бесконечности (линии на изображении тоже параллельны). Области, где много параллельных линий, принадлежащих двум разным исчезающим точкам, потенциально могут являться структурами типа окон дома. Наличие в этой области двух разных пучков прямых линий позволяет оценить матрицу гомографии (проективного преобразования), переводящей этот фрагмент изображения в проекцию соответствующую такой, как будто оптическая ось объектива при съемке была перпендикулярна плоскости объекта (естественно только в том случае, если гипотеза о плоскости была верна). Проверить гипотезу можно прямым вычислением корреляции найденных потенциально плоских фрагментов изображений.Если между двумя изображениями найдено два таких не параллельных плоских участка, соответствующих друг другу, отсюда можно найти эпиполярную геометрию и вычислить фундаментальную матрицу. После этого для остальных областей изображений можно восстанавливать 3D стандартными способами, а для сопоставленных плоских участков задача уже решена.
Поиск и сопоставление плоских фрагментов трехмерной сцены на основе объединения подходов поиска характеристических точек (SIFT) и метода, предложенного Zokai, Wolberg 2005.Существенным элементом задачи является то, что после верного сопоставления некоторых регионов, их можно пытаться экстраполировать и по большей области снова применять тот же метод (Zokai, Wolberg 2005) для уточнения параметров модели. На приведенном рисунке, в частности результатом будет веро сопоставленная вся площадь фасада, включая нахождение его границ.
Восстановление 3D по виртуальным точкам, образованным пересечением линий , найденных (Edge detector) на изображениях с эпиполярными линиями.Обычно количество найденных характеристических точек на изображениях и количество верно сопоставленных таких точек между двумя и более изображений недостаточно для построения адекватной трехмерной модели (триангуляция по точкам с построением сеточной модели, меша). С другой стороны, если таких точек хватило для восстановления эпиполярной геометрии (фундаментальной матрицы, обычно достаточно порядка 100-400 соответствий при проценте ошибочно установленных соответствий менее 40%), то можно построить дополнительные точки, как пересечение эпиполярных линий с линиями найденными на изображениях. Таких точек получится много, более того - они лежат в "интересных" местах - на границах объектов. Здесь следует заметить, что детекторы характеристических точек обычно находят и сопоставляют точки на локально плоских участках сцены, что естественно при построении сеточной модели приводит к срезанию углов и непохожести полученной модели на оригинал. Дополнительными ограничениями, позволяющими проверить адекватность сопоставления таких виртуальных точек является принцип непрерывности линии - как в 2D, так и в 3D. Если изображений больше 2 - такая проверка становится еще более достоверной, практически стопроцентной надежности.
Разработка алгоритма детектирования характеристических точек и их сопоставления для цветных изображений.Задачи восстановления эпиполярной геометрии, стерео на основе характеристических точек и восстановления 3D по большому количеству кадров (Shape from Motion) рассмотренные выше существенно завязаны на поиск и сопоставления характеристических точек. Это- основа, и для нее естественно требуется хороший детектор точек. В настоящее время наиболее успешными являются детекторы SIFT и SURF. Их недостатком является то, что они работаю по серым изображениям. Так как изображения обычно цветные, пренебрежение цветовой информацией представляется неоправданной. Так, например если на изображениях имеется два автомобиля красный и зеленый - глупо уходить в тонкости анализа текстур не ограничив сразу, что зеленое должно соответствовать зеленому, а красное красному. Цвет в данном случае важнее, чем мелкие различия в форме радиатора. Кроме того, при переводе изображений в серые, некоторые хорошо видимые детали могут стать неразличимыми или слабо заметными. Предлагается учитывая огромный опыт известных детекторов разработать свой метод, применимый как для серых так и цветных изображений.
Разработка хорошего алгоритма детектирования линий (границ) на изображениях.В задачах о восстановлении городских сцен, виртуальных точках, упоминавшихся выше и 3D по одному изображению (следующая) существенно важен хороший детектор линий. Предлагается его разработать и реализовать в виде отлаженной библиотечной процедуры. Для этого требуется интегрировать накопленный мировой опыт в единую систему. Все подробности достаточно хорошо описаны в списке основной литературы в разделе Edge detection. Дополнительно, можно построить хороший алгоритм сегментации изображений, который полезен как сам по себе, так и в задачах восстановления трехмерных сцен. Основная идея - Выбираются хорошие линии (длинные, ярки, гладкие), пиксели, прилежащие к границе рассматриваются как источник и приемник в задаче максимального потока в сети.
Восстановление 3D по одному изображению на основе анализа прямых линий (миры Манхеттена и Атланты).В том случае, когда трехмерная сцена образована прямыми линиями( помещения, городские пейзажи) часто возможно восстановить трехмерную сцену по одному изображению. Например, если удалось найти плоскость пола, а стены ему перпендикулярны, то положение точки пола из который исходит ребро стены однозначно определяется по координатам на изображении. Из этих координат исходит вертикальная прямая линия. Подробнее - см. книгу Хартли (основной список литературы), Part I, Single View Geometry. Задача весьма актуальна, для начала следует последовательно реализовывать и опробовать методы, изложенные в книге.
Обнаружение и маркирование на изображениях областей, соответствующих растительности и водным поверхностям.Это важно в задачах восстановления трехмерных сцен и при построении панорам. Что касается восстановления трехмерных сцен, обычно наибольший интерес представляют искусственные структуры, а растительность достаточно грубо оконтурить. Кроме того, что понимать под восстановлением трехмерной формы скажем дерева, вопрос сложный. Восстановить форму каждого листа и веточки? Так не все такие детали могут быть разрешимы на изображении. Да и модель получится избыточно сложная, которая в большинстве случаев и не нужна. В задачах построения панорам - такие программы желательно чтобы работали автоматически. Они обычно основаны на поиске и сопоставлении характеристических точек, а кадры сняты в разные моменты времени. Водные поверхности и растительность могут занимать значительную часть изображения, на этих участках будет находиться большое количество характеристических точек, но для сопоставления они не подходят, так как под действием ветра форма таких объектов меняется. Было бы интересно такие точки отсечь и проводить сопоставление только по оставшимся точкам. Метод решения этой задачи основан на анализе текстур и машинном обучении. Для водных поверхностей, можно попытаться построить дополнительные признаки, основанные на известной формуле для спектра ветрового волнения.
|