Алгоритмические основы мильтимедиа
Автор программы:
Леоненко А.В.
Лектор: Леоненко А.В.
Аннотация
Данный курс содержит изложение элементов теории информации, математической кибернетики и функционального анализа, необходимых для глубокого понимания алгоритмов обработки изображений, таких как сжатие и распознавание образов. В первой части курса подробно рассматривается понятие энтропии как меры информации, и обсуждается применение этого понятия в распространенных алгоритмах сжатия данных применительно к сжатию изображений. Также рассматриваются стандарты известных форматов хранения графических данных PNG и GIF. Во второй части излагаются элементы функционального анализа и теории вероятности необходимые для понимания алгоритмов сжатия с помощью преобразований и с помощью IFS. Подробно описываются свойства преобразований ДКП и Wavelet семейств. Описываются методы сжатия, использующие эти преобразования. Обсуждаются фрактальные методы сжатия. В заключительной части рассматривается несколько наиболее важных задач распознавания образов. Приводится их математическое описание, и обсуждаются возможные алгоритмические реализации.
Учебная задача
Познакомить слушателей с математической теорией лежащей за наиболее распространенными методами сжатия изображений и распознавания образов, иллюстрируя их примерами популярных алгоритмов.
Методы проведения занятий
Лекции.
Форма отчетности
Итоговый контроль - экзамен по курсу.
Содержание курса
- Функция изображения. Замечания по цветокодировкам и палитрам. Блочное кодирование. Задача преобразование цветовых палитр. Медианное деление. Векторное квантование.
- Мера информации в изображении. Энтропия (по Шеннону). Изображение как одномерный сигнал. Основная теорема теории информации. Предельная пропускная способность идеального канала связи.
- Энтропийные методы сжатия информации. Арифметическое кодирование. Алгоритмы LZ77 и LZW. Разбор стандарта PNG.
- Изображение как двумерный сигнал. Модель поля Гаусса-Маркова. Адаптивные методы сжатия изображений. Сжатие двуцветных изображений. Стандарты
JBIG, ITU-T T.82.
- Оптимальное преобразование Карунена-Лоэва. 'Быстрые' приближения к оптимальному преобразованию. Преобразования Адамара, Хаара, Сланта. Преобразования Фурье. Дискретное косинусное преобразование. Алгоритм
JPEG.
- Введение в многомасштабный анализ. Определение
Wavelet-ов. Быстрое Wavelet преобразование. Сравнение спектров Wavelet и Фурье преобразований.
- Использование
wavelet-преобразования для сжатия изображений. Сжатие текстур.
- Фракталы. Итерационные функциональные системы (
IFS). Теорема о существовании инвариантного множества IFS. Примеры нелинейных IFS. Множества Мандельброта и Жюлиа.
- Теорема о коллаже. Применение
IFS для сжатия изображений. Сравнение методов.
- Цифровая обработка изображений. Дискретные приближения дифференциальных операторов. Свертки. Влияние сверток на спектр. Операторы Собела, Робертса, Лапласа. Алгоритмы выделения границ. Алгоритмы сегментации изображений.
- Восстановление трехмерных моделей по двумерным проекциям. Задача отождествления точек изображений одного объекта. Нахождение максимумов функции корреляции.
- Стохастические подходы к восстановлению изображений. Удаление аддитивного шума. Удаление мультипликативного шума.
Литература
- Ш.-К. Чен, 'Принципы проектирования систем визуальной информации.' Москва, Мир, 1994
- К. Шеннон, 'Работы по теории информации и кибернетики', Москва, ИЛ, 1963
- Р.Е. Кричевский, 'Сжатие и поиск информации', М., Радио и Связь, 1989
- А.Н. Ширяев, 'Вероятность', Москва, Наука 1989
- А.Н. Колмогоров, С.В.Фомин, 'Элементы теории функций и функционального анализа', М. Наука, 1989
- ITU-T T.82 recommendation, 1993
- G.K. Wallace, 'The JPEG still image compression standard', IEEE TCE, 1991
- M.V. Wickerhauser, 'Lectures on wavelet packets', WUPC, 1991
- J. Barnsley, 'Fractals everywhere', SW, 1994
- Публикации разных лет конференций
DCC, Siggraph, PAIS, ICCV