Одного физика однажды поинтересовались, почему из всех видов домашних животных он предпочитает рыбок. Ответ его был прост: "А для чего обогревать окружающую среду за свой счет?". Наверно, объяснение математика, спроси его, в чем основное достоинство вейвлет-преобразования, было бы таким же.
Немножко истории
Около 200 лет прошло с момента реализации Фурье (если быть точным, идея была им высказана в 1822 г.) концепции аппроксимации сложной функции взвешенной суммой простых функций, каждая из которых в свою очередь получается из одной гармонической функции-прототипа. Все устройства, использующие это преобразование для обработки нестационарных сигналов, в прямом и переносном смысле "грели окружающую среду за свой счет". И какая бы более поздняя модификация Фурье-преобразования не использовалась (будьте "оконная" версия 1946-1947 гг. или "быстрое преобразование Фурье" 1965 г.) проблема с неэффективным представлением быстро меняющихся процессов оставалась, поскольку главная причина этого была неизменна. А она заключалась в том, что в основе всего лежали гармонические функции, при любых резких изменениях ситуации устремляющиеся в бескрайность и растаскивающие энергию по многочисленным гармоникам. "А причем здесь цифровое охранное видеонаблюдение?" - возможно, спросит кто-либо из читателей. Все весьма просто: процессы, которые оно должно отслеживать, сугубо не стационарны, и поэтому все алгоритмы сжатия, использующие Фурье-преобразование, мягко говоря, не особо подходят для решения большинства поставленных перед системами безопасности оперативных задач. А таких стандартов немало (давайте загибать пальчики):
1. JPEG и M-JPEG;
2. MPEG-2 и его клоны;
MPEG-4 и его многочисленные клоны.
Искушенный читатель, знакомый подробнее со стандартом MPEG-4, тут же поймает автора "за руку" и спросит: "Как же так, ведь основное отличие стандарта в многообразии используемых преобразований, которое не ограничивается идеей Фурье и его более поздних клонов?". Однако дело в том, что все это "разнообразие" остается только на бумаге, а в реальных кодеках повсюду "торчат рога" именно гармонических функций.
Мы же вернемся к теме данной публикации. Этот "энергетический беспредел" продолжался до конца 1970-х гг. Именно тогда инженер-геофизик Морли столкнулся с проблемой анализа сигналов, которые характеризовались высокочастотной компонентой в течение короткого промежутка времени и низкочастотными колебаниями при рассмотрении больших временных периодов. "Оконные" преобразования позволяли анализировать либо высокие частоты в коротком окне времени, либо низкочастотную компоненту, но не оба колебания одновременно. В результате ученым был предложен подход, в котором для разных диапазонов частот использовались временные окна различной длительности. "Оконные" функции получались в результате растяжения-сжатия и смещения по времени функции Гаусса. Именно Морли назвал эти новые базисные функции вейвлетами (wavelets) - маленькими волнами. "Маленькие" в том смысле, что они, в отличие от гармонических (их можно было бы назвать "огромными волнами") функций, очень компактны по времени и занимаемому пространству.
Как и все оригинальные идеи, это изобретение Морли почти 10 лет было известно лишь в очень узких научных кругах. Так продолжалось до тех пор, пока в 1988 г. сотрудник Бельгийского национального научного фонда Ингрид Добеши не опубликовала свою знаменитую статью в журнале по прикладной математике (Comm. Pure Appl. Math, v. XLI, p. 909-996), открывшую зеленый свет реальному широкому применению вейвлет-преобразования в обработке сигналов. И началась "эра вейвлетов". Решения на их основе появились в квантовой физике, физике электромагнитных явлений, математике, электронике и сейсмогеологии. Междисциплинарные исследования привели к новым приложениям данных методов, касающихся, в частности, сжатия образов для архивов и телекоммуникаций, исследований турбулентности, физиологии зрительной системы, анализа радарных сигналов и предсказаний землетрясений. Во многих университетах мира было начато преподавание теории вейвлет-преобразований. Их практическому применению были посвящены специализированные конференции (к примеру, только в 1996 г. прошло две конференции). В России начало активной "вейвлетизации" приблизительно совпало с началом нового тысячелетия.
Вейвлеты в охранном телевидении
Главное преимущество вейвлет-сжатия лучше всех сформулировал его известный популяризатор Робби Поликар. Если при сжатии с использованием Фурье-преобразования предлагается избрать, что не мешало бы увидеть, перелесок или деревья, то использование вейвлетов позволяет увидеть и то и другое одновременно. Согласитесь, это очень важное преимущество для охранного телевидения!
Число базисных функций для вейвлет-преобразования, называемых материнскими вейвлетами, в настоящее время достаточно велико, но они настолько мало похожи друг на друга, что объединяет их только одно - все они не являются гармоническими. Поэтому, когда в строчке, где указывается тип сжатия цифрового устройства видеонаблюдения, скромно написано" вейвлет", это еще нельзя считать однозначным свидетельством его эффективной работы. Данным фактом, в частности, объясняется различие в оценках размера сжатого кадра при одном и том же качестве.
Единственное, что гарантировано - отсутствие блокинг-эффекта (появление квадратных артефактов при сильном сжатии) и "дрожания" линий на границах контрастных яркостных и цветовых переходов. Это связано с тем, что здесь не применяется быстрое преобразование Фурье (в компьютерных технологиях его называют "дискретное косинусное преобразование" или просто ДКП), которое используют все алгоритмы, работающие с разложениями по гармоническим функциям. Именно в них все изображение разбивается на блоки, которые и подвергаются преобразованию Фурье. При вейвлет-сжатии в такой разбивке просто нет нужды - обрабатывается весь кадр полностью, что исключает появление блокинг-эффекта.
Таким образом, вейвлет-преобразование открывает большие просторы для разработки конкретных алгоритмов сжатия, в то время как все Фурье-подобные преобразования похожи друг на друга и делятся всего на несколько типов. Здесь мы подходим к еще одному достоинству (тут может быть проведена параллель с Linux-Windows) вейвлет-сжатия: его можно точно настроить для решения конкретных специфических задач, таких как охранное видеонаблюдение.
Думаю, сейчас мало кто сомневается в специфичности требований, выставляемых к техническим системам обеспечения безопасности, - количество публикаций на эту тему достаточно велико - можно сказать, что это единое мнение экспертного сообщества. И, несомненно, охранное телевидение не является здесь исключением. Беда состоит в том, что абсолютно все обычные стандарты сжатия были разработаны совершенно для иных целей. Здесь можно целиком воспользоваться всеми преимуществами вейвлетов для разработки необходимых специальных решений. Более того, гиперболически выражаясь, в нашем случае просто противозаконно использовать стандартное вейвлет-сжатие. Дойдя до этого места, автор, удовлетворенно потерев руки, приготовился к обзору многочисленных отечественных разработок для систем безопасности на основе вейвлет-преобразования. Однако все попытки отыскать это "разнообразие" удивительным образом провалились. Нет, понятно, что разработка каждого алгоритма сжатия довольно долгая и кропотливая работа, но ведь многие идеи просто лежат на поверхности! Ну, к примеру, можно обратиться к истории систем видеонаблюдения. В свое время (в 90-х гг прошлого века) были разработаны устройства для передачи видеосигнала по телефонным линиям.
Идея передачи видеосигнала по узкополосным общественным линиям связи была высказана еще в 1970-х гг., однако проблема заключалась в том, что время передачи одного кадра в стандартном формате составляло порядка 7 минут. Разумеется, с развитием коммуникаций увеличилась пропускная способность телефонных линий, это время сократилось в несколько раз, но кому нужна система охранного телевидения, в которой кадры поступают с частотой пускай даже и раз в 30 секунд? Проблема была решена с изобретением метода адаптивного сжатия, или "условного обновления", - после первого (как мы сейчас сказали бы "опорного") кадра передавались только изменения, произошедшие в изображении. Это сразу позволило довести частоту кадров до одного в секунду (конечно, если изменения были небольшими), что уже было приемлемо для практического использования. Почему бы не использовать аналогичное модернизация и в вейвлет-сжатии? Тогда к таким его стандартным преимуществам, как адаптация к пропускной способности канала, контроль качества изображения и оптимизация загрузки процессора, добавилось бы еще существенное убавление размера сжатого кадра. Поиск по открытым источникам дал следующие результаты: некоторые российские производители используют практически традиционное вейвлет-сжатие (к примеру, "КомКом" и "Вокорд Телеком"), однако нашлись только две технологии, так или иначе реализующие описанный выше алгоритм - Delta Wavelet (Johnson Controls (Великобритания), CIEFFE (Италия) и ISS) и Motion Wavelet (ITV). He мало ли для целой индустрии? Думается, это свидетельствует о том, что потенциальные возможности вейвлетов остаются недооцененными.
Рассмотрим две имеющиеся технологии более подробно.
Компрессор, работающий по Delta Wavelet, вычитает друг из друга разные кадры и сжимает полученную разницу. Если при этом требуется получить высокое качество видеоизображения, то оба кадра берутся также с высоким качеством, и в них присутствует в большом объеме высокочастотная составляющая, то есть шумы. В этом случае итог вычитания (разность двух кадров) имеет большой объем, причем за счет шумов. Эта проблема отсутствует, когда требуется высокая степень сжатия и высокочастотная составляющая убирается из исходных кадров еще до вычисления их разности. В таком случае технология Delta Wavelet эффективна: в кадрах остаются только крупные контуры, они легко вычитаются друг из друга и хорошо сжимаются.
Motion Wavelet работает не по принципу вычитания: в нем есть внутренний обнаружитель движения, который определяет на следующем кадре, какие элементы изображения изменяются, и сжимает он только их. Если начинается движение во всем кадре, то сжимается все, и тогда это будет покадровое вейвлет-сжатие. Но для охранного телевидения именно сжатие, связанное с движением отдельных фрагментов, несомненно, играет основную роль, поскольку именно в них обычно и заключается нужная оперативная информация.
Предоставим читателю право самому судить о достоинствах и недостатках вейвлет-сжатия и его модификаций, о которых шла речь в этой публикации.
В заключение приведем только один факт – на выставке IFSEC2006 в номинации "Наилучший CCTV-продукт" победил CIEFFE с кодеком Nettu-no Senses. И знаете, что самое интересное? В нем использована вовсе не технология Delta Wavelet, что подтверждает справедливость вышеизложенного.