Back

Слядников Е.Е.  

Модель кодека видеоданных с интеллектуальным блоком

     В настоящее время традиционные системы компрессии и декомпрессии видеоданных на основе классических подходов и преобразований близки к исчерпанию заложенных в этих методах и средствах возможностей. Использование классических подходов и средств для создания таких систем в условиях постоянного увеличения объемов передаваемых видеоданных возможно либо усложнением систем (экстенсивный путь развития), либо путем разработки новой теоретической базы для их представления, преобразования и реализации, основанных как на особенностях структуры видеоданных, так и на специфике человеческого восприятия (интенсивный, инновационный путь) [1].
     В последнее десятилетие широкое применение в информационных технологиях получил цифровой кодер-декодер (кодек) видеоданных, то есть устройство, специально созданное для обработки видеоданных в режиме реального времени [2]. В отличие от других областей сжатия информации, при сжатии видеоданных необходимо применить значительно более мощные и сложные концепции, методы и средства искусственного интеллекта. Наиболее сложная проблема интеллектуальной предобработки видеоданных это проблема выбора системы и способа распознавания образов, которые, подобно сознанию человека должны обладать ассоциативной памятью.
     Наиболее вероятным кандидатом динамической системы с ассоциативной памятью для интеллектуального кодека видеоданных, а также его биологическим прототипом является дипольная система нанотрубочки цитоскелета нейрона [3]. Эта система обладает такими физическими свойствами, из которых возникает способность микротрубочки к интеллектуальной обработке информации, например, функция распознавания образов, которая является фундаментальным свойством живой природы от клеточного уровня до высших психических функций человека. Кроме этого нанотрубочка цитоскелета является распределенной системой с параллельной обработкой информации, способной сжимать, а не только запоминать информацию и распознавать детали образов. Такие особенности дипольной системы нанотрубочки цитоскелета позволяют использовать ее для формулировки моделей видеоданных, распознавания образов, способа компрессии и декомпрессии изображений.
      Исходя из концепции обработки данных в нанотрубочке цитоскелета, сформулируем основные представления и принципы интеллектуальной предобработки видеоданных:
1. Применяемые на сегодняшний день алгоритмы разбивают изображение на квадраты или прямоугольники, и для каждого из них находят движение (точнее говоря, вектор сдвига) по отношению к другим кадрам. Вместо этого можно разбивать изображение на сегменты произвольного вида. Это позволяет перейти от большого количества прямоугольных элементов изображения к гораздо меньшему количеству элементов произвольной формы.
2. Для более эффективного нахождение движений сегментов и их кодирования требуется применить методы распознавания образов. Более конкретно, надо сконструировать «объекты» в виде объединения нескольких сегментов на изображении. Каждый объект не обязательно должен двигаться как единое целое, но движения всех его частей должны быть связаны друг с другом. Целью данного шага является снижение количества запоминаемых движений, ориентировочно с нескольких сотен до нескольких десятков.
3. Переход от междукадрового «движения» в виде сдвига к движениям более общего вида: сдвигам с поворотом и растяжением, произвольным аффинным и проективным преобразованиям плоскости. В нынешних алгоритмах видеосжатия каждый рассматриваемый сегмент имеет небольшой размер (обычно не более 16*16 точек), поэтому рассмотрение для него лишь простейших движений в виде сдвига вполне достаточно. Если же мы рассматриваем сегменты произвольного размера, то переход к более общим аффинным движением неизбежен, а к проективным возможен.
      Используя эти принципы и представления, усовершенствуем существующую модель кодека видеоданных путем добавления к практикуемой модели [2], блока интеллектуальной предобработки видеоданных, состоящего из трех новых компонент:
сегментации изображения; распознавания образов изображения; вычисления произвольных аффинных и проективных преобразований изображения.
      Предлагаемую в работе модель кодека видеоданных с интеллектуальным блоком можно использовать при построении цифровых систем (устройств) передачи изображений нового поколения для министерств Информационных технологий и Связи, Промышленности и Торговли, Образования и Науки РФ. Актуальность разработки и исследования модели кодека видеоданных с интеллектуальным блоком обусловлена крайней необходимостью в совершенствовании существующей технологии цифровой передачи данных, базирующейся на основе российской интеллектуальной собственности.

1.Слядников Е.Е. Модель медиа данных, способ компрессии и декомпрессии изображений // Труды всероссийской конференции «Инновации РАН-2009» г. Томск, Конгресс-центр «Рубин» 27-29 октября 2009 г. 6 с.
2.Ричардсон Я. Видеокодирование. Н.264 и MPEG-4 стандарты нового поколения / Москва: Техносфера, 2005. 368 с.
3.Слядников Е.Е. Физическая модель и ассоциативная память информационной биомакромолекулы // ЖТФ. 2007. Т. 32. В. 8. С. 52–59.

Abstracts file: Тезисы2.doc


To reports list