Протасов К.К.  

Алгоритм распознавания образов по данным гиперспектральной съемки

Наметившиеся тенденции к увеличению размерности регистрируемой информации (в частности, появление гиперспектральной аэрокосмической съемки) и возникающие при этом проблемы совместной обработки данных делают актуальной задачу синтеза условных функций плотности, которые являются моделями распознаваемых классов в пространствах многомерных наблюдений, описываемых случайными векторными полями.
Основная проблема, которая возникает при этом, это проблема преодоления априорной неопределенности и восстановление вероятностных распределений. В условиях априорной неопределенности высокого уровня, когда эти вероятностные модели неизвестны, предполагается, что существуют обучающие выборки, предъявляемые учителем Данные обучающих выборок служат основной информацией, позволяющей восстановить условные функции плотности. В последние годы разработана теория и практика восстановления многомерных функций плотности на основе непараметрических оценок с использованием ядерных функций различного вида. Кроме того Репиным и Тартаковским разработана технология восстановления многомерных распределений со случайными параметрами путем приближенных методов интегрирования Лапласа с последующим усреднением по распределению случайных параметров. Тем не менее, существует проблема восстановления многомерных распределений, связанная с тем, что функции плотности вероятностей нормированы. Это приводит к тому, что нормирующий коэффициент в случае многомерных наблюдений становится равным либо нулю, либо бесконечности. Поэтому решающее правило можно вычислить в виде отношения функций плотности. Нами разработан подход восстановления вероятностных распределений, преодолевающий вырожденность распределений путем использования представления наблюдений в базисе Карунена-Лоэва, который обеспечивает наиболее короткий аппроксимирующий ряд, реализующий минимум выбранной нормы. Оптимальное байесово решающее правило, полученное из условий минимума среднего риска, при наличии обучающей выборки естественно заменить эмпирическим риском, последний является не дифференцируемым функционалом, так как содержит ступенчатую индикаторную функцию. В то же время, восстановленные функции плотности содержат так называемые параметры сглаживания, вариация которых позволяет адаптировать распределения под конкретные ситуации взаимного пересечения многомерных распределений. Возникает задача поиска оптимальных значений параметров сглаживания путем оптимизации эмпирического риска по параметрам сглаживания. В нашем подходе для этой цели используется процедура поисковой оптимизации Я.З. .Цыпкина.
Следует заметить, что увеличение размерности гиперспектральных компонент вектора наблюдений не всегда уменьшает ошибку распознавания. Хотя с информационной точки зрения привлечение дополнительных признаков должно повышать разделимость классов. Однако на практике это не всегда так, ввиду того, что с привлечением новых признаков привносятся шумы, «размывающие» классы. В связи с этим возникает проблема выбора комплекса информативных признаков из всей совокупности полного описания. Ввиду вычислительной громоздкости этой задачи нами разработаны процедуры поиска систем признаков, названные условно полным перебором, когда информативный набор расширяется блоками. В качестве критерия информативности выбран эмпирический риск, который является единственным критерием качества системы признаков для алгоритмов распознавания образов.
Приводятся примеры распознавания типов древостоев бореальной тайги по их гиперспектральным портретам, регистрируемых спутниковыми сканирующими устройствами.
 


To reports list