Адаптивное параметрическое оценивание квадратно-корневыми информационными алгоритмами
,
далее прямое дифференцирование дает:
(2.4.2)
Используя тот факт, что и, следовательно, — верхнетреугольные, (2.4.2) может быть использовано для вычисления элементов . Для этого применяется алгоритм прямой подстановки, который является стандартным алгоритмом решения линейных систем. Вычислительные сложности могут возникнуть, когда матрица и, следовательно, плохо обусловлены (т.е. почти вырождены). Алгоритм прямой подстановки в этом случае может давать, мягко говоря, неточные результаты.
Выбранный метод базируется на том наблюдении, что если матрица — ортогональная, то выполняется следующее равенство: . Дифференцируя это уравнение, находим, что
или (2.4.3)
Матрица , которая удовлетворяет соотношению — кососимметричная. Очевидно, что такая матрица имеет следующий вид: , где — строго нижнетреугольная. Поэтому (2.4.3) можно переписать в следующем виде:
(2.4.4)
для некоторой нижнетреугольной матрицы .
Лемма: Нижнетреугольная матрица в соотношении (2.26), где удовлетворяет
(2.4.1), причем — невырождена, является нижнетреугольной частью матрицы , причем
(2.4.5),
где соответственно нижнетреугольная, диагональная и верхнетреугольная матрицы и удовлетворяет (2.4.4).
Доказательство:
Продифференцировав равенство (2.4.1), получаем:
(2.4.6)
из которого имеем:
Используя тот факт, что
получаем, что
(2.4.7)
Далее, так как и верхнетреугольные матрицы, то и и также верхнетреугольные. Поэтому, нижнетреугольная часть должна в точности соответствовать нижнетреугольной части с обратным знаком. Следовательно, если , то
Уравнение (2.4.7) дает метод для вычисления . Подстановкой (2.4.5) и (2.4.4) в (2.4.7) получаем, что
(2.4.8)
и, таким образом, имеем
Тем самым получаем путь нахождения:
- вычислить ;
- привести к виду ;
- вычислить
и результатом будет .
Уравнение (2.4.8) показывает всю опасность применения (2.4.6) непосредственно. Из соотношения (2.4.8) находим:
Первым слагаемым является , а вторым — . Записанное в таком виде соотношение (2.4.8), включает и в первое, и во второе слагаемое матрицу , но с разными знаками. Более того, матрица полная, то есть исключение происходит по всей матрице . Если значение матрицы небольшие, в сравнении с элементами матриц и , тогда сумма вычисляется достаточно точно. Однако если некоторые из элементов велики, тогда соответствующие элементы суммы будут неточны вследствие большого исключения элементов и результат в целом будет неточен.
2.5. Описание алгоритма
Идеи, высказанные в разделе 2.4, могут быть использованы для создания очень небольшого и сжатого алгоритма вычисления обратного логарифма функции правдоподобия, его градиента и величин, входящих в выражение для информационной матрицы Фишера.
Пусть определяет собой вектор параметров, по которым функция правдоподобия должна быть продифференцирована. Для вычисления , для каждого i, мы преобразуем уравнение изменения параметров наблюдающей модели следующим образом:
М1: Заменим (2.1.10) на
,
где первые два столбца повторяются для каждого .
М2: Вычислить для каждого :
М3: Вычислить для каждого :
Заметим, что на шаге М2, матрица, которая должна быть обращена верхнетреугольная. Следовательно, результат обращения может быть получен с помощью метода обратной подстановки.
Метод раздела 2.4, для нахождения величин , мы не можем применить напрямую к уравнению предсказания состояния (2.1.13), т.к. матрица, которая должна быть приведена к треугольному виду неквадратная, следовательно, необратимая. Однако этот алгоритм может быть применен при работе с подматрицами.
Т1: Заменим (2.1.13) следующим соотношением:
где первые два столбца повторяются для каждого и , как в (2.1.13)
Т2: Вычислить для каждого :
здесь * - обозначение для первых q столбцов, не представляющих для нас интереса.
Т3: Вычислить для каждого :
Соотношение для определяется дифференцированием уравнения:
и заменой производной , используя (2.4.4), значением вычисленным на шаге Т1. Заметим также, что , необходимое для этого последнего уравнения, легко вычисляется, т.к.
где — верхнетреугольная.
Но самое интересное, что значения , необходимые для вычисления матрицы Фишера, вычисляются автоматически на шаге М3.
Отзыв
научного руководителя
на дипломную работу М.Ю. Кудрявцева
Тема работы «Адаптивное параметрическое оценивание квадратно-корневым информационным алгоритмом» продиктована необходимостью проведения широкого спектра исследований по сравнительным оценкам различных подходов к проблеме идентификации моделей систем.
Новизна и привлекательность рассматриваемого подхода обусловлены соединением в нем известного критерия максимума правдоподобия с алгоритмом квадратно-коневого информационного фильтра. Последний отличается высокой численной устойчивостью к погрешностям вычислений и к случаям плохой обусловленности схемы наблюдений. Однако факт совпадения оценок максимального правдоподобия с параметрами оптимального фильтра в общем случае не доказан. Этим объясняется актуальность экспериментальных исследований, устанавливающих условия, в которых данный критерий и соответствующий алгоритм идентификации могут считаться практически пригодными. М. Кудрявцев проанализировал заданный алгоритм, отличающийся сложным и разнообразным математическим аппаратом, сочетающим методы математической статистики, оптимального оценивания и матричных вычислений. Он обосновал вычислительные компактные схемы, включая вычисление обратного логарифма функции правдоподобия, его градиента по параметру неопределенности и информационной матрицы Фишера, и разработал необходимые программы.
Основательность и настойчивость позволили М. Кудрявцеву выполнить эту работу без лишней торопливости, с глубоким пониманием существа вопроса и доведением всего исследования до наглядных экспериментальных результатов. Работа демонстрирует высокую подготовку ее автора по специальности «Прикладная математика», его способности к проведению самостоятельных исследований и заслуживает отличной оценки.
Д.т.н., профессор И.В. Семушин
Введение
Спектральный анализ — это один из методов обработки сигналов, который позволяет охарактеризовать частотный состав измеряемого сигнала. Преобразование Фурье является математической основой, которая связывает временной или пространственный сигнал (или же некоторую модель этого сигнала) с его представлением в частотной области.