Математическое моделирование

Математическое моделирование

ВВЕДЕНИЕ

Различают четыре типа зависимостей между переменными:

1) Зависимость между неслучайными переменными, не требующую для своего изучения применения статистических методов;

2) 1) Зависимость случайной переменной y от неслучайных переменных, исследуемую методами регрессионного анализа;

3) 1) Зависимость между случайными переменными y и xi, изучаемую методами корреляционногоанализа;

4) 1) Зависимость между неслучайными переменными, когда все они содержат ошибки измерения, требующую для своего изучения применения конфлюэнтного анализа.

Применение регрессионного анализа для обработки результатов наблюдений позволяет получить оценку влияния переменных, рассматриваемых в качестве аргументов (независимых переменных) на переменную, которая считается зависимой от первых.

Курсовая работа направлена на освоение методов регрессионного анализа в процессе разработки математического описания исследуемого процесса или явления. Курсовая работа предусматривает обработку экспериментальных данных и поиск наиболее удовлетворительной гипотезы взаимосвязи между функцией и аргументами.

В качестве таких гипотез рассматриваются линейная и нелинейная регрессионные модели, каждая из которых может быть парной (только две переменных - функция и аргумент) или множественной (одна функция и несколько аргументов).

Относительно закона изменения независимых переменных xi не делается никаких ограничений —

ЛИНЕЙНАЯ ПАРНАЯ РЕГРЕССИЯ

Для нахождения теоретической линии регрессии по данным производственных замеров или специально поставленных экспериментов применяется метод наименьших квадратов, с помощью которого путем определенных вычислений находится уравнение y = f (x), соответствующее взаимосвязи рассматриваемых параметров. А именно, отыскивается теоретическая линия регрессии у по х, занимающая в корреляционном поле такое положение, при котором выполняется требование, чтобы сумма квадратов расстояний от этой линии до каждой точки в корреляционном поле являлась минимальной.

При изображении корреляционного поля на графике по оси у откладывают значения функции, а по оси х значения аргумента. Теоретическая линия регрессии у по хдолжна быть внесена в корреляционное поле таким образом, чтобы соблюдался принцип наименьших квадратов:

m

S2 = SDyj2 = S (yj-y'j)2 (1)

j = 1

где j— порядковый номер точки в исходном числовом материале:

у jизмеренное значение функции для определенного значения аргумента (х);

y'/--расчетное значение функции при заданной величине аргумента (х) в соответствии с теоретической их взаимосвязью. В случае линейной зависимости

y'j = a + b x j. (2)

Задача сводится к отысканию коэффициентов регрессии аи b уравнения (2), т. е. заранее установлено, что рассматриваемые параметрыу и х связаны линейной зависимостью по уравнению (2).

Величина Dyjпредставляющая собой расстояние от каждой точки корреляционного поля до теоретической линии регрессии, определяется из уравнения

Dyj = yj-(a + b x j) (3)

где xj параметр х, соответствующий измеренному значению у j.

Для определения численных значений коэффициентов регрессии a и b, исходя изпринципа наименьших квадратов отклонений, нужно приравнять нулю частные производные функции S 2 по aиb:

¶S 2/ ¶ a = (SDyj ) 2 / ¶ a = 0, (4)

¶S 2/ ¶ b = (SDyj ) 2 / ¶ b = 0 (5)

Выполнив необходимые преобразования, получим систему двух уравнений с двумя неизвестными для определения aи b:

Sy = m a + bSx

Syx = aSx + bSx2. (6)

Решая систему уравнений относительно aи b, находим численные знаяения коэффициентов регрессии. Величины Sy, Sx,Syx, Sx2находятся непосредственно по данным производственных измерений, которые заданы в курсовой работе.

Величина свободного члена уравнения регрессии (2), или коэффициента а равна функции у при x = 0.

Коэффициент b в уравнении регрессии характеризует изменение функции у при изменении аргумента х на единицу. и графически отражает угол наклона линии уравнения регрессии

При решении практических задач регрессионного анализа возникает вопрос об оценке тесноты исследуемой взаимосвязи, т. е. насколько полученные на основе обработки производственных или лабораторных данных уравнения регрессии достоверны. В случае парной линейной корреляции в качестве оценки тесноты связи используют обычно коэффициенткорреляции, который рассчитывается по формуле:

r = (XY -X * Y)/(sx * sy ). (7)

Числитель выражения для коэффициента корреляции r представляет собой разность между средним значением произведения XY и произведением средних значений X * Y измеренных значений параметров x и y исходной информации. Знаменатель равен произведению средних квадратических отклонений значений параметров у и х от своих средних. Средние квадратические отклонения (стандартные отклонения) рассчитываются по формулам:

sx= {[S (x j -X) 2]/m }½ (8)

sy= {[S (y j -Y) 2]/m }½ .(9)

Квадраты средних квадратических отклонений y и х(sx 2иsy 2) называются дисперсиями

D x= [S (x j -X) 2]/m (10)

Dy= [S (y j -Y) 2]/m (11)

и являются важными статистическими оценками рассеяния значений какой-либо величины около ее среднего значения.

Величина коэффициента корреляции r может изменяться от 0 при полном отсутствии связи до ±1 при наличии линейной функциональной связи хс у.Если r > 0, между х и уимеет место положительная корреляционная связь, т. е. с ростом параметра хувеличивается параметр у, если r < 0, между х и у имеет место отрицательная связь. С коэффициентом регрессии bв уравнении (2) коэффициент корреляции связан соотношением

r = bsx / sy .(12)

Угловой коэффициент регрессии b представляет собой тангенс угла наклона линии регрессии к оси абсцисс. Следовательно, чем больше наклон линии регрессии к оси абсцисс, тем больше значение коэффициента корреляции, т. е. тем значительнее будет изменение функции у при изменении на единицу аргумента х.

Малая величина коэффициента корреляции указывает на отсутствие линейной связи, однако криволинейная связь между рассматриваемыми параметрами при этом может быть достаточно тесной. Коэффициент корреляции отражает не только величину приращения упри изменении х, но и тесноту связи функции и аргумента. Чем больше разброс точек относительно линии регрессии, тем меньше коэффициент корреляции. Это свойство коэффициента корреляции отражено в его формуле в виде соотношения стандартных отклонений.

Для оценки надежности полученного результата используют иногда критерий надежностиm, который учитывает как величину коэффициента корреляции, так и число пар измерений. Критерий надежности m рассчитывается по формуле

m = r * [m- 1]½ / (1 -r2 ), (13)

где r— коэффициент корреляции;

т—число пар измерений.

Как видно из формулы критерия надежности, чем выше коэффициент корреляции и большее число пар измерений, тем больше показатель надежности. При m, > 2,6 связь считается статистически достоверной.

Располагая данными можно выполнить анализ взаимосвязи аргумента и функции: построить график с корреляционным полем рассматриваемых показателей, определить теоретическую линию регрессии, оценить тесноту связи для выбранных параметров. Однако, проанализировав конфигурацию корреляционного поля, построенного по исходным данным, можно усмотреть что описание взаимосвязи рассматриваемых параметров с помощью прямой линии не является наилучшей аппроксимацией. Иногда в данное поле корреляции значительно лучше впишется некоторая кривая.

Таким образом из технологического опыта может следовать, что связь между аргументом и функцией имеет криволинейный характер. Возможно, что аппроксимация производственных данных в виде кривой точнее отражала бы существующую взаимосвязь.

КРИВОЛИНЕЙНАЯ ПАРНАЯ РЕГРЕССИЯ

Аппроксимация кривой выполняется тем же путем с использованием метода наименьших квадратов, что и выравнивание по прямой линии. Линия регрессии должна удовлетворять условию минимума суммы квадратов расстояний до каждой точки корреляционного поля. В данном случае в уравнении (1)упредставляет собой расчетное значение функции, определенное при помощи уравнения выбранной криволинейной связи по фактическим значениям х j. Например, если для аппроксимации связи выбрана парабола второго порядка, то

y=а+b x + cx2, (14)

.а разность между точкой, лежащей на кривой, и данной точкой корреляционного поля при соответствующем аргументе можно записать аналогично уравнению (3) в виде

Dyj = yj-(a + bx +cx2) (15)

При этом сумма квадратов расстояний от каждой точки корреляционного поля до новой линии регрессии в случае параболы второго порядка будет иметь вид:

S2 = SDyj 2= S [yj-(a + bx +cx2)]2 (16)

Исходя из условия минимума этой суммы, частные производные S2 по а, bи сприравниваются к нулю. Выполнив необходимые преобразования, получим систему трех уравнений с тремя неизвестными для определения a, b и с.

,Sy = m a + bSx + cSx2

Syx = aSx + bSx2 + cSx2.

Syx2 = aSx2 + bSx3 + cSx4 . (17).

Решая систему уравнений относительно a,bис, находим численные значения коэффициентов регрессии. Величины Sy,Sx, Sx2,Syx,Syx2, Sx3, Sx4.находятся непосредственно по данным производственных измерений.

Оценкой тесноты связи при криволинейной зависимости служит теоретическое корреляционное отношение h, представляющее собой корень квадратный из соотношения двух дисперсий: среднего квадрата sр2отклонений расчетных значений y' jфункции по найденному уравнению регрессии от среднеарифметического значения Yвеличины y к среднему квадрату отклонений sy2 фактических значений функции y jот ее среднеарифметического значения :

h = {sр2/sy2}½ = {S (y' j — Y)2 /S (y j — Y)2 } ½(18)

Квадрат корреляционного отношения h2 показывает долю полной изменчивости зависимой переменной у, обусловленную изменчивостью аргумента х. Этот показатель называется коэффициентом детерминации. В отлично от коэффициента корреляции величина корреляционного отношения может принимать только положительные значения от 0 до 1. При полном отсутствии связи корреляционное отношение равно нулю, при наличии функциональной связи оно равно единице, а при наличии регрессионной связи различной тесноты корреляционное отношение принимает значения между нулем и единицей. Выбор типа кривой имеет большое значение в регрессионном анализе, поскольку от вида выбранной взаимосвязи зависит точность аппроксимации и статистические оценки тесноты связи. Наиболее простой метод выбора типа кривой состоит в построении корреляционных полей и в подборе соответствующих типов регрессионных уравнений по расположению точек на этих полях. Методы регрессионного анализа позволяют отыскивать численные значения коэффициентов регрессии для сложных видов взаимосвязи параметров, описываемых, например, полиномами высоких степеней. Часто вид кривой может быть определен на основе физической сущности рассматриваемого процесса или явления. Полиномы высоких степеней имеет смысл применять для описания быстро меняющихся процессов в том случае, если пределы колебания параметров этих процессов значительные.

Применительно к исследованиям металлургического процесса достаточно использовать кривые низших порядков, например параболу второго порядка.

Эта кривая может иметь один экстремум, что, как показала практика, вполне достаточно для описания различных характеристик металлургического процесса.

Результаты расчетов параметров парной корреляционной взаимосвязи были бы достоверны н представляли бы практическую ценность в том случае, если бы используемая информация была получена для условий широких пределов колебаний аргумента при постоянстве всех прочих параметров процесса. Следовательно, методы исследования парной корреляционной взаимосвязи параметров могут быть использованы для решения практических задач лишь тогда, когда существует уверенность в отсутствии других серьезных влияний на функцию, кроме анализируемого аргумента. В производственных условиях вести процесс таким образом продолжительное время невозможно. Однако если иметь информацию об основных параметрах процесса, влияющих на его результаты, то математическим путем можно исключить влияние этих параметров и выделить в «чистом виде» взаимосвязь интересующей нас функции и аргумента. Такая связь называется частной, или индивидуальной. Для ее определения используется метод множественной регрессии.

МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ

Множественной регрессией называется взаимосвязь трех и более переменных, или влияние двух и более аргументов на функцию

y =f (x1, x2, … xn). (19)

Для простоты рассмотрим случай, когда функция усопоставляется с двумя аргументами x1 и x2 . Такую зависимость графически можно представить в трехмерном пространстве {у, x 1, x 2} Совокупность всех т точек представляет собой корреляционное пространство. Задача определения связи у от x1 и x2состоит в том, чтобы подобрать такую плоскость, например плоскость Р, которая наилучшим образом вписалась бы в данное корреляционное пространство:

y = a + b1x1+b2 x2. (20)

При этом под словами «наилучшим образом» понимается удовлетворение требованию наименьших квадратов, т. е. сумма квадратов расстояний каждой точки корреляционного поля от искомой плоскости [уравнение y = a + b1x 1 + b2 x2] должна быть минимальной. Это расстояние определяется выражением

Dyj = yj-(a + b1 x1 + b 2x 2) (21)

Требуется найти значения коэффициентов a, b1 и b2.

Выполнив необходимые преобразования, получим систему трех уравнений с тремя неизвестными:

,Sy = m a + b1Sx1 + b2Sx2

Syx1 = aSx1 + b1Sx 12 + b2Sx1 x 2.

Syx 2 = aSx2 + b1Sx1 x2 + b2Sx22. (22)

Решение системы уравнений относительно коэффициентов a, b1 и b2, позволяет определить их численные значения. Величины Sy,Sx1, Sx12,Syx1,Syx2, Sx2, Sx22,Sx1 x2 .находятся непосредственно по данным производственных измерений.

Таким образом, найденное уравнение регрессии описывает совместное влияние x1 и x2 на функцию у. Коэффициенты a, b1 и b2при этом имеют математический смысл.

Коэффициентаравен функции упри нулевых значениях аргументов x1 и x2. В геометрической интерпретации коэффициент а соответствует ординате точки пересечения плоскости регрессии Р с осью y.

Коэффициентb1 равен изменению функции упри изменении первого аргумента х1 на единицу при неизменном втором аргументе x2. Аналогично коэффициент регрессии b2 равен изменению функцииупри изменении второго аргументаx2 на единицу при неизменном первом аргументе x 1.

Из уравнения множественной линейной регрессии могут быть получены уравнения частной регрессии аргументов x1 и x2 на функцию у:

у = a' 1 + b1 х1(23 a)

у = a' 2 + b 2 х 2(23 b)

При этом угловые коэффициенты регрессии b1 и b 2 сохраняют те же числовые значения, что и в уравнении множественной регрессии. Свободные члены уравнений для yможно подсчитать следующим образом:

a' 1= а+ b2X2, (24 a)

a' 2= а+ b1X1, (24 b)

гдеа— свободный член в уравнении множественной регрессии ;

X1, X2средние значения соответствующих аргументов.

х\.

Закономерности и выводы, используемые при исследовании взаимосвязи трех переменных (в трехмерном пространстве), применимы и для взаимосвязи большего числа переменных, .т. е. для многомерного пространства типа

y= f (x1, x2, … xn) (25)

В этом случае расчет уравнения множественной линейной регрессии типа

y = a+ b1x 1 + b2 x2 +.b3 x3+ + bn x n(26)

ведется для определения коэффициентов a, b1, b2,bn.

Чтобы определить численные значения этих величин, необходимо решить систему уравнений: аналогичную приведенной выше для двух аргументов и функции.

Определив коэффициенты регрессии решением системы уравнений, получим уравнение множественной линейной регрессии, из которого могут быть получены уравнения частной взаимосвязи функции с каждым аргументом:

у = a'i + bi хi ,(27)

где a'iсвободный член частного уравнения регрессии;

i - порядковый номер анализируемого аргумента.

Так же как и в случае трехмерной задачи, угловой коэффициент регрессии b i сохраняет то же численное значение, что и в уравнении множественной линейной регрессии. Свободный член частного уравнения регрессии рассчитывается по формуле

n

a' i= а+ SbiXi-beXe(28)

i = 1

гдеа — свободный член множественного линейного уравнения регрессии;

n  — количество -аргументов;

Xi—средние значения аргументов;

Xe—среднее значение одного из -аргументов.

Оценкой тесноты связи при множественной линейной регрессии служит коэффициент множественной корреляцииR, определяемый по формуле:

R = { b 1[sx1 / sy ]ryx1 + … + b n[sx n/ sy ]ryx n} ½ (29)

Величина коэффициента множественной корреляции всегда положительна и может меняться от 0 (при отсутствии связи) до 1 (при функциональной связи). С помощью коэффициента множественной корреляции оценивают совместное влияние на зависимую переменную всех включенных в расчет аргументов. Квадрат величины коэффициента множественной корреляции показывает долю изменчивости зависимой переменной, обусловленную изменением всех рассматриваемых аргументов, и называется коэффициентом множественнойдетерминации.

Для оценки тесноты частной взаимосвязи функции и каждого аргумента служит коэффициент частной корреляции. Этот статистический показатель учитывает тесноту взаимосвязи функции и одного из показателей-аргументов при условии, что остальные аргументы закреплены на уровне своих средних значений и не влияют на функцию. Коэффициент частной корреляции обозначается индексом r yx i, где i—порядковый номер оцениваемого аргумента) и рассчитывается по формуле

{ 1 -R2 n } } ½

r yx i = { 1 - ----------------} (30)

{ 1 -R2 n — 1}

где R2 n — квадрат коэффициента множественной корреляции для п аргументов;

R2 n — 1 —-квадрат коэффициента множественной корреляции для n—1 аргументов без i-того^. Как видно из формулы (30), коэффициент частной корреляции позволяет выделить уменьшение изменчивости фактических значений функции вокруг расчетных, связанное с введением в расчет уравнения множественной регрессии i -того аргумента. Коэффициентr yx i принимает значения от 0 (при отсутствии связи) до 1 (при наличии функциональной связи). Из формулы (30) невозможноопределить знак коэффициента частной корреляции, поэтому его определяют по знаку углового коэффициента регрессии b i для данного аргумента. Значение коэффициента частной корреляции может отличаться от коэффициента парной корреляции не только по величине, но и по знаку для одной и той же задачи. При этом нужно помнить, что коэффициент частной корреляции является более объективной оценкой действительной взаимосвязи.

Оценка тесноты индивидуальной связи функции и аргумента при множественной регрессии с помощью коэффициента частной корреляции является более достоверной. Это соображение подтверждается уменьшением рассеяния точек относительно линии частной регрессии по сравнению с линией парной регрессии. Следовательно, даже при уменьшении коэффициента частной корреляции по сравнению с парным при частной регрессии наблюдается более тесная связь между функцией и аргументом.

Для расчета по формуле (30) необходимо рассчитать коэффициенты регрессии с помощью систем уравнений отдельно для пи п—1 аргументов. При этом значения коэффициентов будут различными.

Итак, в результате решения уравнения множественной регрессии, можно найти численные значения коэффициентов а, b1,b2, b3,…,bп., определить показатели тесноты связи, а именно коэффициент множественнойкорреляции R, коэффициент детерминации, коэффициенты частной корреляции r'ух i.

Несмотря на то что уравнения частной линейной регрессии характеризуют реальную взаимосвязь функции и i-того аргумента с большей достоверностью, чем уравнения парной регрессии, они во многих случаях не удовлетворяют исследователей. Недостаток уравнений частной линейной регрессии заключается в том, что анализируемая зависимость представляется в виде прямой. В действительности, большинство взаимосвязей параметров металлургических процессов имеет криволинейный характер. Любое техническое мероприятие тем эффективней, чем хуже абсолютные исходные показатели.

Для повышения достоверности взаимосвязей параметров технологического процесса необходимо определить уравнения частной криволинейной регрессии. Рассмотрим несколько способов такого определения.