Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на пэвм для студентов 3 курса, обучающихся по специальностям




НазваниеМетодические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на пэвм для студентов 3 курса, обучающихся по специальностям
страница6/10
Дата публикации22.03.2013
Размер1.7 Mb.
ТипМетодические указания
www.vbibl.ru > Экономика > Методические указания
1   2   3   4   5   6   7   8   9   10
^




Тема 4. множественная регрессия.


Линейная модель множественной регрессии имеет вид:

Y i = 0 + 1x i 1 +2x i 2 +…+ m x i m + i , (4.1.)

коэффициент регрессии j показывает, на какую величину в среднем изменится результативный признак Y, если переменную xj увеличить на единицу измерения, т. е. j является нормативным коэффициентом. Обычно предполагается, что случайная величина i имеет нормальный закон распределения с математическим ожиданием равным нулю и с дисперсией .

Анализ уравнения (4.1) и методика определения параметров становятся более наглядными, а расчетные процедуры существенно упрощаются, если воспользоваться матричной формой записи уравнения (4.2.):

Y = X  + , (4.2.)

Y – это вектор зависимой переменной размерности п  1, представляющий собой п наблюдений значений уi, Х— матрица п наблюдений независимых переменных X1, X 2, X 3 , X m, размерность матрицы Х равна п (т+1); подлежащий оцениванию вектор неизвестных параметров размерности (т+1)  1;— вектор случайных отклонений (возмущений) размерности п  1. Таким образом,
Y = , X = , =

Уравнение (4.1) содержит значения неизвестных пара­метров 0,1,2,… ,m . Эти величины оцениваются на основе выборочных наблюдений, поэтому полученные расчетные показатели не являются истинными, а представляют собой лишь их статистические оценки. Модель линейной регрес­сии, в которой вместо истинных значений параметров под­ставлены их оценки (а именно такие регрессии и приме­няются на практике), имеет вид

Y =Ха + е=, (4.3)

где а — вектор оценок параметров; е — вектор «оценен­ных» отклонений регрессии, остатки регрессии е = Y - Ха; —оценка значе­ний Y, равная Ха.

Оценка параметров модели множественной регрессии с помощью метода наименьших квадратов.

Формулу для вычисления параметров регрессионного уравнения приведем без вывода

a = (Xт X )-1 X т Y (4.4).
Одним из условий регрессионной модели является предположение о линейной независимости объясняющих переменных, т. е., решение задачи возможно лишь тогда, когда столбцы и строки матрицы ис­ходных данных линейно независимы. Для экономических показате­лей это условие выполняется не всегда. Линейная или близкая к ней связь между факторами называется мультиколлинеарностью и приводит к линейной зависимости нормальных уравнений, что делает вычисле­ние параметров либо невозможным, либо затрудняет содержатель­ную интерпретацию параметров модели. Мультиколлинеарность может возникать в силу разных причин. На­пример, несколько независимых переменных могут иметь общий вре­менной тренд, относительно которого они совершают малые колебания. В частности, так может случиться, когда значения одной независимой переменной являются лагированными значениями другой. Считают явление мультиколлинеарности в исходных данных установленным, если коэффициент парной корреляции между двумя переменными больше 0.8. Чтобы избавиться от мультиколлинеарности, в модель включают лишь один из линейно связанных между собой факторов, причем тот, который в большей степени свя­зан с зависимой переменной.

В качестве крите­рия мультиколлинеарности может быть принято соблюдение следующих неравенств:

ryxi > rxixk , ryxk > rxixk , rxixk < 0.8

Если приведенные неравенства (или хотя бы одно из них) не выполняются, то в модель включают тот фактор, который наиболее тесно связан с Y.

Оценка качества модели регрессии.
Качество модели регрессии оценивается по следующим направлениям:

  1. проверка качества всего уравнения регрессии;

  2. проверка значимости всего уравнения регрессии;

  3. проверка статистической значимости коэффициентов уравнения регрессии;

  4. проверка выполнения предпосылок МНК.


Для оценки качества модели множественной регрессии вычисляют коэффициент множественной корреляции (индекс корреляции) R и коэффициент детерминации R2 (см. формулы 3.12 и 3.13). Чем ближе к 1 значение этих характеристик, тем выше качество модели.

В многофакторной регрессии добавление дополнительных объ­ясняющих переменных увеличивает коэффициент детерминации. Следовательно, коэффициент детерминации должен быть скор­ректирован с учетом числа независимых переменных. Скоррек­тированный R2, или , рассчитывается так:

, (4.5)

где n — число наблюдений;

k — число независимых переменных.

Проверка значимости модели регрессии

Для проверки значимости модели регрессии используется F-критерий Фишера, вычисляемый по формуле:

(4.6)
Если расчетное значение с 1= к и 2 = (n - k - 1) степенями свободы, где k – количество факторов, включенных в модель, больше табличного при заданном уровне значимости, то модель считается значимой.

^ Анализ статистической значимости параметров модели

значимость отдельных коэффициентов регрессии проверяется по t-статистике пу­тем проверки гипотезы о равенстве нулю j-го параметра уравнения (кроме свободного члена):

taj = / Saj , (4.7.)

где Saj это стандартное (среднеквадратическое) отклонение коэффициента уравнения регрессии aj. Величина Saj представляет собой квадратный корень из произ­ведения несмещенной оценки дисперсии и j -го диагонального эле­мента матрицы, обратной матрице системы нормальных уравнений.

Saj = , (4.8)

где bjj - диагональный элемент матрицы (ХТ Х)-1.

Если расчетное значение t-критерия с (n - k - 1) степенями сво­боды превосходит его табличное значение при заданном уровне зна­чимости, коэффициент регрессии считается значимым. В противном случае фактор, соответствующий этому коэффициенту, следует ис­ключить из модели, при этом оставшиеся в модели параметры должны быть пересчитаны.

^ Проверка выполнения предпосылок МНК.

Проверка выполнения предпосылок МНК выполняется на основе анализа остаточной компоненты.

Анализ остатков позволяет получить представление, насколько хорошо подобрана сама модель и насколько правильно выбран метод оценки коэффициентов. Согласно общим предположениям регрессионного анализа, остатки должны вести себя как независимые (в действительности, почти независимые) одинаково распределенные случайные величины. В классических методах регрессионного анализа предполагается также нормальный закон распределения остатков.

Исследование остатков полезно начинать с изучения их графика. 0н может показать наличие какой-то зависимости, не учтенной в модели. Скажем, при подборе простой линейной зависимости между Y и X график остатков может показать необходимость перехода к нелинейной модели (квадратичной, полиномиальной, экспоненциальной) или включения в модель периодических компонент.

График остатков хорошо показывает и резко отклоня­ющиеся от модели наблюдения — выбросы. Подобным аномальным наблюдениям надо уделять особо пристальное внимание, так как их присутствие мо­жет грубо искажать значения оценок. Устранение эффектов вы­бросов может проводиться либо с помощью удаления этих точек из анализируемых данных, (эта процедура называется цензурированием), либо с помощью применения методов оценивания параметров, устойчи­вых к подобным грубым отклонениям.

Независимость остатков проверяется с помощью критерия Дарбина – Уотсона.

Корреляционная зависимость между текущими уровнями некоторой переменной и уровнями этой же переменной, сдвинутыми на несколько шагов, называется автокорреляцией.

Автокорреляция случайной составляющей нарушает одну из предпосылок нормальной линейной модели регрессии.

^ Наличие (отсутствие) автокорреляции в отклонениях проверяют с помощью критерия Дарбина – Уотсона. Численное значение коэффициента равно

(4.9)
Значение dw статистики близко к величине 2(1 r(1)), где r(1) - выборочная автокорреляционная функция остатков первого порядка. Таким образом, значение статистики Дарбина - Уотсона распределено в интервале от 0 до 4. Соответственно, идеальное значение статистики - 2 (автокорреляция отсутствует). Меньшие значения критерия соответствуют положительной автокорреляции остатков, большие значения - отрицательной. Статистика учитывает только автокорреляцию первого порядка. Оценки, получаемые по критерию, являются не точечными, а интервальными. Верхние (d2) и нижние (d1) критические значения, позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции, зависят от количества уровней динамического ряда и числа независимых переменных модели. Значения этих границ для уровня значимости = 0,05 даны в специальных таблицах (см. Приложение 2, табл. П-3). При сравнении расчетного значения dw статистики (3.3.9) с табличным могут возникнуть такие ситуации: d2 < dw < 2 ряд остатков не коррелирован; dw < d1 остатки содержат автокорреляцию; d1 < dw < d2 – область неопределенности, когда нет оснований ни принять, ни отвергнуть гипотезу о существовании автокорреляции. Если d превышает 2, то это свидетельствует о наличии отрицательной корреляции. Перед сравнением с табличными значениями dw критерий следует преобразовать по формуле dwґ=4 – dw.

Установив наличие автокорреляции остатков, переходят к улучшению модели. Если же ситуация оказалась неопределенной (d1 < dw < d2 ), то применяют другие критерии. В частности, можно воспользоваться первым коэффициентом автокорреляции

. (4.10)

Для принятия решения о наличии или отсутствии автокорреляции в исследуемом ряду фактическое значение коэффициента автокорреляции r(1) сопоставляется с табличным (критическим) значением для 5%-ного уровня значимости (вероятности допустить ошибку при принятии нулевой гипотезы о независимости уровней ряда). Если фактическое значение коэффициента автокорреляции меньше табличного, то гипотеза об отсутствии автокорреляции в ряду может быть принята, а если фактическое значение больше табличного – делают вывод о наличии автокорреляции в ряду динамики.

^ Обнаружение гетероскедастичности

Для обнаружения гетероскедастич­ности обычно используют три теста, в которых делаются различные предположения о зависимости между дисперсией случайного члена и объясняющей переменной: тест ранговой корреляции Спирмена, тест Голдфельда - Квандта и тест Глейзера [Доугерти].

При малом объеме выборки для оценки гетероскедастич­ности может использоваться метод Голдфельда — Квандта.

Данный тест используется для проверки такого типа гетероскедастичности, когда дисперсия остатков воз­растает пропорционально квадрату фактора. При этом делается предположение, что, случайная составляющая распределена нормально.

Чтобы оценить на­рушение гомоскедастичности по тесту Голдфельда - Квандта необходимо выполнить следующие шаги.

  1. Упорядочение п наблюдений по мере возрастания перемен­ной х.

  2. Разделение совокупности на две группы (соответственно с малыми и большими значениями фактора х) и определение по каждой из групп уравнений регрессии.

  3. Определение остаточной суммы квадратов для первой регрессии и второй регрессии .

  4. Вычисление отношений (или ). В числителе должна быть большая сумма квадратов.


Полученное от­ношение имеет F распределение со степенями свободы k1=n1-m и k2=n-n1-m, (m– число оцениваемых параметров в уравнении регрессии).

Если , то гетероскедастичность имеет место.

Чем больше величина F превышает табличное значение F -критерия, тем более нарушена предпосылка о равенстве дисперсий остаточ­ных величин.
^ Оценка влияния отдельных факторов на зависимую переменную на основе модели (коэффициенты эластичности,  - коэффициенты).

Важную роль при оценке влияния факторов играют коэффициен­ты регрессионной модели. Однако непосредственно с их помощью нельзя сопоставить факторы по степени их влияния на зависимую переменную из-за различия единиц измерения и разной степени ко­леблемости. Для устранения таких различий при интерпретации применяются средние частные коэффициенты эластичности Э(j) и бета-коэффициенты (j), которые рассчитываются соответственно по формулам:

(4.11.)

(4.12.)

где Sxj среднеквадратическое отклонение фактора j

где

.

Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора j на один процент. Однако он не учитывает степень колеблемости факторов.

Бета-коэффициент показывает, на какую часть величины средне­го квадратического отклонения Sy изменится зависи­мая переменная Y с изменением соответствующей независимой пере­менной Хj на величину своего среднеквадратического отклонения при фиксирован­ном на постоянном уровне значении остальных независимых пере­менных.

Указанные коэффициенты позволяют упорядочить факторы по степени влияния факторов на зависимую переменную.

Долю влияния фактора в суммарном влиянии всех факторов мож­но оценить по величине дельта - коэффициентов  (j):



где — коэффициент парной корреляции между фактором j (j = 1,...,m) и зависимой переменной.

^ Использование многофактор­ных моделей для анализа и прогнозирования развития экономических систем.

Одна из важнейших целей моделирования заключается в прогнозировании поведения исследуемого объекта. Обычно термин «прогнозирование» используется в тех ситуациях, когда требуется предсказать состояние системы в будущем. Для регрессионных моделей он имеет, однако, более широкое значение. Как уже отмечалось, данные могут не иметь временной структуры, но и в этих случаях вполне может возникнуть задача оценки значения зависимой переменной для некоторого набора независимых, объясняющих переменных, которых нет в исходных наблюдениях. Именно в этом смысле — как построение оценки зависимой переменной — и следует понимать прогнозирование в эконометрике.

При использовании построенной модели для прогнозирования делается предположение о сохранении в период прогнозирования существовавших ранее взаимосвязей переменных.

^ Построение точечных и интервальных прогнозов на основе регрессионной модели. Какие факторы влияют на ширину доверительного интервала?

Для того чтобы определить область возможных значений резуль­тативного показателя, при рассчитанных значениях факторов следует учитывать два возможных источника ошибок: рассеивание на­блюдений относительно линии регрессии и ошибки, обусловленные математическим аппаратом построения самой линии регрессии. Ошибки первого рода измеряются с помощью характеристик точ­ности, в частности, величиной Sy. Ошибки второго рода обусловле­ны фиксацией численного значения коэффициентов регрессии, в то время как они в действительности являются случайными, нормально распределенными.

Для линейной модели регрессии доверительный интервал рассчи­тывается следующим образом. Оценивается величина отклонения от линии регрессии (обозначим ее U):.

(4.13)

где


Пример 4.1.

Задача состоит в построении модели для предсказания объема реализации одного из продуктов фирмы.

Объем реализации – это зависимая переменная Y(млн. руб.) В качестве независимых, объясняющих переменных выбраны: время - X1, расходы на рекламу X 2 (тыс. руб.), цена товара X3 (руб.), средняя цена товара у конкурентов X4 (руб.), индекс потребительских расходов X5 (%).

Требуется:

  1. Осуществить выбор факторных признаков для построения двухфакторной регрессионной модели.

  2. Рассчитать параметры модели.

  3. Для оценки качества всего уравнения регрессии определить:

  1. линейный коэффициент множественной корреляции,

  2. коэффициент детерминации,

  1. Осуществить оценку значимости уравнения регрессии.

  2. Оценить с помощью t - критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии.

  3. Оценить влияние факторов на зависимую переменную по модели

  4. Построить точечный и интервальный прогноз результирующего показателя на два шага вперед



1 Построение системы показателей (факторов). Анализ матрицы коэффициентов парной корреляции. Выбор факторных признаков для построения двухфакторной регрессионной модели.

Статистические данные по всем переменным приведены в таблице 4.1. В этом примере n = 16, m = 5.

^ Таблица 4.1

YХ1X2X3X4X5
Объем реализации Время

РекламаЦенаЦена конкурентаИндекс потребительских расходов12614151710013724,814,817,398,414833,815,216,8101,219148,715,516,2103,527458,215,516104,137069,71618107432714,718,120,2107,4445818,71315,8108,5367919,815,818,2108,33671010,616,916,8109,2321118,616,317110,1307126,516,118,3110,73311312,615,416,4110,3345146,515,716,2111,8364155,81617,7112,3384165,715,116,2112,9
^ Использование инструмента Корреляция (Анализ данных в EXCEL).

Для проведения корреляционного анализа выполните следующие действия:

  1. Данные для корреляционного анализа должны располагаться в смежных диапазонах ячеек.

  2. Выберите команду СервисАнализ данных.

  3. В диалоговом окне Анализ данных выберите инструмент Корреляция, а затем щелкните на кнопке ОК.

  4. В диалоговом окне Корреляця в поле Входной интервал необходимо ввести диапазон ячеек, содержащих исходные данные. Если выделены и заголовки столбцов, то установить флажок Метки в первой строке.

  5. Выберите параметры вывода. В данном примере Новый рабочий лист.

  6. ОК.

Таблица 4.2. Результат корреляционного анализа.

Объем реализацииВремяРекламаЦенаЦена конкурентаИндекс потребительских расходовСтолбец 1Столбец 2Столбец 3Столбец 4Столбец 5Столбец 6Объем реализации1Время0.6781Реклама0.64601061Цена0.2330 .174-0.0031Цена конкурента0.226-0.0510.2040.6981Индекс потребительских расходов0.8160.9600.2730.2350.031

Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, т.е. объем реализации имеет тесную связь с индексом потребительских расходов (ryx5= 0.816), с расходами на рекламу (ryx2 = 0.646) и со временем (ryx1 = 0.678). Однако факторы Х2 и Х5 тесно связаны между собой (rх 1x5 = 0.96), что свидетельствует о наличии мультиколлинеарности. Из этих двух переменных оставим в модели Х5 - индекс потребительских расходов. В этом примере n = 16, m = 5, после исключения незначимых факторов n = 16, k =2.

  1. Выбор вида модели и оценка ее параметров

Оценка параметров регрессии осуществляется по методу наименьших квадратов по формуле , используя данные6, приведенные в таблице 4.3

Таблица 4.3

Y

X0X1X2Объем

реализацииРекламаИндекс потребительских расходов1261410013714,898,414813,8101,219118,7103,527418,2104,137019,7107432114,7107,4445118,7108,5367119,8108,3367110,6109,232118,6110,130716,5110,7331112,6110,334516,5111,836415,8112,338415,7112,9


(Xт X ) =
(Xт X )-1 =

a = (Xт X )-1 X т Y = =

Уравнение регрессии зависимости объема реализации от затрат на рекламу и индекса потребительских расходов можно записать в следующем виде:

y = -1471.314 + 9.568х1 + 15.754х2

Расчетные значения Y определяются путем последовательной подстановки в эту модель значений факторов, взятых для каждого наблюдения.

Применение инструмента Регрессия (Анализ данных в EXCEL).

Для проведения регрессионного анализа выполните следующие действия:

  1. Выберите команду СервисАнализ данных.

  2. В диалоговом окне Анализ данных выберите инструмент Регрессия, а затем щелкните на кнопке ОК

  3. В диалоговом окне Регрессия в поле Входной интервал Y введите адрес одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал Х введите адреса одного или нескольких диапазонов, которые содержат значения независимых переменных (Рисунок 4.1.).

  4. Если выделены и заголовки столбцов, то установить флажок Метки в первой строке.

  5. Выберите параметры вывода. В данном примере Новая рабочая книга

  6. В поле Остатки поставьте необходимые флажки.

  7. ОК.





Рисунок 4.1. Диалоговое окно Регрессия подготовлено к выполнению анализа данных.

Результат регрессионного анализа содержится в таблицах 4.4 –4.7. Рассмотрим содержание этих таблиц.

^ Таблица 4.4.

Регрессионная статистикаМножественный R0.927R-квадрат0.859
Нормированный R-квадрат0.837Стандартная ошибка41.473Наблюдения16.000

^ Таблица 4.5

Дисперсионный анализdfSSMSFРегрессия2136358.33468179.16739.639
Остаток1322360.1041720.008Итого15158718.438Таблица 4.6
КоэффициентыСтандартная

ошибкаt-статистикаY-пересечение-1471.314259.766-5.664Реклама9.5682.2664.223Индекс потребительских расходов15.7532.4676.386Таблица 4.7
^ ВЫВОД ОСТАТКАНаблюдениеПредсказанноеОстатки1142,25-16,252124,7012,303159,24-11,244242,35-51,355247,0226,986307,0662,947361,2070,808416,8028,209424,18-57,1810350,3216,6811345,37-24,3712334,72-27,7213386,79-55,7914352,05-7,0515353,2310,7716361,7322,27

Пояснения к таблице 4.4.

Регрессионная статистикаНаименование в отчете EXCEL Принятые наименования Формула1Множественный RКоэффициент множественной корреляции, индекс корреляции2R-квадратКоэффициент детерминации, R23Нормированный R-квадратСкорректированный R24Стандартная ошибкаСтандартная ошибка оценки5НаблюденияКоличество наблюдений, nn
Пояснения к таблице 4.5.

Df число степеней свободыSS сумма квадратовMSF критерий ФишераРегрессияk =2/k

Остатокn-k-1 = 13Итогоn-1 = 15
Пояснения к таблице 4.6.

Во втором столбце таблицы 4.6. содержатся коэффициенты уравнения регрессии a0, a1, a2. В третьем столбце содержатся стандартные ошибки коэффициентов уравнения регрессии, а в четвертом - t-статистика, используемая для проверки значимости коэффициентов уравнения регрессии.

Уравнение регрессии зависимости объема реализации от затрат на рекламу и индекса потребительских расходов можно записать в следующем виде:

y = -1471.314 + 9.568х1 + 15.754х2

3.Оценка качества всего уравнения регрессии

В таблице 4.7 приведены вычисленные (предсказанные) по модели значения зависимой переменной Y и значения остаточной компоненты .

Значение коэффициентов детерминации и множественной корреляции можно найти в таблице Регрессионная статистика.
1   2   3   4   5   6   7   8   9   10

Похожие:

Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на пэвм для студентов 3 курса, обучающихся по специальностям iconМетодические указания к изучению дисциплины и выполнению контрольной...
Приложение Содержание дисциплины (Извлечение из рабочей программы дисциплины)

Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на пэвм для студентов 3 курса, обучающихся по специальностям iconМетодические указания по выполнению контрольной работы Для студентов III курса специальностей
Методические указания по выполнению контрольной работы обсуждены на заседании кафедры бухгалтерского учета и анализа хозяйственной...

Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на пэвм для студентов 3 курса, обучающихся по специальностям iconМетодические указания к изучению дисциплины и выполнению контрольной...
...

Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на пэвм для студентов 3 курса, обучающихся по специальностям iconМетодические указания к изучению дисциплины и выполнению контрольной...
Контрольные задания

Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на пэвм для студентов 3 курса, обучающихся по специальностям iconМетодические указания по выполнению контрольной работы для студентов...
Методические указания предназначены для самостоятельной работы студентов 4 и 5-го курсов заочной формы обучения всех специальностей...

Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на пэвм для студентов 3 курса, обучающихся по специальностям iconТемы контрольных работ. Методические указания по выполнению контрольной...
При изучении дисциплины «Правоведение» студентам необходимо выполнить одну контрольную работу. Контрольная работа является важнейшим...

Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на пэвм для студентов 3 курса, обучающихся по специальностям iconМетодические указания по выполнению контрольной работы №1 “Топографические карты”
Задания по геодезии для студентов заочного факультета: Метод указания по выполнению контр работы № Новосибирск, сгга. 2001. 27 с

Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на пэвм для студентов 3 курса, обучающихся по специальностям iconМетодические указания по выполнению контрольной работы
Выполнению работы предшествует всестороннее изучение теоретического и практического материала, отраженного в рекомендуемых к изучению...

Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на пэвм для студентов 3 курса, обучающихся по специальностям iconМетодические указания к изучению дисциплины и выполнению контрольной...
Одной из составляющих развития и совершенствования экономических процессов является автомобильный транспорт, с помощью которого производится...

Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на пэвм для студентов 3 курса, обучающихся по специальностям iconМетодические указания к изучению дисциплины и выполнению контрольной...
Дисциплина «Технический анализ, контроль и основы автоматизации химико-технологических процессов» входит в качестве неотъемлемой...

Вы можете разместить ссылку на наш сайт:
Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
www.vbibl.ru
Главная страница