Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву
Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Моделирование процессов с помощью уравнения парной линейной регрессииСодержание книги
Поиск на нашем сайте Линейная регрессия находит широкое применение в эконометрике ввиду четкой экономической интерпретации ее параметров. Параметризация модели осуществляется следующим образом. Линейная регрессия сводится к нахождению уравнения вида:
Уравнение вида Информационный этап заключается в формировании массива исходных (фактических, эмпирических, реальных) данных х i и у i. На этапе идентификации находят численные значения параметров
Т.е. из всего множества линий линия регрессии на графике выбирается так, чтобы сумма квадратов расстояний по вертикали между точками и этой линией была бы минимальной (рис. 1.):
Рисунок 1.1 - Линия регрессии с минимальной дисперсией остатков.
После несложных преобразований, получим следующую систему линейных уравнений для оценки параметров
Решая систему уравнений (6), найдем искомые оценки параметров
где
Следует отметить, что в данных формулах используются фактические значения массивов данных х i и у i. Возможность четкой экономической интерпретации коэффициента регрессии сделала линейное уравнение регрессии достаточно распространенным в эконометрических исследованиях. Параметр На этапе верификации оценивают качество полученной модели и ее пригодность для прогноза. Для этого необходимо: - оценить тесноту связи между фактором и результатом; - оценить качество подбора линейной функции; - оценить значимость уравнения регрессии в целом; - оценить значимость отдельных параметров уравнения регрессии. Для оценки тесноты связи между фактором и результатом для линейной регрессии используют линейный коэффициент корреляции
Между коэффициентами b и если b > 0, то r > 0, если b < 0, то r < 0. Линейный коэффициент корреляции находится в пределах: Если - отсутствие связи между признаками; - наличие нелинейной формы связи. Интерпретация значений если | если r ≈ 0 → связи нет, или → связь нелинейная. Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции
где
Остаточная дисперсия результативного признака (не объясненная уравнением) находится по формуле (16):
Общая дисперсия результативного признака находится по формуле (17):
Соответственно величина После того как найдено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров. Оценить значимость уравнения регрессии – это означает установить, соответствует ли математическая модель, выражающая зависимость между Y и Х, фактическим данным и достаточно ли включенных в уравнение объясняющих переменных Х для описания зависимой переменной Y. Оценка значимости уравнения регрессии производится для того, чтобы узнать, пригодно уравнение регрессии для практического использования (например, для прогноза) или нет. При этом выдвигают основную гипотезу о незначимости уравнения в целом, которая формально сводится к гипотезе о равенстве нулю параметров регрессии, или, что то же самое, о равенстве нулю коэффициента детерминации: Оценка значимости уравнения регрессии в целом производится на основе Согласно основной идее дисперсионного анализа, общая сумма квадратов отклонений переменной где
Схема дисперсионного анализа имеет вид, представленный в таблице 1.2 ( Таблица 1.2 – Схема дисперсионного анализа
Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину
Фактическое значение Для парной линейной регрессии Величина
Значимость отдельных параметров уравнения оценивается с помощью t -статистики по формулам:
где
Стандартная ошибка коэффициента регрессии
где Стандартная ошибка параметра
Стандартная ошибка параметра r xy определяется по формуле (27):
Для оценки существенности каждого параметра фактическое значение Существует связь между
Таким образом, проверка гипотез о значимости коэффициента регрессии и коэффициента корреляции проводится одинаково. Если коэффициент регрессии статистически значимый, то коэффициент корреляции тоже статистически значимый. Чтобы иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению, определяют среднюю ошибку аппроксимации: Средняя ошибка аппроксимации не должна превышать 8–10%. Для построения прогноза по уравнению регрессии необходимо подставить в уравнение Однако точечный прогноз очень ненадежен. Вероятность того, что реальное значение у совпадет с прогнозным
где Среднюю ошибку прогноза можно определить по формуле (30):
где
Стандартная ошибка
Таким образом, можно сделать вывод, что при х = х p, Пример расчета параметров парной линейной регрессии
В таблице 1.3 приведены данные о доле в расходах, направленной на потребление продуктов питания и заработной плате по нескольким регионам Уральского Федерального округа. Так как заработная плата характеризует одну из статей доходов домохозяйств, причем основную, а доля расходов на потребление продуктов питания – основную статью расходов, эти два показателя должны быть связаны между собой. Х – заработная плата; У – доля расходов на потребление продуктов питания, так как доля расходов зависит от заработной платы. Задание: 1) параметризация: подобрать уравнение связи; 2) идентификация: идентифицировать параметры уравнения, измерить тесноту связи между фактором и результатом; 3) верификация: оценить надежность модели, сделать выводы; 4) прогнозирование: - оценить уровень потребления при заданной заработной плате 58,0 млн.руб. - оценить уровень потребления при заданной заработной плате равной ( Порядок решения: 1) Параметризация: выберем для подбора параметров уравнение парной линейной регрессии, как получившее наибольшее распространение, наиболее легко идентифицируемое и интерпретируемое. Общий вид уравнения парной линейной регрессии в соответствии с формулой (4) следующий: у = а + bх + e 2) На этапе идентификации необходимо вместо буквенных обозначений параметров а и b найти числа, соответствующие данной парной регрессии. Найдем параметры а и b по формулам (7) и (8). Все предварительные расчеты приведены в таблице 3.
Таблица 1.3 – исходные данные для расчетов
Итого |
405,2 |
384,3 |
22162,3 |
21338,4 |
23685,8 |
210,3 |
0,646 |
230,47 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Ср. знач. |
57,9 |
54,9 |
3166,0 |
3048,3 |
3383,7 |
30,05 |
0,092 |
32,924 |


Также для определения параметров уравнения можно воспользоваться встроенной функцией категории «Статистические» → «ЛИНЕЙН». Подробнее об использовании этой функции см. Приложение 3.
Таким образом, по формуле (3) мы получили следующее уравнение парной линейной регрессии:

Вывод: при увеличении доходов на 1 млн. руб. потребление снижается на 360,7 тыс. руб.
Оценим тесноту связи между фактором и результатом с помощью линейного коэффициент корреляции
(14), (9), (17):




Вывод: связь обратная, слабая. При увеличении доходов потребление снижается с невысокой вероятностью.
3) На этапе верификации оценим качество модели. Для этого рассчитаем ошибку аппроксимации, коэффициент детерминации, F -критерий, t -статистику.
Рассчитаем ошибку аппроксимации по формуле (29) и столбцу 10 таблицы 3:
, или 9,2%.
Вывод: Ошибка аппроксимации на превышает 8-10%, модель довольно точно описывает данные.
Рассчитаем коэффициент детерминации по формуле (15), (16) и (17) или воспользуемся встроенной функцией категории «Статистические» → «ЛИНЕЙН»:

Вывод: уравнение объясняет всего 12,5% вариации результата
Рассчитаем F -критерий по формулам (19) и (21) или воспользуемся встроенной функцией категории «Статистические» → «ЛИНЕЙН»:

Определим F табл по таблице Приложения 1. Степени свободы числителя и знаменателя определим по таблице 2 (стр10). Число наблюдений – 7, параметр при х один – это b. Таким образом, k 1 = 1, k 2 = 5.
F табл = 6,61
Вывод: F факт < F табл следовательно гипотезу о статистической незначимости уравнения связи нужно принять. Уравнение связи статистически незначимо, то есть значения параметров могли быть получены случайным образом.
Рассчитаем t -статистику для каждого параметра по формулам (22)-(28) или воспользуемся встроенной функцией категории «Статистические» → «ЛИНЕЙН»:


Определим t табл для 5 степеней свободы и вероятности 0,95 по таблице Приложения 3. При поиске табличного значения учтем, что t-критерий симметричен относительно оси х, поэтому сравниваем значения фактические и табличные по модулю.
t табл = 2,4669
Вывод:
меньше t табл следовательно с вероятностью 95% параметры r и b признаются статистически незначимыми.
В свою очередь,
больше t табл следовательно с вероятностью 95% параметр а признается статистически значимым.
4) прогнозирование: оценим уровень потребления при заданной заработной плате 58,0 млн. руб. на доверительном интервале с заданной вероятностью по формулам (30) и (31).
Для нахождения
подставим в уравнение связи заданное значение х:
млн. руб.
Вывод: при уровне заработной платы на уровне 58 млн. руб. потребление составит 54,86 млн. руб. Однако точечный прогноз явно не реален, вероятность того, что реальное значение у совпадет с прогнозным
, очень маленькая, практически нулевая. Поэтому для повышения надежности прогноза определим доверительный интервал.
Стандартную ошибку прогноза
определим по формуле (32) или воспользуемся встроенной функцией категории «Статистические» → «ЛИНЕЙН»:

Тогда среднюю ошибку прогноза определим по формуле (30). Для этого самостоятельно зададим требуемый уровень надежности (90%, 95% или 99%) и по таблице Приложения 3 для 5 = 7 - 2 степеней свободы определим t табл. Пусть уровень надежности равен 90%, тогда t табл = 2,0150.
млн. руб.
Тогда границы доверительного интервала составят:
(54,86-13,07) млн. руб. <
< (54,86+13,07) млн. руб.
или 41,79 млн. руб. <
< 67,93 млн. руб.
Вывод: с вероятностью 90% при заработной плате на уровне 58 млн. руб. потребление составит [41,79; 67,93].
Далее оценим уровень потребления при заданной заработной плате равной (
+5%).
Для этого сначала рассчитаем уровень заработной платы, для которого нужно построить прогноз. Средняя заработная плата по данным таблицы 3 составляет 57,9 млн. руб. Найдем уровень заработной платы (Xi) для построения прогноза как:
57,9 х (1 + 0,05) = 60,8 млн. руб.
5) Далее проведем все действия аналогично предыдущему прогнозу. Сначала оценим уровень потребления при заданной заработной плате 60,8 млн. руб. на интервале с заданной вероятностью по формулам (30) и (31).
Для нахождения
подставим в уравнение связи заданное значение Xi:
млн. руб.
Вывод: при уровне заработной платы на уровне Xi = (
+5%) млн. руб. потребление составит 53,86 млн. руб. Однако точечный прогноз явно не реален, вероятность того, что реальное значение у совпадет с прогнозным
, очень маленькая, практически нулевая. Поэтому для повышения надежности прогноза определим доверительный интервал прогноза.
Стандартная ошибку прогноза
зависит от уравнения связи, поэтому для всех прогнозов по данному уравнению она постоянна. Поэтому, если не менять уровень надежности, то и средняя ошибка не изменится. Поэтому можно сразу построить прогноз:
(53,86-13,07) млн. руб. <
< (53,86+13,07) млн. руб.
или 40,79 млн. руб. <
< 66,93 млн. руб.
Вывод: с вероятностью 90% при заработной плате на уровне (
+5%) млн. руб. потребление составит [40,79; 66,93].
С помощью мастера диаграмм нанесем на график исходные данные и линии, характеризующие взаимосвязь, см. пример на рисунке 2.

Рисунок 1.2 – Зависимость потребления от заработной платы
Для того, чтобы нанести на диаграмму уравнение связи и оценку аппроксимации (R2) воспользуемся функцией «Дополнительные параметры линии тренда» меню «Диаграмма», как на рисунке 3.

Рисунок 1.3 – Работа с диаграммой MS Excel
|
| Поделиться: |
Познавательные статьи:
Последнее изменение этой страницы: 2020-11-23; просмотров: 132; Нарушение авторского права страницы; Мы поможем в написании вашей работы!
infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 216.73.216.198 (0.011 с.)