<<
>>

2.2. Вывод итогов и оценка параметров уравнения регрессии

Результаты решения уравнения регрессии, которые в программе Excel даются в виде единой таблицы под заголовком ВЫВОД ИТОГОВ, у нас представлены в виде четырех блоков (см. таблицы 2.2,2.3, 2.4 и 2.5).

Так, в таблице 2.2 сгенерированы результаты по регрессионной статистике; в таблице 2.3 дается дисперсионный анализ; в таблице 2.4 оценивается статистическая значимость коэффициентов регрессии; а в таблице 2.5 даются найденные по данному уравнению регрессии расчетные значения курса доллара yрасчет и остатки.

Будем знакомиться с этими таблицами по раздельности, но при этом, чтобы не потонуть в потоке информации будем обращать внимание только на наиболее важные для прогнозирования параметры вывода данных (выделены жирным шрифтом). Более подробно о параметрах вывода данных по итогам решения уравнения регрессии можно прочитать в моей книге ‑ «Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews», ‑ стр. 22-40.

В таблице 2.2. следует обратить внимание на параметры R-квадрат и Нормированного R-квадрата.

R-квадрат или R2, о котором мы уже говорили в главе 1, называется коэффициентом детерминации. Как мы уже знаем, что он дается на диаграмме в случае построения тренда графическом способе. Нормированный R-квадрат в статистической литературе иногда называют еще и скорректированным коэффициентом детерминации.

Параметры, представленные в таблице 2.2, оценивают уровень аппроксимации фактических данных, полученный с помощью данного уравнения регрессии. Так, здесь R2=0,8933, а это означает, что линейный тренд объясняет 89,33 % всей динамики курса доллара к рублю, то есть в данном случае мы получили довольно высокий уровень коэффициента детерминации.

Можно также сказать несколько иначе: в данном уравнении тренда изменения независимой переменной «Порядковый номер торгового дня» на 89,33 % объясняет динамику зависимой переменной «Курс доллара к рублю».

Кстати, при графическом способе решения уравнения тренда – по тем же рыночным данным и за тот же период времени – величина коэффициента детерминации R2 также оказалась равна 0,8933 – см. рис. 1.20.

Чем ближе коэффициент детерминации к 1, тем теснее связь между переменными, включенными в уравнение регрессии. Как я уже говорил, для целей торговли, нужно использовать линейный тренд с коэффициентом детерминации не ниже R2=0,80.

Когда максимальное значение коэффициента детерминации равно 1, то в этом случае можно сказать, что динамика зависимой переменной на 100% объясняется изменением независимой переменной. В этом случае также говорят, что между переменными существует функциональная связь. Это будет означать, что в динамике тренда нет случайной компоненты, но, вполне очевидно, что на практике этого в колебаниях курсов валют никогда не бывает.

Нормированный R2 имеет смысл использовать, когда нам придется сравнивать уравнения регрессии с различным количеством включенных в него независимых переменных. Дело в том, что при добавлении в уравнении регрессии независимых переменных величина коэффициента детерминации R2 соответственно растет. Поэтому для того чтобы сделать сравнения коэффициентов детерминации между уравнениями регрессии с разным числом факторов сопоставимыми, используется нормированный (скорректированный) R2, величина которого корректируется в сторону уменьшения при добавлении в уравнение дополнительных факторов. При прочих равных условиях предпочтение будем отдавать тому уравнению, в котором нормированный R2 будет выше.

Еще один параметр в таблице 2.2. Наблюдения=109 говорит о том, что в данное уравнение регрессии получено на основе данных по итогам торгов за 109 торговых дней.

Таблица 2.2. Регрессионная статистика

Источник: расчеты автора

В таблице 2.3 дается дисперсионный анализ (от лат. dispersio, что в переводе означает разброс, рассеяние), суть которого заключается в изучении влияния одной или нескольких независимых переменных на зависимую результативную переменную.

В данном случае дается анализ изменения результативного признака «Курс доллара к рублю» под воздействием включенной в уравнение регрессии одной независимой переменной – «Порядковый номер торгового дня». Здесь в столбце значимость F дается уровень статистической значимости в целом уравнения регрессии.

Следует иметь в виду, что чем ближе значимость F к нулю, тем более обоснованным будет наш вывод о статистической значимости в целом всего уравнения регрессии. Причем, если значимость F меньше 0,01, то можно говорить о статистической значимости уравнения регрессии с 1% значимостью (или 99% уровнем надежности). Если значимость F больше 0,01, но меньше 0,05, то тогда говорят о статистической значимости уравнения регрессии с 5% значимостью (или 95% уровнем надежности).

Таблица 2.3. Дисперсионный анализ

Источник: расчеты автора

Правда, значимость F-критерия в данном случае дается Excel в экспоненциальном виде, который может быть непонятен для некоторых неискушенных в математике читателей. Для тех, кто хочет разобраться, хочу заметить, что число в экспоненциальном виде легко преобразовать в обычную цифру. Например, 1,60E+04=1*10^4=16000, а 1,60E-04 = 1*(1/10^4)=0,00016. При этом E+04 в данном случае означает умножение 1,60 на 104, а E-04 означает умножение 1,60 на 10-4 или (что одно и то же) умножение 1,60 на 1/104.

Тот, кто не хочет ломать голову над числом в экспоненциальном виде, может эту проблему решить, преобразовав формат данной ячейки с экспоненциального в числовой. С этой целью наведем курсор мышки на эту ячейку, и, щелкнув ее правой кнопкой, в появившемся диалоговом окне выберем опцию ФОРМАТ ЯЧЕЕК. После этого появится диалоговое окно ФОРМАТ ЯЧЕЕК, в котором нужно выбрать опцию ЧИСЛОВОЙ – см. рис. 2.2. В результате нам удастся выяснить, что значимость F=0,00. Следовательно, в данном случае значимость F меньше 0,01, то есть можно сделать вывод, об 1% статистической значимости этого уравнения регрессии с (или 99% уровнем надежности).

Хочу обратить внимание читателей, что для большей надежности для целей прогнозирования лучше использовать уравнения регрессии со значимостью F меньше 0,01.

Рис. 2.2

В таблице 2.4 представлены коэффициенты уравнения регрессии и оценки их статистической значимости. При этом в разделе Коэффициенты цифра 32,10052 слева от Y-ПЕРЕСЕЧЕНИЕ в формуле линейного тренда: Y=AX+С обозначает исходный уровень (его также называют свободный член или константа), то есть дает числовое значение буквы С. А вот коэффициент 0,123085 слева от независимой переменной «Порядковый номер торгового дня» дает числовое значение буквы A в формуле линейного тренда.

Следовательно, в результате решения в Excel уравнения регрессии нами получена следующая формула для расчета линейного тренда (числовые значения после запятой округлены до четырех знаков):

Y = 0,1231X + 32,1005

Где: Y‑ курс доллара к рублю по итогам торгового дня, а X – порядковый номер торгового дня.

Интерпретация данного уравнения регрессии следующая: с каждым торговым днем (увеличением номера торгового дня X на одну единицу) величина курса доллара Y за период с 27 июня по 28 ноября 2014 года в среднем вырастала на 12,31 копейки при исходном уровне, то есть расчетном значении курса доллара к рублю перед началом торгов 27 июня 2014 года, равном 31,1005 рублей.

Заметим, что такую же формулу мы получили и графическим способом – см. рис. 1.16, поскольку при графической аппроксимации колебаний независимой переменной трендом также используется МНК.

Особое внимание следует обратить на столбец Р-ЗНАЧЕНИЕ, в котором сгенерированы уровни значимости, соответствующие вычисленным в предыдущем столбце значениям t-статистики. Причем, если Р-значение меньше 0,01, то можно говорить о статистической значимости соответствующего члена уравнения регрессии с 1% значимостью (или 99% уровнем надежности). Если Р-значение больше 0,01, но меньше 0,05, то тогда говорят о статистической значимости соответствующего члена уравнения регрессии с 5% значимостью (или 95% уровнем надежности). Для большей надежности лучше для целей прогнозирования использовать члены уравнения регрессии с Р-значением меньше 0,01.

В таблице 2.3 оба Р-значения даются Excel в экспоненциальной форме, но мы уже знаем, как их можно преобразовать в числовой формат. В результате выясним, что оба Р-значения равны 0,00. Отсюда легко сделать вывод, что коэффициенты A и С в формуле линейного тренда имеют 1% статистическую значимостью (или 99% уровень надежности).

В таблице 2.3 нужно также обратить внимание на столбцы Нижние 95% и 99% и Верхние 95% и 99%, которые показывают соответственно нижние и верхние интервалы значений коэффициентов при 95% и 99 % уровнях надежности, заданных пользователем Excel. Причем, если при переходе того или иного коэффициента от столбца Нижние к столбцу Верхние происходит смена знака от минуса к плюсу или наоборот, данный коэффициент считают статистически незначимым для данного уровня надежности. Вполне очевидно, что в практических расчетах столь неоднозначно изменяющийся коэффициент уравнения, который может быть как положительным, так и отрицательным, либо даже равен 0, нельзя использовать.

Таблица 2.4. Коэффициенты уравнения регрессии и оценки их статистической значимости

Источник: расчеты автора

Как мы уже говорили ранее, уравнение регрессии в отличие от обычных уравнений, оценивающих функциональную, т. е. жестко детерминированную связь между переменными, дает прогноз зависимой (результативной) переменной с учетом воздействия случайного фактора, поэтому фактические значения результативного признака практически всегда отличаются от его расчетных (теоретических) значений. Далее покажем, как находится для каждого наблюдения (торгового дня) величина случайной компоненты, то есть остатка.

В таблице 2.5 даются найденные по данному уравнению регрессии расчетные значения курса доллара yрасчет (см. раздел Предсказанное Курс доллара к рублю и остатки (см. раздел Остатки). Расчетный курс доллара к рублю вычисляется для торгового дня №1 по уже найденной нами формуле:

Y расчет = 0,1231X + 32,1005=0,1231*1+ 32,1005=32,2236

Таким образом для наблюдения 1, то есть для торгового дня с порядковым №1 (27 июня 2014 года) расчетный курс доллара к рублю оказался равен 32,2236 рублям.

При этом остаток для каждого наблюдения (торгового дня) находится путем вычитания из фактического курса доллара его расчетного значения на этот торговый день. Так, фактический курс доллара для торгового дня № 1 равен 33,6306 рублей. Тогда остаток для этого наблюдения равен:

Остаток для наблюдения 1 = 33,6306-32,2236=1,4070 рублей.

Таблица 2.5. Вывод остатка

Источник: расчеты автора

Теперь нам нужно оценить относительную точность уравнения регрессии с учетом величины полученных остатков. С этой целью построим таблицу 2.6, в которую возьмем данные из таблицы 2.5. Плюс правее раздела «Наблюдение» добавим в новую таблицу раздел «Фактический курс доллара к рублю». Кроме того, для последующих расчетов в таблицу 2.6 добавим правее раздела «Остатки» еще разделы «Остатки по модулю» и «Средняя ошибка аппроксимации, в %».

«Остатки по модулю» в Excel легко найти с помощью функции ABS. Сделать это можно двумя способами.

Первый способ. В пустой ячейке (ячейка D2), расположенной в первом ряду под заголовком столбца «Остатки по модулю» (ячейка C2), нужно напечатать английскими буквами = ABS. Сразу всплывет подсказка этой функции, которую нужно щелкнуть левой кнопкой мышки, а затем навести курсор на ячейку с остатком для наблюдения 1 и закрыть скобку этой функции. Таким образом получим следующий результат: ABS(1,4070)= 1,4070, то есть «Остаток по модулю» для наблюдения 1 равен 1,4070.

Второй способ. Нужно навести курсор на ту же пустую ячейку (ячейка D2). Потом надо щелкнуть левой кнопкой мышки иконку ФОРМУЛЫ, расположенную вверху рабочего листа Excel, а затем щелкнуть появившуюся иконку Fx. После этого на экране возникнет диалоговое окно МАСТЕР ФУНКЦИЙ, в котором внизу надписи ВЫБЕРИТЕ ФУНКЦИЮ: остается только выбрать функцию ABS ‑ см. рис. 2.3.

Рис.2.3

В результате появится окно АРГУМЕНТЫ ФУНКЦИИ ABS – см. рис. 2.4. Сразу после этого надо навести курсор мышки на ячейку с численным значением остатка для наблюдения 1 (ячейка D2), равное 1,4070. Это нам, как и при первом способе работы с функцией, позволит получить тот же результат ABS(1,4070)= 1,4070.

Рис. 2.4

Далее, перемещая курсор мышки вниз по столбцу «Остатки по модулю» (ячейки D2:D110), найдем с помощью функции ABS остатки по модулю для всех остальных 109 наблюдений – см. таблицу 2.6. Прежде чем тянуть курсор мышки вниз, нужно сначала его навести на правый угол ячейки C35 и при этом убедиться, что он приобрел форму черного крестика.

Для тех, кто не силен в математике, скажу, что функция ABS, меняя знак у отрицательных остатков, у положительных остатков его не меняет. Например, отрицательный «Остаток по модулю» для наблюдения 105 становится положительным: ABS(-0,2392)= 0,2392. Если же суммировать все остатки, не беря их по модулю, то сумма их отрицательных и положительных значений будет взаимно погашаться и будет равна нулю для уравнений регрессии со свободным членом, а без свободного члена – близка к нулю. Все это не позволяет найти среднюю ошибку аппроксимации без преобразования остатков по модулю.

Чтобы найти среднюю ошибку аппроксимации (в %) для каждого наблюдения надо относящийся к нему «Остаток по модулю» поделить на «Фактический курс доллара к рублю», а полученный результат умножить на 100. Так, для наблюдения 1, «Средняя ошибка аппроксимации»= 1,4070/33,6306*100=4,2%.

После того как мы найдем для всех наблюдений средние ошибки аппроксимации, их нужно сложить. В результате получим итоговую сумму = 311,1– см. таблицу 2.6. Потом эту сумму нужно поделить на общее количество наблюдений, то есть в данном случае на 109.

В результате выясним, что средняя ошибка аппроксимации равна 2,9%. Для справки замечу, что в статистической литературе рекомендуется делать прогнозы по статистическим моделям лишь в том случае, если средняя ошибка аппроксимации у них не превышает 7%-10%.

Таблица 2.6. Оценка средней ошибки аппроксимации, в %

Источник: расчеты автора и данные Банка России

<< | >>
Источник: Владимир Брюков. Как предсказать курс доллара. 2017

Еще по теме 2.2. Вывод итогов и оценка параметров уравнения регрессии:

  1. Согласование предварительных результатов оценки и выве-дение итоговой величины стоимости
  2. Параметры оценки финансовой деятельности
  3. Параметры оценки использования ресурсов
  4. Параметры оценки коммерческой деятельности
  5. Оценка уровня знания и умения. Основные понятия и параметры
  6. Оценка бюджетных параметров без учета вклада нефтегазового сектора и влияния мировых цен на нефть
  7. Уравнение «инфузии»
  8. Применение Трендовых Каналов Регрессии
  9. Концепции, лежащие в основе дифференциального уравнения БлэкаШоулзаМертона
  10. Подведение итогов
  11. Средняя регрессия
  12. Ценность денег: уравнение обмена и «количественный подход»
  13. Разделение между уравнением обмена и количественной теорией
  14. Уравнение диффузии