Временные ряды в эконометрических исследованиях

ВРЕМЕННЫЕ РЯДЫ В ЭКОНОМЕТРИЧЕСКИХ ИССЛЕДОВАНИЯХ.

Временнoй ряд – это совокупность значений какого – либо показателя за несколько последовательных моментов или периодов времени. Каждое значение (уровень) временного ряда формируется под воздействием большого числа факторов, которые можно условно разделить на три группы:

Тенденция характеризует долговременное воздействие факторов на динамику показателя. Тенденция может быть возрастающей или убывающей.

Циклические колебания могут носить сезонный характер или отражать динамику конъюнктуры рынка, а также фазу бизнес – цикла, в которой находится экономика

Реальные данные часто содержат все три компоненты. В большинстве случаев временной ряд можно представить как сумму или произведение трендовой , циклической и случайной компонент. В случае суммы имеет место аддитивная модель временного ряда:

(1)

в случае произведения – мультипликативная модель:

(2)

Основная задача эконометрического исследования отдельного временного ряда – выявление количественного выражения каждой из компонент и использование полученной информации для прогноза будущих значений ряда или построение модели взаимосвязи двух или более временных рядов.

Сначала рассмотрим основные подходы к анализу отдельного временного ряда. Такой ряд может содержать, помимо случайной составляющей, либо только тенденцию, либо только сезонную (циклическую) компоненту, либо все компоненты вместе. Для того, чтобы выявить наличие той или иной неслучайной компоненты, исследуется корреляционная зависимость между последовательными уровнями временного ряда, или автокорреляция уровней ряда. Основная идея такого анализа заключается в том, что при наличии во временном ряде тенденции и циклических колебаний значения каждого последующего уровня ряда зависят от предыдущих.

Количественно автокорреляцию можно измерить с помощью линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени.

Коэффициент автокорреляции уровней ряда первого порядка измеряет зависимость между соседними уровнями ряда и т.е. при лаге 1.

Он вычисляется по следующей формуле:

(3)

где в качестве средних величин берутся значения:

(4)

В первом случае усредняются значения ряда, начиная со второго до последнего, во втором случае — значения ряда с первого до предпоследнего.

Формулу (3) можно представить как формулу выборочного коэффициента корреляции:

(5)

где в качестве переменной берется ряд а в качестве переменной ряд

Если значение коэффициента (3) близко к единице, это указывает на очень тесную зависимость между соседними уровнями временного ряда и о наличии во временном ряде сильной линейной тенденции.

Аналогично определяются коэффициенты автокорреляции более высоких порядков. Так, коэффициент автокорреляции второго порядка характеризует тесноту связи между уровнями и и определяется по формуле:

(6)

где в качестве одной средней величины берут среднюю уровней ряда с третьего до последнего, а в качестве другой — среднюю с первого уровня до

(7)

Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Для обеспечения статистической достоверности максимальный лаг, как считают некоторые известные эконометристы, не должен превышать четверти общего объема выборки.

Коэффициент автокорреляции строится по аналогии с линейным коэффициентом корреляции, и поэтому он характеризует тесноту только линейной связи текущего и предыдущего уровней ряда. По нему можно судить о наличии линейной или близкой к линейной тенденции. Однако для некоторых временных рядов с сильной нелинейной тенденцией (например, параболической или экспоненциальной), коэффициент автокорреляции уровней ряда может приближаться к нулю.

Кроме того, по знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уровнях ряда. Большинство временных рядов экономических данных имеют положительную автокорреляцию уровней, однако при этом не исключается убывающая тенденция.

Последовательность коэффициентов автокорреляции уровней различных порядков, начиная с первого, называется автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага называется коррелограммой. Анализ автокорреляционной функции и коррелограммы помогает выявить структуру ряда. Здесь уместно привести следующие качественные рассуждения.

Если наиболее высоким является коэффициент автокорреляции первого порядка, очевидно, исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент автокорреляции порядка ?,ряд содержит циклические колебания с периодичностью в ? моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, то либо ряд не содержит тенденции и циклических колебаний и имеет только случайную составляющую, либо ряд содержит сильную нелинейную тенденцию, для исследования которой нужно провести дополнительный анализ.

Пример. Пусть имеются данные об объёмах потребления электроэнергии жителями района за 16 кварталов, млн. квт.-ч:

t

y t 6,0 4,4 5,0 9,0 7,2 4,8 6,0 10,0 8,0 5,6 6,4 11,0 9,0 6,6 7,0 10,8

Нанесем эти значения на график:

Определим автокорреляционную функцию данного временного ряда. Рассчитаем коэффициент автокорреляции первого порядка. Для этого определим средние значения:

С учетом этих значений можно построить вспомогательную таблицу:

t

t

1 6,0 -1,0667 1,137778
2 4,4 -2,9867 -2,6667 3,185778 8,920178 7,111111
3 5,0 -2,3867 -2,0667 6,364444 5,696178 4,271111
4 9,0 1,6133 1,9333 -3,33422 2,602844 3,737778
5 7,2 -0,1867 0,1333 -0,36089 0,034844 0,017778
6 4,8 -2,5867 -2,2667 -0,34489 6,690844 5,137778
7 6,0 -1,3867 -1,0667 3,143111 1,922844 1,137778
8 10,0 2,6133 2,9333 -2,78756 6,829511 8,604444
9 8,0 0,6133 0,9333 1,799111 0,376178 0,871111
10 5,6 -1,7867 -1,4667 -1,66756 3,192178 2,151111
11 6,4 -0,9867 -0,6667 1,447111 0,973511 0,444444
12 11,0 3,6133 3,9333 -2,40889 13,05618 15,47111
13 9,0 1,6133 1,9333 6,345778 2,602844 3,737778
14 6,6 -0,7867 -0,4667 -1,52089 0,618844 0,217778
15 7,0 -0,3867 -0,0667 0,180444 0,149511 0,004444
16 10,8 3,4133 -0,22756 11,65084

Итог

9,813333 65,3173 54,0533

С помощью итоговых сумм подсчитаем величину коэффициента автокорреляции первого порядка:

Это значение свидетельствует о слабой зависимости текущих уровней ряда от непосредственно им предшествующих. Однако из графика очевидно наличие возрастающей тенденции уровней ряда, на которую накладываются циклические колебания.

Продолжая аналогичные расчеты для второго, третьего и т.д. порядков, получим автокорреляционную функцию, значения которой сведем в таблицу:

Лаг
0,16515 0,56687 0,11355 0,98302 0,11871 0,72204 0,00336 0,97384

Из коррелограммы видно, что наиболее высокий коэффициент корреляции наблюдается при значении лага, равном четырем, следовательно, ряд имеет циклические колебания периодичностью в четыре квартала. Это подтверждается и графическим анализом структуры ряда.

В случае, если при анализе структуры временного ряда обнаружена только тенденция и отсутствуют циклические колебания (случайная составляющая присутствует всегда), следует приступать к моделированию тенденции. Если же во временном ряде имеют место и циклические колебания, прежде всего следует исключить именно циклическую составляющую, и лишь затем приступать к моделированию тенденции. Выявление тенденции состоит в построении аналитической функции, характеризующей зависимость уровней ряда от времени, или тренда. Этот способ называют аналитическим выравниванием временного ряда.

Зависимость от времени может принимать разные формы, поэтому для её формализации используют различные виды функций:

.

Параметры каждого из трендов можно определить обычным МНК, используя в качестве независимой переменной время , а в качестве зависимой переменной – фактические уровни временного ряда yt (или уровни за вычетом циклической составляющей, если таковая была обнаружена).

Для нелинейных трендов предварительно проводят стандартную процедуру их линеаризации.

Существует несколько способов определения типа тенденции. Чаще всего используют качественный анализ изучаемого процесса, построение и визуальный анализ графика зависимости уровней ряда от времени, расчет некоторых основных показателей динамики. В этих же целях можно использовать и коэффициенты автокорреляции уровней ряда. Тип тенденции можно определить путем сравнения коэффициентов автокорреляции первого порядка, рассчитанных по исходным и преобразованным уровням ряда. Если временной ряд имеет линейную тенденцию, то его соседние уровни y t и yt-1 тесно коррелируют. В этом случае коэффициент автокорреляции первого порядка уровней исходного ряда должен быть высоким. Если временной ряд содержит нелинейную тенденцию, например, в форме экспоненты, то коэффициент автокорреляции первого порядка по логарифмам уровней исходного ряда будет выше, чем соответствующий коэффициент, рассчитанный по уровням ряда. Чем сильнее выражена нелинейная тенденция в изучаемом временном ряде, тем в большей степени будут различаться значения указанных коэффициентов.

Выбор наилучшего уравнения в случае, если ряд содержит нелинейную тенденцию, можно осуществить путем перебора основных форм тренда, расчета по каждому уравнению скорректированного коэффициента детерминации и выбора уравнения тренда с максимальным значением этого коэффициента. Реализация этого метода относительно проста при компьютерной обработке данных.

При анализе временных рядов, содержащих сезонные или циклические колебания, наиболее простым подходом является расчет значений сезонной компоненты методом скользящей средней и построение аддитивной или мультипликативной модели временнoго ряда в форме (1) или (2).

Если амплитуда колебаний приблизительно постоянна, строят аддитивную модель (1), в которой значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель (2), которая ставит уровни ряда в зависимость от значений сезонной компоненты.

модели (1) или (2) сводится к расчету значений Т, S или Е для каждого уровня ряда. Процесс построения модели включает в себя следующие шаги:

Пример. Построение аддитивной модели временного ряда. Рассмотрим данные об объёме потребления электроэнергии жителями района из ранее приведенного примера. Из анализа автокорреляционной функции было показано, что данный временнoй ряд содержит сезонные колебания периодичностью в 4 квартала. Объёмы потребления электроэнергии в осенне – зимний период (I и IV кварталы) выше, чем весной и летом (II и III кварталы).

По графику этого ряда можно установить наличие приблизительно равной амплитуды колебаний. Это говорит о возможном наличии аддитивной модели. Рассчитаем её компоненты.

Шаг 1. Проведем выравнивание исходных уровней ряда методом скользящей средней.

Поскольку циклические колебания имеют периодичность в 4 квартала, просуммируем уровни ряда последовательно за каждые 4 квартала со сдвигом на один момент времени и определим условные годовые объёмы потребления электроэнергии (колонка 3 в таблице 1).

Разделив полученные суммы на 4, найдем скользящие средние (колонка 4 таблицы 1).

Полученные таким образом выровненные значения уже не содержат сезонной компоненты.

Поскольку скользящие средние получены осреднением четырех соседних уровней ряда, т.е. четного числа значений, они соответствуют серединам подынтервалов, состоящих из четверок чисел, т.е. должны располагаться между третьим и четвертым значениями четверок исходного ряда. Для того, чтобы скользящие средние располагались на одних временных отметках с исходным рядом, пары соседних скользящих средних ещё раз усредняются и получаются центрированные скользящие средние (колонка 5 таблицы 1).

При этом теряются первые две и последние две отметки временного ряда, что связано с осреднением по четырем точкам.

Таблица 1.

№ квартала

t
1 2 3 4 5 6
1 6,0
2 4,4
3 5,0 24,4 6,10 6,25 -1,250
4 9,0 25,6 6,40 6,45 2,550
5 7,2 26,0 6,50 6,625 0,575
6 4,8 27,0 6,75 6,875 -2,075
7 6,0 28,0 7,00 7,1 -1,100
8 10,0 28,8 7,20 7,3 2,700
9 8,0 29,6 7,40 7,45 0,550
10 5,6 30,0 7,50 7,625 -2,025
11 6,4 31,0 7,75 7,875 -1,475
12 11,0 32,0 8,00 8,125 2,875
13 9,0 33,0 8,25 8,325 0,675
14 6,6 33,6 8,40 8,375 -1,775
15 7,0 33,4 8,35
16 10,8

Шаг 2. Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда (колонка 2 таблицы 1) и центрированными скользящими средними (колонка 5).

Эти значения помещаем в колонку 6 таблицы 1 и используем для расчета значений сезонной компоненты (таблица 2), которые представляют собой средние за каждый квартал (по всем годам) оценки сезонной компоненты S i . В моделях с сезонной компонентой обычно предполагается, что сезонные воздействия за период (в данном случае – за год) взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по всем точкам (здесь – по четырем кварталам) должна быть равна нулю.

Таблица 2.

Год

Показатели № квартала, i
I II III IV
1 -1,250 2,550
2 0,575 -2,075 -1,100 2,700
3 0,550 -2,025 -1,475 2,875
4 0,675 -1,775
Итого за i – й квартал (за все годы) 1,800 -5,875 -3,825 8,125
Средняя оценка сезонной компоненты для i – го квартала, 0,600 -1,958 -1,275 2,708
Скорректированная сезонная компонента, 0,581 -1,977 -1,294 2,690

Для данной модели сумма средних оценок сезонной компоненты равна:

0,6-1,958-1,275+2,708=0,075.

Эта сумма оказалась не равной нулю, поэтому каждую оценку уменьшим на величину поправки, равной одной четверти полученного значения:

?=0,075/4=0,01875.

Рассчитаем скорректированные значения сезонной компоненты (они записаны в последней (8)

Эти значения при суммировании уже равны нулю:

0,581-1,977-1,294+2,69=0.

Шаг 3. Исключаем влияние сезонной компоненты, вычитая её значения из каждого уровня исходного временного ряда. Получаем величины:

T+E=Y-S (9)

Эти значения рассчитываются в каждый момент времени и содержат только тенденцию и случайную компоненту (колонка 4 следующей таблицы):

Таблица 3.

t

2

1 2 3 4 5 6 7 8
1 6,0 0,581 5,419 5,902 6,483 -0,483 0,2332
2 4,4 -1,977 6,377 6,088 4,111 0,289 0,0833
3 5,0 -1,294 6,294 6,275 4,981 0,019 0,0004
4 9,0 2,69 6,310 6,461 9,151 -0,151 0,0228
5 7,2 0,581 6,619 6,648 7,229 -0,029 0,0008
6 4,8 -1,977 6,777 6,834 4,857 -0,057 0,0032
7 6,0 -1,294 7,294 7,020 5,726 0,274 0,0749
8 10,0 2,69 7,310 7,207 9,897 0,103 0,0107
9 8,0 0,581 7,419 7,393 7,974 0,026 0,0007
10 5,6 -1,977 7,577 7,580 5,603 -0,003 0,0000
11 6,4 -1,294 7,694 7,766 6,472 -0,072 0,0052
12 11,0 2,69 8,310 7,952 10,642 0,358 0,1278
13 9,0 0,581 8,419 8,139 8,720 0,280 0,0785
14 6,6 -1,977 8,577 8,325 6,348 0,252 0,0634
15 7,0 -1,294 8,294 8,512 7,218 -0,218 0,0474
16 10,8 2,69 8,110 8,698 11,388 -0,588 0,3458

Шаг 4. Определим трендовую компоненту данной модели. Для этого проведем выравнивание ряда (Т+Е) с помощью линейного тренда:

Подставляя в это уравнение значения , найдем уровни Т для каждого момента времени (колонка 5 таблицы 3).

Шаг 5. Найдем значения уровней ряда, полученные по аддитивной модели. Для этого прибавим к уровням Т значения сезонной компоненты для соответствующих кварталов, т.е. к значениям в колонке 5 таблицы 3 прибавим значения в колонке 3. Результаты операции представлены в колонке 6 таблицы 3.

Шаг 6. В соответствии с методикой построения аддитивной модели расчет ошибки производим по формуле:

(10)

Это абсолютная ошибка. Численные значения абсолютных ошибок приведены в колонке 7 таблицы 3.

По аналогии с моделью регрессии для оценки качества построения модели или для выбора наилучшей модели можно применять сумму квадратов полученных абсолютных ошибок. Для данной аддитивной модели сумма квадратов абсолютных ошибок равна 1,10. По отношению к общей сумме квадратов отклонений уровней ряда от его среднего уровня, равной 71,59, эта величина составляет чуть более 1,5%. Следовательно, можно сказать, что аддитивная модель объясняет 98,5% общей вариации уровней временного ряда потребления электроэнергии за последние 16 кварталов.

Пример. Построение мультипликативной модели временного ряда. Пусть имеются поквартальные данные о прибыли компании за последние четыре года:

Таблица 4.

Квартал

Год

1 72 100 90 64
2 70 92 80 58
3 62 80 68 48
4 52 60 50 30

График временного ряда свидетельствует о наличии сезонных колебаний периодичностью 4 квартала и общей убывающей тенденции уровней ряда:

Прибыль компании в весенне – летний период выше, чем в осенне – зимний период. Поскольку амплитуда сезонных колебаний уменьшается, можно предположить существование мультипликативной модели. Определим её компоненты.

Шаг 1. Проведем выравнивание исходных уровней ряда методом скользящей средней. Методика, применяемая на этом шаге, полностью совпадает с методикой аддитивной модели. Результаты расчетов оценок сезонной компоненты представлены в таблице:

Таблица 5.

№ квартала

1 2 3 4 5 6
1 72
2 100
3 90 326 81,500 81,250 1,108
4 64 324 81,000 80,000 0,800
5 70 316 79,000 77,750 0,900
6 92 306 76,500 75,750 1,215
7 80 300 75,000 74,000 1,081
8 58 292 73,000 71,500 0,811
9 62 280 70,000 68,500 0,905
10 80 268 67,000 65,750 1,217
11 68 258 64,500 63,250 1,075
12 48 248 62,000 59,500 0,807
13 52 228 57,000 54,750 0,950
14 60 210 52,500 50,250 1,194
15 50 192 48,000
16 30

Шаг 2. Найдем оценки сезонной компоненты как частное от деления фактических уровней ряда на центрированные скользящие средние (колонка 6 таблицы).

Используем эти оценки для расчета значений сезонной компоненты S. Для этого найдем средние за каждый квартал оценки сезонной компоненты S i . Взаимопогашаемость сезонных воздействий в мультипликативной модели выражается в том, что сумма значений сезонной компоненты по всем кварталам должна равняться числу периодов в цикле. В нашем случае число периодов одного цикла (год) равно четырем кварталам. Результаты расчетов сведем в таблицу:

Таблица 6.

Год

Показатели № квартала, i
I II III IV
1 1,108 0,800
2 0,900 1,215 1,081 0,817
3 0,905 1,217 1,075 0,807
4 0,950 1,194
Итого за i – й квартал (за все годы) 2,755 3,626 3,264 2,424
Средняя оценка сезонной компоненты для i – го квартала, 0,918 1,209 1,088 0,808
Скорректированная сезонная компонента, 0,913 1,202 1,082 0,803

Здесь сумма средних оценок сезонных компонент по всем четырем кварталам

не равна четырем. Чтобы эта сумма равнялась четырем, умножим каждое слагаемое на поправочный коэффициент

т.е.

(11)

Значения скорректированных сезонных компонент записаны в последней строке таблицы 6. Теперь их сумма равна четырем. Занесем эти значения в новую таблицу (колонка 3 таблицы 7):

Таблица 7.

t

t

i

T T·S
1 2 3 4 5 6 7 8 9
1 72 0,913 78,86 87,80 80,16 0,898 -8,165 66,66
2 100 1,202 83,19 85,03 102,20 0,978 -2,204 4,86
3 90 1,082 83,18 82,25 89,00 1,011 1,002 1,00
4 64 0,803 79,70 79,48 63,82 1,003 0,179 0,03
5 70 0,913 76,67 76,70 70,03 1,000 -0,030 0,00
6 92 1,202 76,54 73,93 88,86 1,035 3,139 9,85
7 80 1,082 73,94 71,15 76,99 1,039 3,013 9,08
8 58 0,803 72,23 68,38 54,91 1,056 3,093 9,57
9 62 0,913 67,91 65,60 59,90 1,035 2,105 4,43
10 80 1,202 66,56 62,83 75,52 1,059 4,482 20,08
11 68 1,082 62,85 60,05 64,98 1,047 3,024 9,14
12 48 0,803 59,78 57,28 45,99 1,044 2,007 4,03
13 52 0,913 56,96 54,50 49,76 1,045 2,240 5,02
14 60 1,202 49,92 51,73 62,18 0,965 -2,176 4,73
15 50 1,082 46,21 48,95 52,97 0,944 -2,966 8,79
16 30 0,803 37,36 46,18 37,08 0,809 -7,080 50,12

Шаг 3. Разделим каждый уровень исходного ряда на соответствующие значения сезонной компоненты. Тем самым мы получим величины

, (12)

которые содержат только тенденцию и случайную компоненту (колонка 4).

Шаг 4. Определим трендовую компоненту в мультипликативной модели. Для этого рассчитаем параметры линейного тренда, используя уровни (Т+Е).

Уравнение тренда имеет вид:

Подставляя в это уравнение значения , найдем уровни Т для каждого момента времени (колонка 5 таблицы).

Шаг 5. Найдем уровни ряда по мультипликативной модели, умножив уровни Т на значения сезонной компоненты для соответствующих кварталов (колонка 6 таблицы).

Шаг 6. Расчет ошибок в мультипликативной модели произведем по формуле:

  • (13)

Численные значения ошибок приведены в колонке 7 таблицы. Для того, чтобы сравнить мультипликативную модель и другие модели временного ряда, можно по аналогии с аддитивной моделью использовать сумму квадратов абсолютных ошибок. Абсолютные ошибки в мультипликативной модели определяются как:

(14)

В данной модели сумма квадратов абсолютных ошибок составляет 207,4. Общая сумма квадратов отклонений фактических уровней этого ряда от среднего значения равна 5023. Таким образом, доля объясненной дисперсии уровней ряда составляет 95,9%.

Прогнозирование по аддитивной или мультипликативной модели временного ряда сводится к расчету будущего значения временного ряда по уравнению модели в виде

для аддитивной или

для мультипликативной модели.

и т.д……………..