Показательный тренд. Смотреть страницы где упоминается термин линейный тренд

Наиболее часто тренд представляется линейной зависимостью исследуемой величины вида

где y – исследуемая переменная (например, производительность) или зависимая переменная;
x – число, определяющее позицию (второй, третий и т.д.) года в периоде прогнозирования или независимая переменная.

При линейной аппроксимации связи между двумя параметрами для нахождения эмпирических коэффициентов линейной функции используется наиболее часто метод наименьших квадратов. Суть метода состоит в том, что линейная функция «наилучшего соответствия» проходит через точки графика, соответствующие минимуму суммы квадратов отклонений измеряемого параметра. Такое условие имеет вид:

где n – объем исследуемой совокупности (число единиц наблюдений).

Рис. 5.3. Построение тренда методом наименьших квадратов

Значения констант b и a или коэффициента при переменной Х и свободного члена уравнения определяются по формуле:

В табл. 5.1 приведен пример вычисления линейного тренда по данным .

Таблица 5.1. Вычисление линейного тренда

Методы сглаживания колебаний.

При сильных расхождениях между соседними значениями тренд, полученный методом регрессии, трудно поддается анализу. При прогнозировании, когда ряд содержит данные с большим разбросом колебаний соседних значений, следует их сгладить по определенным правилам, а потом искать смысл в прогнозе. К методу сглаживания колебаний
относят: метод скользящих средних (рассчитывается n-точечное среднее), метод экспоненциального сглаживания. Рассмотрим их.

Метод «скользящих средних» (МСС).

МСС позволяет сгладить ряд значений с тем, чтобы выделить тренд. При использовании этого метода берется среднее (обычно среднеарифметическое) фиксированного числа значений. Например, трехточечное скользящее среднее. Берется первая тройка значений, составленная из данных за январь, февраль и март (10 + 12 + 13), и определяется среднее, равное 35: 3 = 11,67.

Полученное значение 11,67 ставится в центре диапазона, т.е. по строке февраля. Затем «скользим на один месяц» и берется вторая тройка чисел, начиная с февраля по апрель (12 + 13 + 16), и рассчитывается среднее, равное 41: 3 = 13,67, и таким приемом обрабатываем данные по всему ряду. Полученные средние представляют новый ряд данных для построения тренда и его аппроксимации. Чем больше берется точек для вычисления скользящей средней, тем сильнее происходит сглаживание колебаний. Пример из МВА построения тренда дан в табл. 5.2 и на рис. 5.4.

Таблица 5.2 Расчет тренда методом трехточечного скользящего среднего

Характер колебаний исходных данных и данных, полученных методом скользящего среднего, иллюстрирован на рис. 5.4. Из сравнения графиков рядов исходных значений (ряд 3) и трехточечных скользящих средних (ряд 4), видно, что колебания удается сгладить. Чем большее число точек будет вовлекаться в диапазон вычисления скользящей средней, тем нагляднее будет вырисовываться тренд (ряд 1). Но процедура укрупнения диапазона приводит к сокращению числа конечных значений и это снижает точность прогноза.

Прогнозы следует делать исходя из оценок линии регрессии, составленной по значениям исходных данных или скользящих средних.

Рис. 5.4. Характер изменения объема продаж по месяцам года:
исходные данные (ряд 3); скользящие средние (ряд 4); экспоненциальное сглаживание (ряд 2); тренд, построенный методом регрессии (ряд 1)

Метод экспоненциального сглаживания.

Альтернативный подход к сокращению разброса значений ряда состоит в использовании метода экспоненциального сглаживания. Метод получил название «экспоненциальное сглаживание» в связи с тем, что каждое значение периодов, уходящих в прошлое, уменьшается на множитель (1 – α).

Каждое сглаженное значение рассчитывается по формуле вида:

St =aYt +(1−α)St−1,

где St – текущее сглаженное значение;
Yt – текущее значение временного ряда; St – 1 – предыдущее сглаженное значение; α – сглаживающая константа, 0 ≤ α ≤ 1.

Чем меньше значение константы α , тем менее оно чувствительно к изменениям тренда в данном временном ряду.

Инструкция

Линейный тренд выражает собой функцию: y=ax+b, гдеa – значение, на которое будет увеличено следующее значение во временном ряду;x – номер периода в определенном временном ряду (к примеру, номер месяца, дня или квартала);y – последовательность анализируемых значений (это могут быть продажи за месяц);b – точка пересечения, которая на графике будет с осью y (минимальный уровень).При этом, если значение a является больше нуля, то роста будет положительной. В свою очередь, если а меньше нуля, то динамика линейного тренда будет отрицательной.

Используйте линейный тренд для прогнозирования отдельных временных рядов, у которых данные увеличиваются или снижаются с постоянной скоростью. При построении линейного тренда можете использовать программу Excel. Например, если вам необходим линейный тренд для построения прогноза продаж по месяцам, тогда сделайте 2 переменных во временном ряду (время - месяцы и объем продаж).

Уравнение линейного тренда у вас будет же: y=ax+b, где y - объемы продаж, x - это месяцы.Постройте график в Excel. По оси x у вас получится ваш временной промежуток (1, 2, 3 - по месяцам: январь, февраль и т.д.), по оси y изменения объема продаж. После этого добавьте на графике линию тренда .

Продлите линию тренда для прогнозирования и определите ее значения. При этом вам должны быть известны только значения времени по оси X, а прогнозные значения вам необходимо рассчитать с помощью ранее указанной формулы.

Сопоставьте полученные прогнозные значения линейного тренда с фактическими данными. Таким образом вы сможете определить рост объема продаж в процентном соотношении.

Можете скорректировать прогнозируемые значения линейного тренда в том случае, если вас не устраивает рост, т.е. вы понимаете, что есть компоненты, которые на него могут повлиять. Если вы измените значение «a» в линейном тренде y=ax+b, тогда вы сможете увеличить наклон тренда . Так вы можете изменять наклон тренда , уровень тренда , или одновременно эти два показателя.

Источники:

  • уравнение линейного тренда

Числовая последовательность представлена функцией вида an=f(n), которая задана на множестве натуральных чисел. В большинстве случаев в числовых последовательностях f(n) заменяется на an. Числа a1, a2, …, an – члены последовательности, причем a1 – первый, a2 – второй, аk – k-ый. На основании данных функции числовой последовательности строится график.

Вам понадобится

  • - справочник по математике;
  • - линейка;
  • - тетрадь;
  • - простой карандаш;
  • - исходные данные.

Инструкция

Прежде чем приступать к построению , определите, функцией является числовая последовательность. Различают невозрастающую или неубывающую последовательность (an), для которой при любом значении n справедливым является неравенство вида: an≥an+1 или an≤an+1. При условии, что an>an+1 или an

При построении числовой последовательности обратите внимание на то, что последовательность (an) может быть ограничена снизу или сверху: для этого должно существовать

Является тренд . Одним из наиболее популярных способов моделирования тенденции временного ряда является нахождение аналитической функции, характеризующей зависимость уровней ряда от времени. Этот способ называется аналитическим выравниванием временного ряда.

Зависимость показателя от времени может принимать разные формы, поэтому находят различные функции: линейную, гиперболу, экспоненту, степенную функцию, полиномы различных степеней. Временной ряд исследуют аналогично линейной регрессии.

Параметры любого тренда можно определить обычным методом наименьших квадратов, используя в качестве фактора время t = 1, 2,…, n, а в качестве зависимой переменной используют уровни временного ряда. Для нелинейных трендов сначала проводят процедуру линеаризации.

К числу наиболее распространенных способов определения типа тенденции относят качественный анализ изучаемого ряда , построение и анализ графика зависимости уровней ряда от времени, расчет основных показателей динамики. В этих же целях можно часто используют и .

Линейный тренд

Тип тенденции определяют путем сравнения коэффициентов автокорреляции первого порядка. Если временной ряд имеет линейный тренд, то его соседние уровни yt и yt-1 тесно коррелируют. В таком случае коэффициент автокорреляции первого порядка уровней исходного ряда должен быть максимальный. Если временной ряд содержит нелинейную тенденцию, то чем сильнее выделена нелинейная тенденция во временном ряду, тем в большей степени будут различаться значения указанных коэффициентов.

Выбор наилучшего уравнения в случае, если ряд содержит , можно осуществить перебором основных видов тренда, расчета по каждому уравнению коэффициента корреляции и выбора уравнения тренда с максимальным значением коэффициента.

Параметры тренда

Наиболее простую интерпретацию имеют параметры экспоненциального и линейного трендов.

Параметры линейного тренда интерпретируют так: а — исходный уровень временного ряда в момент времени t = 0; b - средний за период абсолютный прирост уровней рада.

Параметры экспоненциального тренда имеют такую интерпретацию. Параметр а - это исходный уровень временного ряда в момент времени t = 0. Величина exp(b) - это средний в расчете на единицу времени коэффициент роста уровней ряда.

По аналогии с линейной моделью расчетные значения уровней рада по экспоненциальному тренду можно определить путем подстановки в уравнение тренда значений времени t = 1,2,…, n, либо в соответствии с интерпретацией параметров экспоненциального тренда: каждый последующий уровень такого ряда есть произведение предыдущего уровня на соответствующий коэффициент роста

При наличии неявной нелинейной тенденции нужно дополнять описанные выше методы выбора лучшего уравнения тренда качественным анализом динамики изучаемого показателя, для того, чтобы избежать ошибок спецификации при выборе вида тренда. Качественный анализ предполагает изучение проблем возможного наличия в исследуемом ряду поворотных точек и изменения темпов прироста, начиная с определенного момента времени под влиянием ряда факторов, и т. д. В том случае если уравнение тренда выбрано неправильно при больших значениях t, результаты прогнозирования динамики временного ряда с использованием исследуемого уравнения будут недостоверными по причине ошибки спецификации.

Иллюстрация возможного появления ошибки спецификации приведем на рисунке

Если оптимальной формой тренда является парабола, в то время как на самом деле имеет место линейная тенденция, то при больших t парабола и линейная функция естественно будут по разному описывать тенденцию в уровнях ряда.

Согласно формуле (9.29) параметры линейного тренда равны а = 1894/11 = 172,2 ц/га; b = 486/110 = 4,418 ц/га. Уравнение линейного тренда имеет вид:

у̂ = 172,2 + 4,418t , где t = 0 в 1987 г Это означает,что средний фактический и выравненный уровень, отнесенный к середине периода, т.е. к 1991 г., равен 172 ц с 1 ra a среднегодовой прирост составляет 4,418 ц/га в год

Параметры параболического тренда согласно (9.23) равны- b = 4,418; a = 177,75; с = -0,5571. Уравнение параболического тренда имеет вид у̃ = 177,75 + 4,418t - 0.5571t 2 ; t = 0 в 1991 г. Это означает, что абсолютный прирост урожайности замедляется в среднем на 2·0,56 ц/га в год за год. Сам же абсолютный прирост уже не является константой параболического тренда, а является средней величиной за период. В год, принятый за начало отсчета т.е. 1991 г., тренд проходит через точку с ординатой 77,75 ц/га; Свободный член параболического тренда не является средним уровнем за период. Параметры экспоненциального тренда вычисляются по формулам(9.32) и (9.33) lnа = 56,5658/11 = 5,1423; потенцируя, получаем а = 171,1; lnk = 2,853:110 = 0,025936; потенцируя, получаем k = 1,02628.

Уравнение экспоненциального тренда имеет вид: y̅ = 171,1·1,02628 t .

Это означает, что среднегодовой темп поста урожайности за период составил 102,63%. В точке принятК начало отсчета, тренд проходит точку с ординатой 171,1 ц/га.

Рассчитанные по уравнениям трендов уровни записаны в трех последних графах табл. 9.5. Как видно по этим данным. расчетные значения уровней по всем трем видам трендов различаются ненамного, так как и ускорение параболы, и темп роста экспоненты невелики. Существенное отличие имеет парабола - рост уровней с 1995 г. прекращается, в то время как при линейном тренде уровни растут и далее, а при экспоненте их ост ускоряется. Поэтому для прогнозов на будущее эти три тренда неравноправны: при экстраполяции параболы на будущие годы уровни резко разойдутся с прямой и экспонентой, что видно из табл. 9.6. В этой таблицепредставлена распечатка решения на ПЭВМ по программе «Statgraphics» тех же трех трендов. Отличие их свободных членов от приведенных выше объясняется тем, что программа нумерует года не от середины, а от начала, так что свободные члены трендов относятся к 1986 г., для которого t = 0. Уравнение экспоненты на распечатке оставлено в логарифмированном виде. Прогноз сделан на 5 лет вперед, т.е. до 2001 г.. При изменении начала координат (отсчета времени) в уравнении параболы меняется и средний абсолютной прирост, параметр b. так как в результате отрицательного ускорения прирост все время сокращается, а его максимум - в начале периода. Константой параболы является только ускорение.


В строке «Data» приводятся уровни исходного ряда; «Forecast summary» означает сводные данные для прогноза. В следующих строках - уравнения прямой, параболы, экспоненты - в логарифмическом виде. Графа ME означает среднее расхождение между уровнями исходного ряда и уровнями тренда (выравненными). Для прямой и параболы это расхождение всегда равно нулю. Уровни экспоненты в среднем на 0,48852 ниже уровней исходного ряда. Точное совпадение возможно, если истинный тренд - экспонента; в данном случае совпадения нет, но различие, мало. Графа МАЕ -это дисперсия s 2 - мера колеблемости фактических уровней относительно тренда, о чем сказано в п. 9.7. Графа МАЕ - среднее линейное отклонение уровней от тренда по модулю (см. параграф 5.8); графа МАРЕ - относительное линейное отклонение в процентах. Здесь они приведены как показатели пригодности выбранного вида тренда. Меньшую дисперсию и модуль отклонения имеет парабола: она за период 1986 - 1996 гг. ближе к фактическим уровням. Но выбор типа тренда нельзя сводить лишь к этому критерию. На самом деле замедление прироста есть результат большого отрицательного отклонения, т. е. неурожая в 1996 г.

Вторая половина таблицы - это прогноз уровней урожайности по трем видам трендов на годы; t = 12, 13, 14, 15 и 16 от начала отсчета (1986 г.). Прогнозируемые уровни по экспоненте вплоть до 16-го года ненамного выше,.чем по прямой. Уровни тренда-параболы - снижаются, все более расходясь с другими трендами.

Как видно в табл. 9.4, при вычислении параметров тренда уровни исходного ряда входят с разными весами - значениями t p и их квадратов. Поэтому влияние колебаний уровней на параметры тренда зависит от того, на какой номер года приходится урожайный либо неурожайный год. Если резкое отклонение приходится на год с нулевым номером (t i = 0 ), то оно никакого влияния на параметры тренда не окажет, а если попадет на начало и конец ряда, то повлияет сильно. Следовательно, однократное аналитическое выравнивание неполно освобождает параметры тренда от влияния колеблемости, и при сильных колебаниях они могут быть сильно искажены, что в нашем примере случилось с параболой. Для дальнейшего исключения искажающего влияния колебаний на параметры тренда следует применить метод многократного скользящего выравнивания.

Этот прием состоит в том, что параметры тренда вычисляются не сразу по всему ряду, а скользящим методом, сначала за первые т периодов времени или моментов, затем за период от 2-го до т + 1, от 3-го до (т + 2)-го уровня и т.п. Если число исходных уровней ряда равно п, а длина каждой скользящей базы расчета параметров равна т, то число таких скользящих баз t или отдельных значений параметров, которые будут по ним определены, составит:

L = п + 1 - т.

Применение методики скользящего многократного выравнивания рассматривать, как видно из приведенных расчетов, возможно только при достаточно большом числе уровней ряда, как правило 15 и более. Рассмотрим эту методику на примере данных табл. 9.4 -динамики цен на нетопливные товары развивающихся стран, что опять же дает возможность читателю участвовать в небольшом научном исследовании. На этом же примере продолжим и методику прогнозирования в разделе 9.10.

Если вычислять в нашем ряду параметры по 11 -летним периодам (по 11 уровням), то t = 17 + 1 - 11 = 7. Смысл многократного скользящего выравнивания в том, что при последовательных сдвигах базы расчета параметров на концах ее и в середине окажутся разные уровни с разными по знаку и величине отклонениями от тренда. Поэтому при одних сдвигах базы параметры будут завышаться, при других - занижаться, а при последующем усреднении значений параметров по всем сдвигам базы расчета произойдет дальнейшее взаимопогашение искажений параметров тренда колебаниями уровней.

Многократное скользящее выравнивание не только позволяет получить более точную и надежную оценку параметров тренда, но и осуществить контроль правильности выбора типа уравнения тренда. Если окажется, что ведущий параметр тренда, его константа при расчете по скользящим базам не беспорядочно колеблется, а систематически изменяет свою величину существенным образом, значит, тип тренда был выбран неверно, данный параметр константой не является.

Что касается свободного члена при многократном выравнивании, то нет необходимости и, более того, просто неверно вычислять его величину как среднюю по всем сдвигам базы, ибо при таком способе отдельные уровни исходного ряда входили бы в расчет средней с разными весами, и сумма выравненных уровней разошлась бы с суммой членов исходного ряда. Свободный член тренда - это средняя величина уровня за период, при условии отсчета времени от середины периода. При отсчете от начала, если первый уровень t i = 1, свободный член будет равен: a 0 = у̅ - b ((N-1)/2). Рекомендуется длину скользящей базы расчета параметров тренда выбирать не менее 9-11 уровней, чтобы в достаточной мере погасить колебания уровней. Если исходный ряд очень длинный, база может составлять до 0,7 - 0,8 его длины. Для устранения влияния долго-периодических (циклических) колебаний на параметры тренда, число сдвигов базы должно быть равно или кратно длине цикла колебаний. Тогда начало и конец базы будут последовательно «пробегать» все фазы цикла и при усреднении параметра по всем сдвигам его искажения от циклических колебаний будут взаимопогашаться. Другой способ - взять длину скользящей базы, равной длине цикла, чтобы начало базы и конец базы всегда приходились на одну и ту же фазу цикла колебаний.

Поскольку по данным табл. 9.4, уже было установлено, что тренд имеет линейную форму, проводим расчет среднегодового абсолютного прироста, т. е. параметра b уравнения линейного тренда скользящим способом по 11-летним базам (см. табл. 9.7). В ней же приведен расчет данных, необходимых для последующего изучения колеблемости в параграфе 9.7. Остановимся подробнее на методике многократного выравнивания по скользящим базам. Рассчитаем параметр b по всем базам:


Ряда. Уравнение тренда.

Кривые роста, описывающие закономерности развития явлений во времени, - это результат аналитического выравнивания динамических рядов. Выравнивание ряда с помощью тех или иных функций (т. е. их подгонка к данным) в большинстве случаев оказывается удобным средством описания эмпирических данных. Это средство при соблюдении ряда условий можно применить и для прогнозирования. Процесс выравнивания состоит из следующих основных этапов:

Выбора типа кривой, форма которой соответствует характеру изменения динамического ряда;

Определения численных значений (оценивание) параметров кривой;

Апостериорного контроля качества выбранного тренда.

В современных ППП все перечисленные этапы реализуются одновременно, как правило, в рамках одной процедуры.

Аналитическое сглаживание с использованием той или иной функции позволяет получить выравненные, или, как их иногда не вполне правомерно называют, теоретические значения уровней динамического ряда, т. е. те уровни, которые наблюдались бы, если бы динамика явления полностью совпадала с кривой. Эта же функция с некоторой корректировкой или без нее, применяется в качестве модели для экстраполяции (прогноза).

Вопрос о выборе типа кривой является основным при выравнивании ряда. При всех прочих равных условиях ошибка в решении этого вопроса оказывается более значимой по своим последствиям (особенно для прогнозирования), чем ошибка, связанная со статистическим оцениванием параметров.

Поскольку форма тренда объективно существует, то при выявлении ее следует исходить из материальной природы изучаемого явления, исследуя внутренние причины его развития, а также внешние условия и факторы на него влияющие. Только после глубокого содержательного анализа можно переходить к использованию специальных приемов, разработанных статистикой.

Весьма распространенным приемом выявления формы тренда является графическое изображение временного ряда. Но при этом велико влияние субъективного фактора, даже при отображении выровненных уровней.

Наиболее надежные методы выбора уравнения тренда основаны на свойствах различных кривых, применяемых при аналитическом выравнивании. Такой подход позволяет увязать тип тренда с теми или иными качественными свойствами развития явления. Нам представляется, что в большинстве случаев практически приемлемым является метод, который основывается на сравнении характеристик изменения приростов исследуемого динамического ряда с соответствующими характеристиками кривых роста. Для выравнивания выбирается та кривая, закон изменения прироста которой наиболее близок к закономерности изменения фактических данных.

В табл. 4 приводится перечень наиболее употребительных при анализе экономических рядов видов кривых и указываются соответствующие «симптомы», по которым можно определить, какой вид кривых подходит для выравнивания.

При выборе формы кривой надо иметь в виду еще одно обстоятельство. Рост сложности кривой в целом ряде случаев может действительно увеличить точность описания тренда в прошлом, однако в связи с тем, что более сложные кривые содержат большее число параметров и более высокие степени независимой переменной, их доверительные интервалы будут в общем существенно шире, чем у более простых кривых при одном и том же периоде упреждения.

Таблица 4

Характер изменения показателей, основанных
на средних приростах для различных видов кривых

Показатель Характер изменения показателей во времени Вид кривой
Примерно одинаковые Прямая
Линейно изменяются Парабола второй степени
Линейно изменяются Парабола третьей степени
Примерно одинаковые Экспонента
Линейно изменяются Логарифмическая парабола
Линейно изменяются Модифицированная экспонента
Линейно изменяются Кривая Гомперца

В настоящее время, когда использование специальных программ без особых усилий позволяет одновременно строить несколько видов уравнений, широко эксплуатируются формальные статистические критерии для определения лучшего уравнения тренда.

Из сказанного выше, по-видимому, можно сделать вывод о том, что выбор формы кривой для выравнивания представляет собой задачу, которая не решается однозначно, а сводится к получению ряда альтернатив. Окончательный выбор не может лежать в области формального анализа, тем более, если предполагается с помощью выравнивания не только статистически описать закономерность поведения уровня в прошлом, но и экстраполировать найденную закономерность в будущее. Вместе с тем различные статистические приемы обработки данных наблюдения могут принести существенную пользу, по крайней мере, с их помощью можно отвергнуть заведомо непригодные варианты и тем самым существенно ограничить поле выбора.

Рассмотрим наиболее используемые типы уравнений тренда:

1.Линейная форма тренда:

где - уровень ряда, полученный в результате выравнивания по прямой;

Начальный уровень тренда;

Средний абсолютный прирост; константа тренда.

Для линейной формы тренда характерно равенство так называемых первых разностей (абсолютных приростов) и нулевые вторые разности, т. е. ускорения.

2.Параболическая (полином 2-ой степени) форма тренда:

Для данного типа кривой постоянными являются вторые разности (ускорение), а нулевыми – третьи разности.

Параболическая форма тренда соответствует ускоренному или замедленному изменению уровней ряда с постоянным ускорением. Если < 0 и > 0, то квадратическая парабола имеет максимум, если > 0 и < 0 – минимум. Для отыскания экстремума первую производную параболы по t приравнивают 0 и решают уравнение относительно t.

3.Экспоненциальная форма тренда:

где - константа тренда; средний темп изменения уровня ряда.

При > 1 данный тренд может отражать тенденцию ускоренного и все более ускоряющегося возрастания уровней ряда. При < 1 – тенденцию постоянно, все более замедляющегося снижения уровней временного ряда.

4.Гиперболическая форма тренда (1 типа):

Данная форма тренда может отображать тенденцию процессов, ограниченных предельным значением уровня.

5.Логарифмическая форма тренда:

где - константа тренда.

Логарифмическим трендом может быть описана тенденция, проявляющаяся в замедлении роста уровней ряда динамики при отсутствии предельно возможного значения. При достаточно большом t логарифмическая кривая становится мало отличимой от прямой линии.

6.Обратнологарифмическая форма тренда:

7.Мультипликативная (степенная) форма тренда:

8.Обратная (гиперболическая 2 типа) форма тренда:

9.Гиперболическая форма тренда 3 типа:

10.Полином 3-ей степени:

Для всех нелинейных, относительно исходных переменных моделей (уравнений регрессии), а их здесь большинство, требуется провести вспомогательные преобразования, представленные в таблице ниже.

Таблица 5

Модели, сводящиеся к линейному тренду

Модель Уравнение Преобразование
Мультипликативная (Степенная)
Гиперболическая I типа
Гиперболическая II типа
Гиперболическая III типа
Логарифмическая
Обратнологариф­мическая

В формулах, перечисленных в таблице, как и во всех формулах, описывающих модель тренда, есть коэффициенты уравнений.

Однако, при практическом использовании линеаризации с помощью преобразования исследуемых переменных следует иметь ввиду, что оценки параметров, полученных линеаризацией с помощью М.Н.К. (метод наименьших квадратов), минимизируют сумму квадратов отклонений для преобразованных, а не исходных переменных. Поэтому полученные с помощью линеаризации зависимостей оценки нуждаются в уточнении.

Для решения поставленной задачи по аналитическому сглаживанию динамических рядов в системе STATISTICA нам потребуется создать несколько новых дополнительных переменных, необходимых для выполнения дальнейшей работы, а также осуществить некоторые вспомогательные операции по преобразованию нелинейных моделей тренда в линейные.

Итак, нам предстоит построить уравнение тренда, которое по существу является уравнением регрессии, в котором в качестве фактора выступает «время». Прежде всего, мы создадим переменную «Т», содержащую моменты времени четвертого периода. Так как четвертый период включает 12 лет, то переменная «Т» будет состоять из натуральных чисел от 1 до 12, соответствующих месяцам года.

Кроме того, для работы с некоторыми моделями тренда нам потребуется еще несколько переменных, содержание которых можно понять из их обозначения. Это переменные, получаемые из временного ряда: «Т^2», «Т^3», «1/Т» и «ln T». А также переменные, получаемые из исходных данных за четвертый период: «1/Import4» и «ln Import4». Также необходимо создать такую же таблицу для экспорта. Все это предлагается сделать на новом рабочем листе, скопировав туда данные за 4-й период.

Для этого воспользуемся уже известным нам меню Workbook/Insert.

В итоге получаем следующие электронные таблицы.

Рис. 38. Таблица со вспомогательными переменными для импорта

Рис. 39. Таблица со вспомогательными переменными для экспорта

Для аналитического выравнивания рядов динамики мы будем использовать модуль Multiple Regression в меню Statistics. Рассмотрим пример построения графического изображения и определение численных параметров тренда, выраженного линейной зависимостью.

Рис. 40. Модуль Multiple Regression в меню Statistics

Для выбора зависимых и независимых переменных воспользуемся кнопкой Variables.

В открывшемся окне в левом информационном поле мы выбираем зависимую переменную Y t , (в нашем случае это Import 4 – данные по четвертому периоду). Номера выбранных зависимых переменных отображаются внизу в поле Dependent var. (or list for batch). Соответственно в правом поле мы выбираем независимые переменные (в нашем случае одну – время «Т»). Номера выбранных независимых переменных высвечиваются внизу в поле Independent variable list.

После того, как завершен выбор переменных, нажимаем ОК. Система выдает окно с обобщенными результатами расчета параметров тренда (далее они будут рассмотрены более подробно) и возможностью выбора направления для последующего детального анализа. Заметим, что значение оценки, высвеченное красным цветом, указывает на статистическую значимость результатов.

Рис. 41. Закладка Advanced

На закладке располагается несколько кнопок, позволяющих получить максимально детализированные сведения по интересующему нас направлению анализа. При нажатии на нее получаем две таблицы с результатами регрессионного анализа. В первой представлены результаты расчета параметров уравнения регрессии, во второй – основные показатели уравнения.

Рис. 42. Основные показатели уравнения для данных импорта за четвертый период (линейный тренд)

Здесь N = – объем результативной переменной. В верхнем поле расположены показатели R, , Adjusted R, F, p, Std.Error of Estimate , означающие соответственно теоретическое корреляционное отношение, коэффициент детерминации, уточненный коэффициент детерминации, расчетное значение критерия Фишера (в скобках дано число степеней свободы), уровень значимости, стандартная ошибка уравнения (эти же показатели можно увидеть во второй таблице). В самой таблице нас интересуют столбец В , в котором расположены коэффициенты уравнения, столбец t и столбец p-level , обозначающие расчетное значение t-критерия и расчетный уровень значимости, необходимые для оценки значимости параметров уравнения. При этом система помогает пользователю: когда процедура предполагает проверку на значимость, STATISTICA выделяет значимые элементы красным цветом (т.е. отвергается нулевая гипотеза о равенстве параметров нулю). В нашем случае |t факт | > t табл для обоих параметров, следовательно они значимы.

Рис. 43. Параметры уравнения регрессии для данных импорта за четвертый период (линейный тренд)

Для оценки статистической значимости уравнения в целом на закладке Advanced воспользуемся кнопкой ANOVA (Goodness Of Fit), позволяющей получить таблицу дисперсионного анализа и значение F-критерия Фишера.

Рис. 44. Таблица дисперсионного анализа

Sums of Squares – сумма квадратов отклонений: на пересечении со строкой Regression – сумма квадратов отклонений теоретических (полученных по уравнению регрессии) значений признака от средней величины. Эта сумма квадратов используется для расчета факторной, объясненной дисперсии зависимой переменной. На пересечении со строкой Residual – сумма квадратов отклонений теоретических и фактических значений переменной (для расчета остаточной, необъясненной дисперсии), Total – отклонений фактических значений переменной от средней величины (для расчета общей дисперсии). Столбец df – число степеней свободы, Means Squares обозначает дисперсию: на пересечении со строкой Regression – факторную, со строкой Residual - остаточную, F – критерий Фишера, используемый для оценки общей значимости уравнения и коэффициента детерминации, p-level – уровень значимости.

Параметры уравнения тренда в STATISTICA, как и в большинстве других программ, рассчитываются по метод наименьших квадратов (МНК).

Метод позволяет получить значения параметров, при которых обеспечивается минимизация суммы квадратов отклонений фактических уровней от сглаженных, т. е. полученных в результате аналитического выравнивания.

Математический аппарат метода наименьших квадратов описан в большинстве работ по математической статистике, поэтому нет необходимости подробно на нем останавливаться. Напомним только некоторые моменты. Так, для нахождения параметров линейного тренда (2.10) необходимо решить систему уравнений:

Данная система уравнений упрощается, если значения t подобрать таким образом, чтобы их сумма равнялась нулю, т. е. начало отсчета времени перенести в середину рассматриваемого периода. Очевидно, что перенос начала координат имеет смысл только при ручной обработке динамического ряда.

Если , то , .

В общем виде систему уравнений для нахождения параметров полинома можно записать как

При сглаживании временного ряда по экспоненте (которая часто используется в экономических исследованиях) для определения параметров следует применить метод наименьших квадратов к логарифмам исходных данных.

После переноса начала отсчета времени в середину ряда получают:

следовательно:

Если наблюдаются более сложные изменения уровней временного ряда и выравнивание осуществляется по показательной функции вида , то параметры определяются в результате решения следующей системы уравнений:

В практике исследования социально-экономических явлений исключительно редко встречаются динамические ряды, характеристики которых полностью соответствуют признакам эталонных математических функций. Это обусловлено значительным числом факторов разного характера, влияющих на уровни ряда и тенденцию их изменения.

На практике чаще всего строят целый ряд функций, описывающих тренд, а затем выбирают лучшую на основе того или иного формального критерия.

Рис. 45. Закладка Residuals/Assumptions/Prediction

Здесь воспользуемся кнопкой Perform Residual Analysis, открывающую модуль анализа остатков. Под остатками (Residuals) в данном случае понимается отклонение исходных значений динамического ряда от прогнозируемых, в соответствии с выбранным уравнением тренда. Сразу же переходим к закладке Advanced.

Рис. 46. Закладка Advanced в Perform Residual Analysis

Воспользуемся кнопкой Summary: Residuals & Predicted, позволяющую получить одноименную таблицу, которая содержит исходные значения динамического ряда Observed Value, прогнозируемые значения по выбранной модели тренда Predicted Value, отклонения прогнозных значений от исходных Residual Value, а также различные специальные показатели и стандартизированные значения. Также в таблице представлены максимальное, минимальное значения, средняя и медиана по каждому столбцу.

Рис. 47. Таблица, содержащая показатели и специальные значения для линейного тренда

В данной таблицы наибольший интерес для нас представляет столбец Residual Value, значения которого в дальнейшем используются для характеристики качества подбора тренда, а также столбец Predicted Value, который содержит прогнозные значения динамического ряда в соответствии с выбранной моделью тренда (в нашем случае – линейной).

Далее построим график исходного временного ряда совместно с вычисленными в соответствии с линейным уравнением тренда прогнозными значениями для четвертого периода. Для этого лучше всего скопировать значения из столбца Predicted Value в таблицу, в которой были созданы переменные для построения трендов.

Рис. 48. Третий период динамического ряда импорта (млрд. $) и линейный тренд

Итак, мы получили все необходимые результаты расчета параметров тренда, выраженного линейной моделью, для четвертого периода исходного динамического ряда, а также построили график данного ряда, совмещенный с линией тренда. Далее будут представлены остальные модели трендов.

Следует заметить, что в результате линеаризации степенной и экспоненциальной функций STATISTICA возвращает значение линеаризованной функции равное , поэтому для дальнейшего использования их надо преобразовать с помощью следующей элементарной транзакции , в том числе и для построения графических изображений. Для гиперболических функций, а также для обратнологарифмической функции необходимо выполнить преобразование вида .

Для этого также целесообразно создать дополнительные переменные и получить их с помощью формул на основе уже имеющихся переменных.

Итак, при решении задачи с помощью процедуры Multiple Regression, необходимо в качестве переменных выбрать натуральные логарифмы исходного ряда и оси времени.

Рис. 49. Основные показатели уравнения для данных импорта за третий период (степенная модель)

Рис. 50. Параметры уравнения регрессии для данных импорта за третий период (степенная модель)

Рис. 51. Таблица дисперсионного анализа

Рис. 52. Таблица, содержащая показатели и специальные значения для степенной модели

Затем, как и в случае с линейным трендом, копируем значения из столбца Predicted Value в таблицу, но там для этого строим еще одну переменную, в которой получаем прогнозные значения по степенной функции с помощью преобразования .

Рис. 53. Создание дополнительной переменной

Рис. 54. Таблица со всеми переменными

Рис. 55. Третий период динамического ряда импорта (млрд. $) и степенная модель

Рис.56. Основные показатели уравнения для данных импорта за третий период (экспоненциальная модель)

Рис. 57. Третий период динамического ряда импорта (млрд. $) и экспоненциальная модель

Рис.58. Основные показатели уравнения для данных импорта за третий период (обратная модель)

Рис. 59. Третий период динамического ряда импорта (млрд. $) и обратная модель

Рис. 60. Основные показатели уравнения для данных импорта за третий период (полином второй степени)

Рис. 61. Третий период динамического ряда импорта (млрд. $) и полином второй степени

Рис. 62. Основные показатели уравнения для данных импорта за третий период (полином 3-й степени)

Рис. 63. Третий период динамического ряда импорт (млрд. $) и полином 3-й степени


Рис. 64. Основные показатели уравнения для данных импорта за третий период (гипербола 1-ого вида)

Рис. 65. Третий период динамического ряда импорт (млрд. $) и гипербола 1-ого вида


Рис. 66. Основные показатели уравнения для данных импорта за третий период (гипербола 3 типа)

Рис. 67. Третий период динамического ряда импорт и гипербола 3 типа


Рис. 68. Основные показатели уравнения для данных импорта за третий период (логарифмическая модель)

Рис. 69. Третий период динамического ряда импорт (млрд. $) и логарифмическая модель


Рис. 70. Основные показатели уравнения для данных импорта за третий период (обратнологарифмическая модель)

Рис. 71. Третий период динамического ряда импорт (млрд. $) и обратнологарифмическая модель


Затем построим таблицу со вспомогательными переменными для построения трендов для экспорта.

Рис. 72. Таблица со вспомогательными переменными

Проделаем те же операции что и для четвертого период импорта.

Рис. 73. Основные показатели уравнения для данных экспорта за третий период (линейная модель)

Рис. 74. Третий период динамического ряда экспорта (млрд. $) и линейная модель

Рис. 75. Основные показатели уравнения для данных экспорта за третий период (степенная модель тренда)

Рис. 76. Третий период динамического ряда экспорта и степенная модель


Рис. 77. Основные показатели уравнения для данных экспорта за третий период (экспоненциальная модель тренда)

Рис. 78. Третий период динамического ряда экспорта (млрд. $) и экспоненциальная модель


Рис. 79. Основные показатели уравнения для данных экспорта за третий период (обратная модель тренда)

Рис. 80. Третий период динамического ряда экспорта (млрд. $) и обратная модель


Рис. 81. Основные показатели уравнения для данных экспорта за третий период (полином второй степени)

Рис. 82. Третий период динамического ряда экспорта (млрд. $) и полином второй степени


Рис. 83. Основные показатели уравнения для данных экспорта за третий период (полином третей степени)

Рис. 84. Третий период динамического ряда экспорта (млрд. $) и полином третей степени


Рис. 85. Основные показатели уравнения для данных экспорта за третий период (гипербола 1-ого вида)

Рис. 86. Третий период динамического ряда экспорта и гипербола 1-ого типа


Рис. 87. Основные показатели уравнения для данных экспорта за третий период (гипербола 3-ого вида)

Рис. 88. Третий период динамического ряда экспорта (млрд. $) и гипербола 3-ого типа


Рис. 89. Основные показатели уравнения для данных экспорта за третий период (логарифмическая модель)

Рис. 90. Третий период динамического ряда экспорта (млрд. $) и логарифмическая модель


Рис. 91. Основные показатели уравнения для данных экспорта за третий период (обратнологарифмическая модель)

Рис. 91. Третий период динамического ряда экспорта (млрд. $) и обратнологарифмическая модель


Выбор наилучшего тренда

Как уже отмечалось, проблема выбора формы кривой - одна из основных проблем, с которой сталкиваются при выравнивании ряда динамики. Решение этой проблемы во многом определяет результаты экстраполяции тренда. В большинстве специализированных программ для выбора лучшего уравнения тренда предоставляется возможность воспользоваться следующими критериями:

Минимальное значение среднеквадратической ошибки тренда:

,

где - фактические уровни ряда динамики;

Уровни ряда, определенные по уравнению тренда;

n - число уровней ряда;

p - число факторовв уравнении тренда.

- минимальное значение остаточной дисперсии:

Минимальное значение средней ошибки аппроксимации;

Минимальное значение средней абсолютной ошибки;

Максимальное значение коэффициента детерминации;

Максимальное значение F- критерия Фишера:

: ,

где k – число степеней свободы факторной дисперсии,равное числу независимых переменных (признаков-факторов) в уравнении;

n-k-1 - число степеней свободы остаточной дисперсии.

Применение формального критерия для выбора формы кривой, по-видимому, даст практически пригодные результаты в том случае, если отбор будет проходить в два этапа. На первом этапе отбираются зависимости, пригодные с позиции содержательного подхода к задаче, в результате чего происходит ограничение круга потенциально приемлемых функций. На втором этапе для этих функций подсчитываются значения критерия и выбирается та из кривых, которой соответствует минимальное его значение.

В данном пособии для идентификации тренда используется формальный метод, который основывается на использовании численного критерия. В качестве такого критерия рассматривается максимальный коэффициент детерминации:

.

Расшифровка обозначений и формулы данных показателей даны в предыдущих разделах. Коэффициент детерминации показывает, какая доля общей дисперсии результативного признака обусловлена вариацией признака – фактора. В таблицах STATISTICA он обозначается как R?.

В следующей ниже таблице будут представлены уравнения моделей трендов и коэффициенты детерминации данных импорта.

Таблица 6

Уравнения моделей трендов и коэффициенты детерминации Import.

Сопоставив значения коэффициентов детерминации для различных типов кривых можно сделать вывод о том, что для исследуемого третьего периода лучшей формой тренда будет полином третей степени для импорта и для экспорта.

Далее необходимо проанализировать выбранную модель тренда с точки зрения ее адекватности реальным тенденциям исследуемого временного ряда через оценку надежности полученных уравнений трендов по F-критерию Фишера. В данном случае расчетное значение критерия Фишера для импорта равно 16,573; для экспорта – 13,098, а табличное значение при уровне значимости равно 3,07. Следовательно, эта модель тренда признается адекватно отражающей реальную тенденцию изучаемого явления.