МАТПРАКТИКУМ

Анализ временных рядов и прогнозирование

В.Н. Афанасьев, М.М. Юзбашев



Глава 1. ВИДЫ И ПОСТРОЕНИЕ ВРЕМЕННЫХ РЯДОВ[20]

1.1. Что такое «временной ряд»

Термин временные ряды в статистике России пока непривычен. В учебниках по общей теории статистики преобладают термины ряды динамики, динамические ряды, статистическое изучение динамики. В зарубежной англоязычной литературе принят термин time series, в немецкой — zeitreihen analyze. Оба термина ближе всего передаются по-русски как временные ряды или анализ временных рядов.

Одной из причин, препятствовавших принятию отечественной статистикой данного термина, служит особенность русского языка — сближение по звучанию и написанию совершенно разных по смыслу слова временной, т. е. относящийся ко времени, связанный со временем, происходящий во времени, и слова временный, т. е. непостоянный, преходящий, малосущественный. В европейских языках это разные слова: в немецком, например, временный — provisorisch, во французском — provisoire, в английском — provisional, т. е. эти слова происходят не от корня «время».

Опасение, что студенты (учащиеся) воспримут термин временной ряд как временный, заставило предпочесть новый для статистики и неточный по существу термин динамический ряд, ряд динамики.

Неточность последнего термина состоит в том, что не каждый ряд уровней за последовательные моменты или периоды времени содержит на самом деле (отражает) динамику какого-либо признака. Термин динамика правильнее относить к изменениям, направленному развитию, наличию тенденции рассматриваемых во времени показателей. Про ряд уровней, содержащих лишь колебания, но не имеющих надежно установленной тенденции, говорят: «В этом ряду, в данном процессе нет никакой динамики». Так можно характеризовать экономику застойного периода, население страны или региона, находящиеся в стационарном состоянии, любую общественную или механическую систему, находящуюся в статическом состоянии.

Следовательно, динамические ряды — понятие, относящееся к тем рядам уровней, в которых содержится тенденция изменения, а временные ряды — более общее понятие, включающее как динамические, так и статические последовательности уровней какого-либо показателя.

Данное существенное уточнение, а также стремление к сближению терминологии нашего учебника с принятой в зарубежных странах побудили нас принять в заглавии учебника и в тексте именно термин временные ряды и пренебречь «опасностью» ошибочного отождествления слов временной и временный читателями.

Итак, временной ряд — это последовательность упорядоченных во времени числовых показателей, характеризующих уровень состояния и изменения изучаемого явления.


1.2. Классификация временных рядов

Всякий временной ряд включает два обязательных элемента: во-первых, время и, во-вторых, конкретное значение показателя, или уровень ряда. Временные ряды различаются по следующим признакам:

1) по времени — моментные и интервальные. Интервальный ряд (табл. 1.1) последовательность, в которой уровень явления относят к результату, накопленному или вновь произведенному за определенный интервал времени.



Таковы, например, ряды показателей объема продукции предприятия по месяцам года, количества отработанных человеко-дней по отдельным периодам (месяцам, кварталам, полугодиям, годам, пятилетиям и т. п.) и т. д. Если же уровень ряда характеризует изучаемое явление в конкретный момент времени, то совокупность уровней образует моментный ряд. Примерами моментных рядов могут быть последовательность показателей численности населения на начало года, поголовье скота в фермерских хозяйствах на 1 декабря или 1 июня за несколько лет, величина запаса какого-либо материала на начало периода и т. д. Важное отличие моментных рядов от интервальных состоит в том, что сумма уровней интервального ряда дает вполне реальный показатель — общий выпуск продукции за год (пятилетие, десятилетие), общие затраты рабочего времени, общий объем продаж акций и т. д., сумма же уровней моментного ряда иногда и подсчитывается, но реального содержания, как правило, не имеет;

2) по форме представления уровней — ряды абсолютных (см. табл. 1.1), относительных (табл. 1.2) и средних величин (табл. 1.3);




3) по расстоянию между датами или интервалами времени выделяют полные и не

полные временные ряды. Полные ряды имеют место, когда даты регистрации или окончания периодов следуют друг за другом с равными интервалами (см. табл. 1.2; табл. 1.4), неполные — когда принцип равных интервалов не соблюдается (см. табл. 1.1 и 1.3);



4) по содержанию показателей — ряды частных и агрегированных показателей. Частные показатели характеризуют изучаемое явление односторонне, изолированно. Например, среднесуточный объем выпуска промышленной продукции дает возможность оценить динамику промышленного производства, численность граждан, состоящих на учете в службе занятости; показывает эффективность социальной политики государства; остатки наличных денег у населения и вклады населения в банках отражают платежеспособность населения и т. д.

Агрегированные показатели (см. табл. 1.4) основаны на частных показателях и характеризуют изучаемый процесс комплексно. Так, чтобы иметь представление о состоянии экономики в России в целом, необходимо определять агрегированный показатель экономической конъюнктуры, включающий в себя и вышеперечисленные частные показатели. Их определяют также при исследовании эффективности производства, технического уровня предприятий, качества продукции, экологического состояния. Широкое применение последних стало возможным с развитием факторного и компонентного анализа.


1.3. Обеспечение сопоставимости уровней временных рядов

Важнейшим условием правильного формирования временных рядов является сопоставимость уровней, образующих ряд. Уровни ряда, подлежащие изучению, должны быть однородны по экономическому содержанию и учитывать существо изучаемого явления и цель исследования.

Статистические данные, представленные в виде временных рядов, должны быть сопоставимы по территории, кругу охватываемых объектов, единицам измерения, моменту регистрации, методике расчета, ценам, достоверности.

Несопоставимость по территории возникает в результате изменений границ стран, регионов, хозяйств и т. п. Для приведения данных к сравнимому виду производится пересчет прежних данных с учетом новых границ.

Полнота охвата различных частей явления — важнейшее условие сопоставимости уровней ряда. Требование одинаковой полноты охвата разных частей изучаемого объекта означает, что уровни ряда за отдельные периоды должны характеризовать размер того или иного явления по одному и тому же кругу входящих в состав его частей. Например, при характеристике динамики урожайности овощных культур в регионе по годам нельзя в одни годы учитывать только сельскохозяйственные предприятия, а в другие — все категории хозяйств, в том числе приусадебные участки сельских жителей и сады, огороды горожан.

При определении сравниваемых уровней ряда необходимо использовать единую методику их расчета. Особенно часто эта проблема возникает при международных сопоставлениях. Например, до недавнего времени в России урожайность сельскохозяйственных культур определяли делением валового сбора на продуктивную весеннюю площадь, в США — на фактически убранную площадь.

Несопоставимость показателей, возникающая в силу неодинаковости применяемых единиц измерения, сама по себе очевидна. С различием применяемых единиц измерения приходится встречаться при изучении динамики: производственных ресурсов, когда они представляются то в стоимостном, то в трудовом исчислении; энергетических мощностей (кВт-ч, л.с.); атмосферного давления и т. д.

Трудности при сравнении данных по моменту регистрации возникают из-за сезонных явлений. Численность скота в домашних хозяйствах из-за экономической целесообразности различна зимой и летом, поэтому уровни при сравнении должны относиться к определенной дате ежегодно.

При анализе показателей в стоимостном выражении следует учитывать, что с течением времени происходит непрерывное изменение цен. Причин у этого процесса множество — инфляция, рост затрат, рыночные условия (спрос и предложение) и т. д. В этой связи при характеристике стоимостных показателей объема продукции во времени должно быть устранено влияние изменения цен. Для решения этой задачи количество продукции, произведенное в разные периоды, оценивают в ценах одного периода, которые называют фиксированными или в определенных статистических органах — сопоставимыми ценами.

Широкое использование в статистических исследованиях выборочного метода требует учитывать достоверность количественных и качественных характеристик изучаемых явлений в динамике. Различная репрезентативность выборки по периодам внесет существенные погрешности в величины уровней ряда. Так, рейтинг политических деятелей в средствах массовой информации России очень часто определяют по разному числу респондентов.

Одним из условий сопоставимости уровней интервального ряда, кроме равенства периодов, за которые приводятся данные, является однородность этапов, в пределах которых показатель подчиняется одному закону развития. В этих случаях проводят периодизацию временных рядов, типологическую группировку во времени.

Все вышеназванные обстоятельства следует учитывать при подготовке информации для анализа изменений явлений во времени (динамике).


Глава 2. СОСТАВЛЯЮЩИЕ ЭЛЕМЕНТЫ ВРЕМЕННОГО РЯДА

2.1. Понятие об основной тенденции и колеблемости временных рядов

В изучении временных рядов большое место занимает вопрос о закономерностях их движения на протяжении длительного периода. Статистика должна дать характеристику изменений статистических показателей во времени. Как изменяются год за годом валовой национальный продукт и национальный доход страны? Как возрастает или снижается уровень безработицы, оплаты труда? Велики ли колебания урожайности зерновых культур и существует ли тенденция ее роста? На все поставленные вопросы ответ может дать только специальная система статистических методов, предназначенная для изучения развития, изменений во времени или, как принято в статистике говорить, для изучения динамики.

Познание закономерностей изменений во времени — сложная и трудоемкая процедура исследования, так как любое изучаемое явление формирует множество факторов, действующих в разных направлениях. По характеру непосредственного воздействия эти факторы могут быть разделены на две группы. К первой группе относятся факторы, определяющие основную тенденцию динамики (рост или снижение уровней). Вторая группа факторов, вызывающая случайные колебания, отклоняет уровни от тенденции то в одном, то в другом направлении. Например, тенденция динамики урожайности связана с прогрессом агротехники, с укреплением экономики данной совокупности хозяйств, совершенствованием организации и управления производством. Колеблемость урожайности вызвана чередованием благоприятных по погоде и неблагоприятных лет, циклами солнечной активности, колебаниями в развитии вредных насекомых и болезней растений.

При статистическом изучении динамики необходимо четко разделять два основных ее элемента — тенденцию и колеблемость, чтобы дать каждому из них количественную характеристику с помощью специальных показателей.

Основной тенденцией, или трендом, называется характеристика процесса изменения явления за длительное время, освобожденная от случайных колебаний, создаваемых второй группой факторов.

В отличие от вариации явлений в пространственной совокупности, измеряемой

по отклонениям уровней для отдельных единиц совокупности от их средней величины, колеблемостью следует называть отклонения уровней отдельных периодов времени от тенденции динамики (тренда).


2.2. Иерархия тенденций и колебаний

В предыдущих разделах были рассмотрены две основные компоненты временного ряда — его тенденция и колеблемость отдельных уровней. При решении конкретных задач статистического исследования эти компоненты следует разделять, измерять каждую из них отдельно. В то же время при рассмотрении сложных процессов на больших интервалах времени мы наблюдаем иерархию тенденций и колебаний: то,

что для времени высокого порядка, например, столетия, выступает как колебания, на интервале времени низшего порядка, например трех-пяти лет, может выступать как тенденция. Например, существует 10-11-летняя циклическая колеблемость солнечной активности, одним из показателей которой служат числа Вольфа W (число групп солнечных пятен, умноженное на 10, плюс число отдельных пятен). За 100 лет происходит в среднем 9 или 10 циклов колебаний. Но если рассматривать помесячные данные о числах Вольфа за 2–3 года фазы снижения активности Солнца, то само это снижение можно считать уже не частью колебания, а тенденцией, на фоне которой происходят хаотические, случайные колебания (табл. 2.1).



Мы наблюдаем явную тенденцию снижения W при наличии случайных колебаний в отдельные месяцы.

Сезонные колебания продажи ряда предметов одежды и обуви — хорошо известное явление в торговле. Оно проявляется в циклическом изменении месячных объемов продаж на протяжении ряда лет. Но если рассматривать, например, объем продаж босоножек за отдельные дни мая, то заметим на общем фоне «тенденции» роста продажи колебания в отдельные дни недели или в зависимости от погоды дня. То, что для годовых отрезков времени — колеблемость, то для суточных внутри месяца — тенденция. Следовательно, кавычки можно и снять. Последний пример сложной структуры тенденций и колебаний дает нам динамика температуры воздуха, взятая за десятки лет с разбивкой по годам, месячным, суточным и часовым дан-

Имеется «высший» уровень динамики температур — ее тенденция к повышению, в основном в результате антропогенного воздействия — роста выбросов продуктов сжигания топлива в атмосферу. Это медленная тенденция роста среднегодовых температур примерно на 0,03 градуса за год. На фоне этой тенденции среднегодовые температуры отдельных лет колеблются в среднем на 2–3 градуса. Внутри каждого года на средних широтах происходят колебания средних температур месяцев — циклические сезонные колебания, которые, однако, для температуры в отдельные дни выступают как тенденция снижения температуры осенью и ее роста весной.

Около этих тенденций среднесуточные температуры колеблются в основном хаотически, ввиду смены холодных и теплых воздушных масс, т. е. циклонической и антициклонической динамики атмосферы. Но если спуститься на нижележащий уровень времени и рассматривать температуру воздуха в отдельные часы суток, то мы увидим новые, мелкомасштабные циклические колебания часовых температур: с утра и до 13–14 ч температура имеет тенденцию роста, а к вечеру — тенденцию снижения ввиду дневного нагревания воздуха солнечным светом и охлаждения ночью. Но в отдельные часы температура колеблется около этих «тенденций» в зависимости от облачности, ветра, дождя и т. д., иногда за полчаса температура воздуха может измениться на 5-10 градусов.

Не менее сложны тенденции динамики и колебания потребления электроэнергии в городе, зависящие от числа зданий и предприятий, режима работы последних, от времени года, температуры воздуха, времени суток, от трансляции футбольных матчей или концерта группы «Rolling Stones»… И все эти тенденции и колебания нужно уметь измерить, учесть, прогнозировать для того, чтобы электросистема работала без сбоев и наиболее рентабельно.

В связи с этим знание статистических методов и изучение тенденций и колебаний для экономиста-менеджера, для статистика-аналитика имеют огромное значение.


2.3. Периодизация динамики

Периодизация развития, т. е. расчленение периода развития во времени на однородные этапы, в пределах которых показатель подчиняется одному закону развития, это, по существу, типологическая группировка во времени. Периодизация может осуществляться несколькими методами.

Исторический метод. Периодизация осуществляется на основе «узаконенной» структуры динамики. При этом обращают внимание на значимые даты и события, а именно: время принятия управленческих решений по данному показателю, смену

хозяйственного механизма, смену руководства, войны и т. п. Недостатком этого метода является то, что точные временные границы периодов путем теоретического анализа удается получить крайне редко.

Метод параллельной периодизации. Идея этого метода заключается в следующем.

Пусть у — анализируемый показатель, развернутый в динамический ряд {yt}, где yt — значение уровня ряда в момент (интервал) времени t. Возможно, существует показатель х, которому соответствует динамический ряд {xt}, определяющий поведение исследуемого показателя у, тогда в роли «однокачественных» периодов развития нужно взять периоды х.

Рассмотрим условный пример.



Периоды однокачественной динамики показателей х легко выделить: это 1981–1985 и 1986–1989 гг. Линейный коэффициент корреляции между этими рядами очень высок: R = 0,995. Таким образом, можно считать, что ряд х полностью определяет значение уровней ряда у. Теперь, если предстоит качественный скачок показателя х, с очень большой степенью вероятности можно ожидать аналогичных изменений показателя у. В качестве недостатка метода параллельной периодизации следует отметить сложности в определении х — детерминирующего показателя. Более того, во многих случаях такой параметр вообще невозможно найти, так как он должен обладать весьма редкими свойствами — связью с анализируемым показателем и, главное, неоспоримыми временными границами периодов.

Методы многомерного статистического анализа. Часто требуется выделить однокачественные периоды в развитии явлений или процессов, получить адекватное отображение которых с помощью одного лишь показателя трудно. К таковым относятся, в частности, здоровье населения, развитие сельскохозяйственного производства и др. Очевидно, что даже такие комплексные показатели, как смертность, продолжительность жизни, заболеваемость, недостаточны для эквивалентного описания столь сложного, интегрированного явления, как здоровье. Необходима система показателей, при которой:

• учитывается многообразие аспектов явления;

• амортизируется искажающее воздействие недостоверных и неточных статистических данных;

• наличие множества показателей повышает обоснованность статистических выводов, т. е. обеспечивается надежность их экстраполяции.

Идеальным выходом является использование множества, включающего все характеристики процесса. Однако это не всегда возможно по разным причинам, чаще всего вследствие недоступности статистической информации. На основе комплексных динамических рядов (системы показателей) периодизация реализуется методом многомерной средней и методами факторного и кластерного анализа.

Однокачественность уровней временного ряда означает, что в пределах всего изучаемого периода, к которому относятся уровни, должна быть проведена типологическая группировка.

После выделения однородных групп могут использоваться и анализироваться уровни ряда. Это требование может быть сформулировано как обеспечение сравнимости по структуре совокупности, для чего обычно применяется стандартная, нормативная структура.


Глава 3. ПОКАЗАТЕЛИ ВРЕМЕННОГО РЯДА И МЕТОДЫ ИХ ИСЧИСЛЕНИЯ

3.1. Показатели, характеризующие тенденцию динамики

Чтобы построить систему показателей, характеризующих тенденцию динамики, нужно ответить на вопрос: какие черты, свойства этой тенденции нужно измерить и выразить в статистических показателях? Очевидно, что нас интересует величина изменений уровня, как в абсолютном, так и в относительном выражении (на какую долю, процент уровня, принятого за базу, произошло изменение?). Далее нас интересует, является ли изменение равномерным или неравномерным, ускоренным (замедленным). Наконец, нас интересует выражение тенденции в форме некоторого достаточно простого уравнения, наилучшим образом аппроксимирующего фактическую тенденцию динамики. Понятие об уравнении тенденции динамики было введено в статистику английским ученым Гукером в 1902 г. Он предложил называть такое уравнение трендом (trend).

Для того чтобы нагляднее представить показатели, характеризующие тенденцию, следует абстрагироваться от колеблемости и выявить динамический ряд в форме «чистого» тренда при отсутствии колебаний. Пример такого ряда представлен в табл.3.1.



Абсолютное изменение уровней — в данном случае его можно назвать абсолютным приростом — это разность между сравниваемым уровнем и уровнем более раннего периода, принятым за базу сравнения. Если эта база — непосредственно предыдущий уровень, показатель называют цепным, если за базу взят, например, начальный уровень, показатель называют базисным. Формулы абсолютного изменения уровня:

цепное: Δц = ynyn-1;

базисное: Δ0 = yny0.

Если абсолютное изменение отрицательно, его следует называть абсолютным сокращением. Абсолютное изменение имеет ту же единицу измерения, что и уровни ряда с добавлением единицы времени, за которую определено изменение: 22 тыс. т. в год (или 1,83 тыс. т в месяц, или 110 тыс. т. в пятилетие). Без указания единицы времени, за которую произошло измерение, абсолютный прирост нельзя правильно интерпретировать.

В табл. 3.1 абсолютное изменение уровня не является константой тенденции.

Оно со временем возрастает, т. е. уровни ряда изменяются с ускорением. Ускорение — это разность между абсолютным изменением за данный период и абсолютным изменением за предыдущий период равной длительности:

Δi = ΔiΔi-1

Показатель абсолютного ускорения применяется только в цепном варианте, но не в базисном. Отрицательная величина ускорения говорит о замедлении роста или об ускорении снижения уровней ряда.

Как видно из табл. 3.1, ускорение является константой тенденции данного ряда, что свидетельствует о параболической форме этой тенденции. Ее уравнение имеет вид:

yi = y0 + ati + bti2, (3.1)

где у0 — уровень ряда в начальный (нулевой) период;

а — средний абсолютный прирост (по всему ряду);

Ь — половина ускорения;

ti - номера периодов.

По данным табл. 3.1 имеем:

yi = 100 + 10∙ti + 2∙ti2

Показатель ускорения абсолютного изменения уровней выражается в единицах измерения уровня, деленных на квадрат длины периода. В нашем случае ускорение составило 4 тыс. т в год за год, или 4 тыс. т∙год2. Смысл показателя следующий: объем производства (или добыча угля, руды) имел абсолютный прирост, возрастающий на 4 тыс. т. в год ежегодно.

Усвоить рассмотренные показатели поможет следующая аналогия с механическим движением: уровень — это аналог пройденного пути, причем начало его отсчета не в нулевой точке; абсолютный прирост — аналог скорости движения тела, а ускорение абсолютного прироста — аналог ускорения движения. Пройденный телом путь, считая и тот, который уже был пройден до начала отсчета времени в данной задаче, равен:

S = S0 + V0t + (at2/2)

где S0 — путь, пройденный до начала отсчета времени;

V0 — начальная скорость;

а — ускорение;

t — время, прошедшее от начала его отсчета в задаче.

Сравнивая с формулой (3.1), видим, что S0 — аналог свободного члена y0, V0 — аналог начального абсолютного изменения а; а/2 — аналог ускорения прироста Ь.

Система показателей должна содержать не только абсолютные, но и относительные статистические показатели. Относительные показатели динамики необходимы для сравнения развития разных объектов, особенно если их абсолютные характеристики различны. Предположим, другое предприятие увеличивало производство аналогичной продукции с тенденцией, выраженной уравнением тренда:

yi = 20 + 4t + 0,5t2

И абсолютный прирост, и ускорение роста объема продукции во втором предприятии гораздо меньше, чем в первом. Но можно ли ограничиться этими показателями и сделать вывод, что развитие второго предприятия происходит более медленными темпами, чем первого? Меньший уровень еще не есть меньший темп развития, и это покажет относительная характеристика тенденции динамики — темп роста.

Темп роста — это отношение сравниваемого уровня (более позднего) к уровню, принятому за базу сравнения (более раннему). Темп роста исчисляется в цепном варианте — к уровню предыдущего года, а в базисном — к одному и тому же, обычно начальному уровню, что иллюстрируется формулой (3.2). Он свидетельствует о том, сколько процентов составляет сравниваемый уровень по отношению к уровню, принятому за базу, или во сколько раз сравниваемый уровень больше уровня, принятого за базу. При этом если уровни снижаются со временем, то сказать, что последующий уровень «больше в 0,33 раза», или составляет 33,3 % базового уровня, это, разумеется, означает, что уровень уменьшился в 3 раза. Но будет неверно, если сказать, что «уровень меньше в 0,33 раза». Темп изменения в разах всегда говорит о том, во сколько раз сравниваемый уровень больше.

Теперь можно утверждать, что относительная характеристика роста объема продукции на первом предприятии в среднем за год близка к 115 % (рост составляет приблизительно 15 % в год), и за шесть лет объем продукции увеличился в 2,32 раза, а на втором предприятии, вычислив также шесть уровней параболического тренда, читатель убедится, что в среднем за год объем продукции возрастал примерно на 20 %, а за шесть лет он возрос в 3,1 раза. Следовательно, в относительном выражении объем продукции на втором предприятии развивался, возрастал быстрее. Только в сочетании абсолютных и относительных характеристик динамики можно правильно отразить процесс развития совокупности (объекта).

Рассмотрим связь абсолютных и относительных показателей динамики. Обозначим темп изменения через к, тогда имеем:

цепной темп роста в период с номером n

kn = yn/yn-1

базисный темп роста за весь период между базой (0) и текущим годом (n).

kn/0 = yn/y0

(3.2)

Если сравниваемый уровень выразить через уровень базисного (или предыдущего) периода и абсолютное изменение, получим:

kn = (yn-1 + Δ)/yn-1 = 1 + Δ/yn-1, или 100 % + (Δ100/yn-1) (3.3)

Величина Δ/yn-1, т. е. отношение абсолютного изменения к уровню предыдущего (или базисного) года, называется относительным приростом (относительным сокращением, относительным изменением, процентным изменением) или темпом прироста. Он равен темпу изменения (роста) минус единица (минус 100 %).

Темп изменения — величина всегда положительная. Если уровень ряда динамики принимает положительные и отрицательные значения, например, финансовый результат от реализации продукции предприятием может быть прибылью (+), а может быть убытком (-), тогда темп изменения и темп прироста применять нельзя. В этом случае такие показатели теряют смысл и не имеют экономической интерпретации. Сохраняют смысл только абсолютные показатели динамики.

Рассмотрим соотношения между цепными и базисными показателями на примере данных табл. 3.1:

1) сумма цепных абсолютных изменений равна базисному абсолютному изменению

Σai(цепн) = ai(баз)

12 + 16 + 20 + 24 + 28 + 32 = 232–100 = 132;

2) произведение цепных темпов изменения равно базисному темпу изменения


1,12 x 1,143 x 1,156 x 1,162 x 1,163 x 1,16 = 2,32.

Неверно, будто сумма цепных темпов прироста равна базисному темпу прироста, %:

12 + 14,3 + 15,6 + 16,2 + 16,3 + 16 не = 132.

Значения цепных темпов прироста, рассчитанных каждый к своей базе, различаются не только числом процентов, но и величиной абсолютного изменения, составляющей каждый процент. Следовательно, складывать или вычитать цепные темпы прироста нельзя. Абсолютное значение однопроцентного прироста равно сотой части предыдущего уровня или базисного уровня.


3.2. Особенности показателей для рядов, состоящих из относительных уровней

Уровнями динамического ряда могут быть не только абсолютные показатели — численность совокупностей или объемы их признаков. Ряды динамики могут отражать развитие структуры совокупности, изменение со временем вариации признака в совокупности, взаимосвязи между признаками, соотношения значений признака для разных объектов. В этих случаях уровни динамического ряда сами являются относительными показателями и нередко выражаются в процентах. Следовательно, абсолютные изменения (и ускорения) тоже оказываются относительными величинами и могут быть выражены в процентах. В процентах, разумеется, будут выражены темпы изменения и относительные приросты. Все это создает нередко путаницу в интерпретации и использовании показателей динамики в печати и даже в специальной экономической литературе.

Рассмотрим пример. В США с конца XIX в. для группы ведущих акционерных компаний исчисляется так называемый индекс Доу Джонса — арифметическая средняя величина котировок акций на фондовых биржах. Этот показатель характеризует хозяйственную конъюнктуру: если индекс Доу Джонса повышается, т. е. растет относительная цена акций, значит, вкладчики капитала рассчитывают получить по акциям больший дивиденд (распределяемая часть прибыли). Это говорит о росте деловой активности. Падение индекса Доу Джонса свидетельствует о снижении деловой активности в стране. Величина этого показателя есть отношение в процентах цены акций на бирже к их номиналу (первоначальной цене при выпуске акций). Это отношение зависит не только от колебаний деловой активности, но имеет также общую тенденцию роста ввиду инфляции — падения покупательной силы доллара США. С начала века этот рост значителен, поэтому в наше время индекс Доу Джонса составляет более 2000 % (акция, когда-то выпущенная на сумму 100 дол., теперь стоит более 2000 современных дол.).

Например, «Биржевые ведомости» за 5.05.90 сообщают: индекс Доу Джонса на 3.05.90 составил 2689,64 % по сравнению с 2759,55 % на 29.04.90. Если вычислить показатель абсолютного изменения индекса, т. е. 2689,64 % — 2759,55 % = 69,91 %), и сказать, что индекс Доу Джонса за неделю понизился почти на 70 %), то создается ложное впечатление о чудовищном крахе на биржах США, потому что снижение на 70 % воспринимается как темп изменения — будто от прежней цены акций осталось только 30 %.

На самом деле снижение показателей с 2760 до 2690 % никакой катастрофой экономике США не грозит: это обычная на рынке ценных бумаг колеблемость курсов. «Биржевые ведомости» далее сообщали, что индекс Доу Джонса на 7.06.90 достиг 2911,6 %, т. е. по сравнению с 5.05.90 возрос на 222 единицы — во избежание путаницы их принято именовать пунктами. В первом рассмотренном случае индекс снизился на 70 пунктов, во втором — возрос на 222 пункта, а не процента. В процентах рост составил: 222: 2690 = 8,25 % — это и есть темп прироста курса акций.

Аналогичный подход и термины должны применяться и к изменению структуры. Например, общее производство электроэнергии в Российской Федерации в 1980 г. составляло 805 млрд. кВт-ч, в том числе на АЭС 54 млрд. кВт-ч, т. е. ее доля была равна 6,7 %. В 1991 г. общее производство электроэнергии составило 1068 млрд. кВт-ч, а доля АЭС — 11,2 %. Доля атомных станций за 11 лет возросла на 11,2–6,7 = 4,5 пункта; темп прироста доли составил 4,5: 6,7 = 67 %.

Показатели динамики долей имеют еще одну особенность, вытекающую из того, что сумма всех долей в любой период равна единице, или 100 %. Изменение, происшедшее с одной из долей, неизбежно меняет и доли всех других частей целого, если даже по абсолютной величине эти части не изменились. Казалось бы, это положение очевидно, однако нередко в печати встречаются рассуждения о том, что увеличение доли пшеницы и ячменя среди зерновых культур — это хорошо, но вот плохо, что уменьшились доли ржи, овса и гречихи. Как будто все доли сразу могут увеличиться!

Если признак варьирует альтернативно, то увеличение доли одной группы равно уменьшению доли другой группы в пунктах, но темпы изменения долей в процентах при этом могут сильно различаться. Темп больше у той доли, которая в базисном периоде была меньше. Например, удельный вес жилой площади, оборудованной водопроводом, в городском государственном и общественном жилом фонде в 1970 г. составлял 78,9 %, а в 1989 г. достиг 92,9 %, т. е. возрос на 14 пунктов, или на 14: 78,9 == 17,7 %. Соответственно доля не оборудованной водопроводом жилой площади снизилась за 19 лет с 21,1 до 7,1 %>, т. е. на те же 14 пунктов, это снижение составило уже: 14: 21,1 = 66,4 %.

В общем виде темп роста одной из альтернативных долей зависит от темпа роста другой доли и величины этой доли следующим образом:

k2 = (1k1x0)/(1x0) (3.4)

где х0 — доля в базисном периоде одного из альтернативных значений признака;

k1 — темп роста этой доли;

k2 — темп изменения доли второго альтернативного значения признака.

Абсолютное изменение долей в пунктах зависит от величины доли и темпа роста таким образом:

A1 = — A2 = x0(ki1)100 (3.6)

При наличии в совокупности не двух, а более групп абсолютное изменение каждой из долей в пунктах зависит от доли этой группы в базисный период и от соотношения темпа роста абсолютной величины объемного признака этой группы и среднего темпа роста объемного признака во всей совокупности. Доля i-й группы в сравниваемый (текущий) период определяется как



где di0, di1 — доли i-й группы в базисный и текущий периоды; ki — темп роста объемного признака в i-й группе; k — средний темп роста; т — число групп.

Если, например, в базисном году поголовье коров в личных и частных хозяйствах составляло в области 68 тыс. голов из общего поголовья 450 тыс. голов, а, по прогнозу, через 10 лет поголовье коров в индивидуальных хозяйствах возрастет в пять раз при общем темпе роста поголовья в области 120 %, то доля индивидуальных хозяйств в поголовье коров, по прогнозам, должна будет составить: 0,151 5/1,2 = 0,6296, или почти 63 % поголовья.

Особенностью показателей динамики относительных величин интенсивности является то, что темпы роста и темпы прироста (или сокращения) прямого и обратного показателей не совпадают. Пусть, например, трудоемкость производственной операции на старом станке составляла 10 мин., а производительность труда соответственно 48 операций за смену. После замены станка на новый трудоемкость операции снизилась в пять раз (до 2 мин.), а производительность возросла в те же пять раз — до 240 операций за смену. Относительное изменение трудоемкости составило: (2 — 10): 10 = -0,8, т. е. трудоемкость снизилась на 80 %. Относительное изменение производительности труда составило: (240 — 48): 48 = 4, или 400 %, т. е. производительность труда возросла на 400 %. Причина состоит в том, что пределом, к которому стремятся по мере прогресса показатели ресурсоотдачи, является бесконечность, а пределом, к которому стремятся обратные им показатели ресурсоемкости, является нуль. Понимание разного поведения показателей динамики прямых и обратных мер эффективности очень важно для экономиста и статистика.

По мере приближения относительного показателя к пределу одно и то же абсолютное изменение в пунктах приобретает иное качественное содержание. Так, например, если показатель тесноты связи — коэффициент детерминации — возрос с 40 до 65 % (на 25 пунктов), то система факторов в регрессионном уравнении как была, так и осталась неполной, т. е. хорошая модель не получилась. Но если после изменения состава факторов коэффициент детерминации возрос с 65 до 90 % — на те же 25 пунктов, это изменение имеет другое качественное содержание: получена хорошая регрессионная модель, в основном объясняющая вариацию результативного признака с достаточно полной системой факторов.


3.3. Средние показатели временных рядов

Средние показатели динамики — средний уровень ряда, средние абсолютные изменения и ускорения, средние темпы роста — характеризуют тенденцию. Они необходимы при обобщении характеристик тенденции за длительный период, по различным периодам; они незаменимы при сравнении развития за неодинаковые по длительности отрезки времени и при выборе аналитического выражения тренда. При наличии в динамическом ряду существенных колебаний уровней определение средних показателей тенденции требует применения специальных методов статистики, которые излагаются в последующих главах. В данной главе рассматриваются только форма, математические свойства средних показателей динамики и простейшие приемы их вычисления, применимые на практике к рядам со слабой колеблемостью.

Средний уровень интервального ряда динамики определяется как простая арифметическая средняя из уровней за равные промежутки времени:


или как взвешенная арифметическая средняя из уровней за неравные промежутки времени, длительность которых и является весами.



По данным табл. 3.2 определим среднегодовые уровни урожайности картофеля по пятилетиям.

Пятилетия ∙ Среднегодовые уровни, д/га

1982–1986 ∙ 157,0

1988–1992 ∙ 186,6

Средние уровни принято относить к середине усредняемого отрезка времени, т. е. в нашем примере к средним годам каждого пятилетия.

Если, например, с 1-го числа месяца по 18-е число на предприятии работали 45 человек, с 19-го по 27-е — 48 человек, а с 28-го по 31-е число — 54 человека, то среднее списочное число работников за месяц составит:

y = (45∙18 + 48∙9 + 54∙4)/31 = 47.03 чел.

В моментном ряду смысл среднего уровня заключается в том, что он характеризует уже не состояние объекта в отдельные моменты, а его среднее, обобщенное состояние между начальным и конечным моментами учета. Из этого следует, что уровни, относящиеся к начальному и конечному моментам, играют не ту роль, что уровни, относящиеся к моментам внутри изучаемого отрезка времени. Начальный и конечный уровни находятся на границе изучаемого интервала, они наполовину относятся к предыдущему и последующему интервалам и лишь наполовину к изучаемому. Уровни, относящиеся к моментам внутри усредняемого интервала, целиком относятся только к нему. Отсюда получаем особую форму средней арифметической величины, называемой хронологической средней:


Проблема вычисления среднего уровня моментного ряда при неравных промежутках между моментами является спорной и здесь не рассматривается.

Если известны точные даты изменения уровней моментного ряда, то средний уровень определяется как


где ti — время, в течение которого сохранялся уровень.

Средний абсолютный прирост (абсолютное изменение) определяется как простая арифметическая средняя из абсолютных изменений за равные промежутки времени (цепных абсолютных изменений) или как частное от деления базисного абсолютного изменения па число усредняемых отрезков времени от базисного до сравниваемого периода:

Δ¯ = Δi/n = (yn — y0)/n (3.10)

Например, производство телевизоров в Российской Федерации в 1980 г. составило 4013 тыс. шт., а в 1990 г. — 4717 тыс. шт.

Среднегодовой абсолютный прирост производства телевизоров за 10 лет составил:

Δ¯ = (4717–4013)/10 = 70 4 тыс. шт. за год.

Для правильной интерпретации показатель среднего абсолютного изменения должен сопровождаться указанием двух единиц времени:

1) времени, за которое он вычислен, к которому относится и которое он характеризует (в нашем примере это десятилетие — 1980–1990 гг.);

2) 2) время, на которое показатель рассчитан, время, входящее в его единицу измерения, — 1 год. Можно рассчитать среднемесячный абсолютный прирост за те же 10 лет — он будет в 12 раз меньше среднегодового прироста.

Среднее ускорение абсолютного изменения применяется реже. Для его надежного расчета даже при слабых колебаниях уровней требуется применять методику аналитического выравнивания по параболе II порядка. Не рекомендуется измерять среднее ускорение без абстрагирования от колебаний уровней. Для более грубого, приближенного расчета среднего ускорения можно воспользоваться средними годовыми уровнями, сглаживающими колебания. Например, среднегодовое производство мяса в Российской Федерации составляло:



Абсолютный прирост за второе пятилетие по сравнению с первым составил 0,69 млн. т, за третье по сравнению со вторым 1,59 млн. т. Следовательно, ускорение в третьем пятилетии по сравнению со вторым составило: 1,59 — 0,69 = 0,90 млн. т в год за пять лет, а среднегодовое ускорение прироста равно: 0,90: 5 = 0,18 млн. т в год за год. Среднее ускорение требует указания трех единиц времени, хотя, как правило, две из них одинаковы: период, на который рассчитан прирост, и время, на которое рассчитано ускорение.

Средний темп изменения определяется наиболее точно при аналитическом выравнивании динамического ряда по экспоненте. Если можно пренебречь колеблемостью, то средний темп определяют как геометрическую среднюю из цепных темпов роста за n лет или из общего (базисного) темпа роста за n лет:


Например, стоимость потребительской корзины за год в результате инфляции возросла в шесть раз. Каков средний месячный темп инфляции?

= 12√6 = 1,16, или 116%

т. е. в среднем за месяц цена увеличивалась на 16 % к уровню предыдущего месяца.

Средний темп роста так же, как средний прирост, следует сопровождать указанием двух единиц времени: периода, который им характеризуется, и периода, на который рассчитан темп, например, среднегодовой темп за последнее десятилетие; среднемесячный темп за полугодие и т. п.

Если исходной информацией служат темпы прироста и нужно вычислить их среднегодовую величину, то предварительно следует все темпы прироста превратить в темпы роста, прибавив 1, или 100 %, вычислить их среднюю геометрическую и снова вычесть 1, или 100 %. Интересно, что ввиду асимметрии темпа прироста и темпа сокращения при равных их величинах общий темп прироста всегда отрицателен. Так, если за первый год объем производства вырос на 20 %), а за второй снизился на 20 %> (темпы цепные), то за два года имеем:

средний темп роста k¯ = √(1.2∙0,8) = 0,9798, или 97,98 %;

средний темп прироста k¯ — 1 = -0,0202, или -2,02 %.

Применяя для вычисления среднего темпа среднюю геометрическую, мы опираемся на соблюдение фактического отношения конечного уровня к начальному при замене фактических темпов на средние. В практических задачах может потребоваться вычисление среднего уровня при условии соблюдения отношения суммы уровней за период к уровню, принятому за базу. Например, если общий выпуск продукции за пятилетие должен составить 800 % к базисному (среднегодовому за предыдущие 5 лет выпуску), или, что то же самое, среднегодовой уровень должен составить 160 % к базовому уровню, каков должен быть среднегодовой темп роста выпуска продукции? В 1974 г. украинские статистики А. и И. Соляники предложили следующую приближенную формулу для среднего темпа роста, удовлетворяющую этому условию:


где т — число суммируемых уровней;

y0 — базисный уровень.

Темп роста данного вида называют параболическим (отсюда обозначение k¯пар), так как он вычисляется по уравнению параболы порядка т. При т = 5 имеем:


Расчет по этому среднегодовому темпу дает сумму выпуска за 5 лет в 8,069 раза больше базисной, т. е. приближение хорошее. В общем виде проблема параболических темпов исследована саратовским статистиком Л.С. Казинцом [8]. Им составлены таблицы, с помощью которых, зная отношение суммы уровней к базисному уровню и число суммируемых уровней т, можно получить пар. Таблица Л.С. Казинца рассчитана на основе нахождения корней уравнения:


Для нашего примера таблица Л.С. Казинца дает среднегодовой темп роста 116,1 % и сумму выпуска в 8,00016 раза больше базисной.

Интересную задачу представляет определение срока, за который ряд с большим средним показателем динамики, но меньшим начальным уровнем догонит другой ряд с большим начальным уровнем, но меньшим показателем динамики. Для абсолютных приростов задача элементарна: имеем один ряд с базисным уровнем yI0 и средним абсолютным приростом Δ¯I; второй ряд с показателями соответственно yII0,Δ¯II, причем yII0 > yI0; Δ¯II < Δ¯I. Уровень первого ряда сравняется с уровнем второго ряда через

(yII0 — yI0)/(Δ¯I — Δ¯II) лет.

Та же задача может быть решена на основе ускорений. Имеем первый ряд с базисным уровнем yI0, базисным абсолютным изменением aI0 и средним ускорением ускорением bI0; второй ряд — с показателями yII0, aII0, bII0. При каком числе n периодов (лет) после базисного уровни рядов сравняются? Тенденции рядов пара


Приравняв правые части уравнений, получим:


Искомый срок n является корнем этого квадратного уравнения. Если, например, имеем:

yI0 = 500; aI0 = +40; I = +2; yII0 = 300; aII0 = +26; II = +3, то

— 200 + (-14)∙n + 0.5∙n2 = 0,

откуда

n = (14 ± √(196 + 400))/2∙5 = 14 ± 24,4.

Второй ряд догонит первый по уровню через 38,4 года; уровни рядов были одинаковы 10,4 года назад. Будущие равные уровни составляют 3510, а прошлые были равны 192.

Если мы хотим найти срок п, через который уровни рядов сравняются, то эту задачу можно решить на основе темпов изменения. Имеем:



т. е. искомый срок равен частному отделения разности логарифмов уровней рядов в базисном периоде на разность логарифмов темпов изменения, только переставленных при вычитании. Обычно и в числителе, и в знаменателе от большего логарифма вычитается меньший. Например, первый ряд имеет: yI0 = 300; k¯ =1,09; второй ряд — yII0 = 100; k¯II = 1,2, тогда:

n = (ln 300 — ln 100)/(ln 1,2 — ln 1.09) = (5,70382 — 4,60517)/(0,18232 — 0.08618) = 11,43.

Через 11,43 года уровень второго ряда сравняется с первым при сохранении экспоненциальных трендов обоих рядов.


Глава 4. ОСНОВНЫЕ ТИПЫ ТЕНДЕНЦИЙ И УРАВНЕНИЙ ТРЕНДА

В главе 2 было рассмотрено понятие о тенденции временного ряда, т. е. тенденции динамики развития изучаемого показателя. Задача данной главы состоит в том, чтобы рассмотреть основные типы таких тенденций, их свойства, отражаемые с большей или меньшей степенью полноты уравнением линии тренда. Укажем при этом, что в отличие от простых систем механики тенденции изменения показателей сложных социальных, экономических, биологических и технических систем только с некоторым приближением отражаются тем или иным уравнением, линией тренда.

В данной главе рассматриваются далеко не все известные в математике линии и их уравнения, а лишь набор их сравнительно простых форм, который мы считаем достаточным для отображения и анализа большинства, встречающихся на практике, тенденций временных рядов. При этом желательно всегда выбирать из нескольких типов линий, достаточно близко выражающих тенденцию, более простую линию. Этот «принцип простоты» обоснован тем, что чем сложнее уравнение линии тренда, чем большее число параметров оно содержит, тем при равной степени приближения труднее дать надежную оценку этих параметров по ограниченному числу уровней ряда и тем больше ошибка оценки этих параметров, ошибки прогнозируемых уровней.


4.1. Прямолинейный тренд и его свойства

Самым простым типом линии тренда является прямая линия, описываемая линейным (т. е. первой степени) уравнением тренда:

y^i = a + bti

где y^i — выровненные, т. е. лишенные колебаний, уровни тренда для лет с номером i;

а — свободный член уравнения, численно равный среднему выровненному уровню для момента или периода времени, принятого за начало отсчета, т. е. для t = 0;

Ь — средняя величина изменения уровней ряда за единицу изменения времени;

ti — номера моментов или периодов времени, к которым относятся уровни временного ряда (год, квартал, месяц, дата).

Среднее изменение уровней ряда за единицу времени — главный параметр и константа прямолинейного тренда. Следовательно, этот тип тренда подходит для отображения тенденции примерно равномерных изменений уровней: равных в среднем абсолютных приростов или абсолютных сокращений уровней за равные промежутки времени. Практика показывает, что такой характер динамики встречается достаточно часто. Причина близких к равномерному абсолютных изменений уровней ряда состоит в следующем: многие явления, как, например, урожайность сельскохозяйственных культур, численность населения региона, города, сумма дохода населения, среднее потребление какого-либо продовольственного товара и др., зависят от большого числа различных факторов. Одни из них влияют в сторону ускоренного роста изучаемого явления, другие — в сторону замедленного роста, третьи — в направлении сокращения уровней и т. д. Влияние разнонаправленных и разноускоренных (замедленных) сил факторов взаимно усредняется, частично взаимно погашается, а равнодействующая их влияний приобретает характер, близкий к равномерной тенденции. Итак, равномерная тенденция динамики (или застоя) — это результат сложения влияния большого количества факторов на изменение изучаемого показателя.

Графическое изображение прямолинейного тренда — прямая линия в системе прямоугольных координат с линейным (арифметическим) масштабом на обеих осях. Пример линейного тренда дан на рис. 4.1.

Абсолютные изменения уровней в разные годы не были точно одинаковыми, но общая тенденция сокращения численности занятых в народном хозяйстве очень хорошо отражается прямолинейным трендом. Его параметры вычислены в гл. 5 (табл. 5.3).



Рис. 4.1. Динамика числа занятых в народном хозяйстве в России на 31 декабря каждого года


Основные свойства тренда в форме прямой линии таковы:

• равные изменения за равные промежутки времени;

• если средний абсолютный прирост — положительная величина, то относительные приросты или темпы прироста постепенно уменьшаются;

• если среднее абсолютное изменение — отрицательная величина, то относительные изменения или темпы сокращения постепенно увеличиваются по абсолютной величине снижения к предыдущему уровню;

• если тенденция к сокращению уровней, а изучаемая величина является по определению положительной, то среднее изменение Ь не может быть больше среднего уровня а;

• при линейном тренде ускорение, т. е. разность абсолютных изменений за последовательные периоды, равно нулю.

Свойства линейного тренда иллюстрирует табл. 4.1. Уравнение тренда:

y^i = 100 + 20*ti

Показатели динамики при наличии тенденции сокращения уровней приведены в табл. 4.2.




4.2. Параболический тренд и его свойства

Под названием параболического будем иметь в виду тренд, выраженный параболой II порядка с уравнением

y^i = a + b*t + c*t2.

Параболы III порядка и более высоких порядков редко применимы для выражения тенденции динамики и слишком сложны для получения надежных оценок параметров при ограниченной длине временного ряда. Прямую линию, с точки зрения математики, можно также считать одним из видов парабол — параболой I порядка, которая уже рассмотрена ранее.

Значения (смысл, сущность) параметров параболы II порядка таковы: свободный член а — это средний (выровненный) уровень тренда на момент или период, принятый за начало отсчета времени, т. е. t = 0; Ь — это средний за весь период среднегодовой прирост, который уже не является константой, а изменяется равномерно со средним ускорением, равным 2 с, которое и служит константой, главным параметром параболы II порядка.

Следовательно, тренд в форме параболы II порядка применяется для отображения таких тенденций динамики, которым свойственно примерно постоянное ускорение абсолютных изменений уровней. Процессы такого рода встречаются на практике гораздо реже, чем процессы с равномерным изменением, но, с другой стороны, любое отклонение процесса от строго равномерного прироста (или сокращения) уровней можно интерпретировать как наличие ускорения. Более того, существует строгое математическое правило: чем выше порядок параболы, тем ближе линия тренда к уровням исходного временного ряда. Если это правило довести до крайнего предела, то любой ряд из n уровней может быть точно отображен параболой (n — 1) — го порядка! (Через любые две точки проходит одна прямая, через три точки — одна парабола II порядка и т. д.) Такое «приближение» линии тренда к эмпирическому ряду, содержащему как тенденцию, так и колебания, нельзя считать достижением научного анализа. Напротив, применяя параболу более высокого порядка там, где сущность процесса этого не требует, а только ради уменьшения остаточной суммы отклонений (или их квадратов) отдельных уровней от тренда, исследователь уходит от цели, смешивая тренд с колебаниями.

Парабола II порядка, как уравнение тренда, применяется к различным процессам, которые на некотором, как правило непродолжительном, этапе развития имеют примерно постоянное ускорение абсолютного прироста уровней. Такими бывают рост населения отдельных городов или регионов, ускоренное увеличение объема продукции в фазе циклического подъема, как, например, динамика экспорта Японии в 1988–1995 гг. на рис. 4.2.



Рис. 4.2. Динамика экспорта Японии


Расчет уравнения этой параболы приведен в гл. 5. Основные свойства тренда в форме параболы II порядка таковы:

1) неравные, но равномерно возрастающие или равномерно убывающие абсолютные изменения за равные промежутки времени;

2) парабола, рассматриваемая относительно ее математической формы, имеет две ветви: восходящую с увеличением уровней признака и нисходящую с их уменьшением. Но относительно статистики по содержанию изучаемого процесса изменений трендом, выражающим определенную тенденцию развития, чаще всего можно считать только одну из ветвей: либо восходящую, либо нисходящую. В особых, более конкретных, ситуациях мы не отрицаем возможности объединения обеих ветвей в единый тренд;

3) так как свободный член уравнения а как значение показателя в начальный момент (период) отсчета времени, как правило, величина положительная, то характер тренда определяется знаками параметров Ь и с:

a) при Ь > 0 и с > 0 имеем восходящую ветвь, т. е. тенденцию к ускоренному росту уровней;

b) при Ь < 0 и с < 0 имеем нисходящую ветвь — тенденцию к ускоренному сокращению уровней;

c) при Ь > 0 и с < 0 имеем либо восходящую ветвь с замедляющимся ростом уровней, либо обе ветви параболы, восходящую и нисходящую, если их по существу можно считать единым процессом;

d) при Ь < 0 и с > 0 имеем либо нисходящую ветвь с замедляющимся сокращением уровней, либо обе ветви — нисходящую и восходящую, если их можно считать единой тенденцией;

4) при параболической форме тренда, в зависимости от соотношений между его параметрами, цепные темпы изменений могут либо уменьшаться, либо некоторое время возрастать, но при достаточно длительном периоде рано или поздно темпы роста обязательно начинают уменьшаться, а темпы сокращения уровней при Ь < 0 и с < 0 обязательно начинают возрастать (по абсолютной величине относительного изменения).

Ввиду ограниченного объема учебника рассмотрим не все четыре случая параболических трендов, а лишь два первых (табл. 4.3 и 4.4).




В тех случаях, когда по существу изучаемого процесса допустимо считать единым трендом обе ветви параболы, представляет большой интерес решение задачи о нахождении того периода или момента времени, когда уровень тренда достигает максимума (когда Ь > 0, с < 0) или минимума (если Ь < 0, с > 0). Экстремальная точка параболы y^ = a + bt + ct2 достигается при нулевом значении первой производной:

df/dt = (a + bt + ct2) = b + 2ct.

Из равенства b + 2ct = 0 имеем: t = — b/2c.

Например, если y^ = 100 + 20t — 2t2, то максимум парабола имеет при t = -20/2(-2) = 5.

Максимальное значение уровня тренда при t = 5 составит:

y^max = 100 + 20∙5–2∙52 = 150.

Если имеем параболу при Ь < 0, а с > 0, например:

y^i = 200 — 20t + 2t2, то минимальное значение тренда достигается при t = b/2c = 20/2∙2 = 5, и это минимальное значение составит:

y^min = 200 — 20∙5 + 2∙52 = 150.


4.3. Экспоненциальный тренд и его свойства

Экспоненциальным трендом называют тренд, выраженный уравнением:

y^i = a∙kIi или в форме: y^i = exp [ln а + In k∙ti;]

Свободный член экспоненты а равен выровненному уровню, т. е. уровню тренда в момент или период, принятый за начало отсчета времени, т. е. при t = 0. Основной параметр экспоненциального тренда к является постоянным темпом изменения уровней (ценным). Если к>1, имеем тренд с возрастающими уровнями, причем это возрастание не просто ускоренное, а с возрастающим ускорением и возрастающими производными всех более высоких порядков. Если к<1, то имеем тренд, выражающий тенденцию постоянного, но замедляющегося сокращения уровней, причем замедление непрерывно усиливается. Экстремума экспонента не имеет и при t —> oo стремится либо к оо при k > 1, либо к 0 при k < 1.

Экспоненциальный тренд характерен для процессов, развивающихся в среде, не создающей никаких ограничений для роста уровня. Из этого следует, что на практике он может развиваться только на ограниченном промежутке времени, так как любая среда рано или поздно создает ограничения, любые ресурсы со временем исчерпаемы. Однако практика показала что, например, численность населения Земли на протяжении 1950–1985 гг. возрастала примерно по экспоненте со среднегодовым темпом роста к = 1,018 и за это время возросла вдвое — с 2,5 до 5 млрд. чел. (рис. 4.3). В настоящее время темп роста населения постепенно уменьшается.



Рис. 4.3. Рост народонаселения Земли


Экспоненциальный рост объема реализации и производства происходит при возникновении новых видов продукции и их освоении промышленностью: при появлении цветных телевизоров, видеомагнитофонов, пейджеров и т. п., но когда производство начинает наполнять рынок, приближаться к спросу, экспоненциальный рост прекращается.

Расчет экспоненциального тренда дан в гл. 5. Основные свойства экспоненциального тренда:

1. Абсолютные изменения уровней тренда пропорциональны самим уровням.

2. Экспонента экстремумов не имеет: при k > 1 тренд стремится к + оо, при k < 1 тренд стремится к нулю.

3. Уровни тренда представляют собой геометрическую прогрессию: уровень периода с номером t = т есть a*km.

4. При k > 1 тренд отражает ускоряющийся неравномерно рост уровней, при k < 1 тренд отражает замедляющееся неравномерно уменьшение уровней. Поведение основных показателей динамики в этих случаях рассмотрено в табл. 4.5 и 4.6.

В табл. 4.5 и 4.6 в последней графе приведены редко применяемые показатели динамики III порядка: ускорение (или прирост) ускорения и замедление ускорения. Эти абсолютные показатели даны для наглядного пояснения главного отличия экспоненциального тренда от парабол любого порядка: экспонента не имеет постоянных производных любого порядка по времени. Постоянен только цепной темп изменения.




Читатель может заинтересоваться и таким вопросом: как назвать тенденцию динамики, при которой и темп изменения был бы непостоянен, а имел постоянное абсолютное или относительное изменение, например, уравнение типа

y^ = a(k + bti)ti или y^i = akt2 т. д.

Подобные «гиперэкспоненты» не применяются статистикой, ибо любой, сколь угодно быстрый, сколь угодно ускоряющийся рост может быть отображен обычной экспонентой — стоит лишь уменьшить период, за который происходит возрастание (или сокращение) уровней в к раз. По своему существу экспоненциальное развитие процесса и есть предельно возможное, предельно благоприятное по условиям развития, так как оно осуществляется в среде, не ограничивающей развитие данного процесса. Но следует помнить, что это происходит только до определенного времени, так как каждая среда, каждый ресурс в природе ограничен. Единственный спорный в науке процесс, по которому до сих пор нет доказательства ограниченности его во времени, — это экспоненциальное замедляющееся расширение Вселенной. Ограничено ли оно и сменится ли со временем сжатием или будет продолжаться бесконечно, зависит от значения средней плотности вещества и излучения во Вселенной, которую пока науке установить не удалось, ибо не все формы существования вещества и полей науке известны. Зато интересно знать, что самый фундаментальный процесс, охватывающий всю известную Вселенную, уже, по крайней мере, 12–15 млрд. лет развивается по экспоненте.


4.4. Гиперболический тренд и его свойства

Из различных форм гипербол рассмотрим только наиболее простую:

y^ = a + (b/t).

Если основной параметр гиперболы Ь > 0, то этот тренд выражает тенденцию замедляющегося снижения уровней и при t — > oo, y^ — > а. Таким образом, свободный член гиперболы — это предел, к которому стремится уровень тренда.

Такая тенденция наблюдается, например (рис. 4.4), при изучении процесса снижения затрат любого ресурса (труда, материалов, энергии) на единицу данного вида продукции или ее себестоимости в целом. Затраты ресурса не могут стремиться к нулю, значит, экспонента не соответствует сущности процесса; нужно применить гиперболическую формулу тренда.

Если параметр Ь < 0, то с возрастанием t, т. е. с течением времени, уровни тренда возрастают и стремятся к величине а при t —> oо.

Такой характер динамики присущ, например, показателям КПД двигателей или иных преобразователей энергии (трансформатор тока, фотоэлемент и т. п.). По мере развития научно-технического прогресса эти КПД постепенно повышаются, но никогда не могут превысить определенного предела для каждого типа двигателя и не могут превысить 100 % в принципе для любого преобразователя энергии. При расчете гиперболического тренда нельзя нумеровать года от середины ряда, так как значения 1/ti должны быть всегда положительными.

Основные свойства гиперболического тренда:

1. Абсолютный прирост или сокращение уровней, ускорение абсолютных изменений, темп изменения — все эти показатели не являются постоянными. При Ь > 0 уровни замедленно уменьшаются, отрицательные абсолютные изменения, а также положительные ускорения тоже уменьшаются, цепные темпы изменения растут и стремятся к 100 %.



Рис. 4.4. Динамика расхода условного топлива на производство электроэнергии (г на 1 кВт-ч) на электростанциях региона.


2. При Ь < 0 уровни замедленно возрастают, положительные абсолютные изменения, а также отрицательные ускорения и цепные темпы роста замедленно уменьшаются, стремясь к 100 %.

Как видим, гиперболический тренд описывает в любом случае тенденцию такого процесса, показатели которого со временем затухают, т. е. происходит переход от движения к застою. Иллюстрацией этих свойств может служить табл. 4.7.



4.5. Логарифмический тренд и его свойства

Если изучаемый процесс приводит к замедлению роста какого-то показателя, но при этом рост не прекращается, не стремится к какому-либо ограниченному пределу, то гиперболическая форма тренда уже не подходит. Тем более не подходит парабола с отрицательным ускорением, по которой замедляющийся рост перейдет со временем в снижение уровней. В указанном случае тенденция изменения лучше всего отображается логарифмической формой тренда: y^ = a + b + ln ti.

Логарифмы возрастают значительно медленнее, чем сами числа (номера периодов ti), но рост логарифмов неограничен. Подбирая начало отсчета периодов (моментов) времени, можно найти такую скорость снижения абсолютных изменений, которая наилучшим образом отвечает фактическому временному ряду.

Примером тенденций, соответствующих логарифмическому тренду, может служить динамика рекордных достижений в спорте: известно, что увеличение на 1 см рекорда прыжка в высоту или снижение на 0,1 с времени бега на 200 или 400 м требует все больших и больших затрат времени, каждый рекорд дается все большим и большим трудом. В то же время нет и «вечных» рекордов, все спортивные достижения улучшаются, но медленнее и медленнее, т. е. по логарифмическому тренду. Нередко такой же характер динамики присущ на отдельных этапах развития динамике урожайности или валового сбора какой-то культуры в данном регионе, пока новое агротехническое достижение не придаст снова тенденции ускорения, что иллюстрирует рис. 4.5.



Рис. 4.5. Динамика валового сбора чая в Китае


Конечно, характер тенденции маскируется колебаниями, но видно, что рост валового сбора замедляется. Это показывают и средние уровни сбора чая:

За 1978–1983 гг. средний сбор равен 333 тыс. т;

За 1984–1989 гг. средний сбор равен 483 тыс. т, рост на 150 тыс. т;

За 1990–1994 гг. средний сбор равен 566 тыс. т, рост на 83 тыс.т.

На рис. 4.5 для убедительности нанесен и логарифмический тренд, расчет которого дан в гл. 5. Заметны также 5-6-летние циклические колебания валового сбора чая.

Основные свойства логарифмического тренда:

1. Если Ь > 0, то уровни возрастают, но с замедлением, а если Ь<0, то уровни тренда уменьшаются, тоже с замедлением.

2. Абсолютные изменения уровней по модулю всегда уменьшаются со временем.

3. Ускорения абсолютных изменений имеют знак, противоположный самим абсолютным изменениям, а по модулю постепенно уменьшаются.

4. Темпы изменения (цепные) постепенно приближаются к 100 % при t —> оо.

Можно сделать общий вывод о том, что логарифмический тренд отражает, так же как и гиперболический тренд, постепенно затухающий процесс изменений. Различие состоит в том, что затухание по гиперболе происходит быстро при приближении к конечному пределу, а при логарифмическом тренде затухающий процесс продолжается без ограничения гораздо медленнее.


4.6. Логистический тренд и его свойства

Логистическая форма тренда подходит для описания такого процесса, при котором изучаемый показатель проходит полный цикл развития, начиная, как правило, от нулевого уровня, сначала медленно, но с ускорением возрастая, затем ускорение становится нулевым в середине цикла, т. е. рост происходит по линейному тренду, затем, в завершающей части цикла, рост замедляется по гиперболе по мере приближения к предельному значению показателя.

Примером такого цикла динамики может служить изменение доли грамотного населения в стране, например в России, с 1800 г. до наших дней, или изменение доли семей, имеющих телевизоры, примерно с 1945 до 2000 г. в России, доли жилищ в городах, имеющих горячее водоснабжение или центральное отопление (процесс, еще не законченный). В некоторых зарубежных программах для компьютеров логистическая кривая называется S-образной кривой.

Можно, конечно, логистическую тенденцию считать объединением трех разных по типу тенденций: параболической с ускоряющимся ростом на первом этапе, линейной — на втором и гиперболической с замедляющимся ростом — на третьем этапе. Но есть доводы и в пользу рассмотрения всего цикла развития как особого единого типа тенденции со сложными, переменными свойствами, но постоянным направлением изменений в сторону увеличения уровней в рассмотренных нами примерах или уменьшения уровней, если взять противоположный процесс — сокращение доли неграмотных среди населения, доли жилищ, не оборудованных газоснабжением или центральным отоплением, и т. д.

Рассмотрение таких временных рядов, как проявление единой логистической тенденции, позволяет уже на первом этапе рассчитать всю траекторию развития, определить сроки перехода от ускоренного роста к замедленному, что чрезвычайно важно при планировании производства или реализации нового вида товара, спрос на который будет проходить все этапы логистической тенденции вплоть до насыщения рынка. Так, например, обеспеченность населения в России автомобилями в конце 1980-х годов находилась на начальном этапе логистической кривой, и это означало, что предстоит еще ряд лет или даже десятилетий ускоренного роста спроса. В то же время обеспеченность фотоаппаратами уже достигла этапа замедления роста, и это означало, что расширять производство или импорт прежних типов фотоаппаратов не следует. Расширение их рынка возможно было только для принципиально новых типов фотоаппаратов, насыщенность которыми еще находится в самом начале первого этапа.

В вышеописанном диапазоне изменения уровней, т. е. от нуля до единицы, уравнение логистического тренда имеет вид:


При a0 > 0, a a1 < 0 с ростом номеров периодов времени ti получаем логистическую тенденцию роста уровней, причем если нужно начать рост почти от нулевой величины, то а0 должно быть примерно равно 10, тогда при t = 1 1/e9 + = 0,000123. Чем больше модуль a1, тем быстрее будут возрастать уровни. При a0 < 0 и a1 > 0 имеем логистический тренд со снижением уровней, причем, если снижение должно начаться почти от единицы, то а0 должно быть примерно равно -10. Чем больше а1, тем быстрее будут снижаться уровни, например, при а0 = -10; a1 = 1, уже при ti = 20 уровни снизятся почти до нуля.

Если же диапазон изменения уровней ограничен не нулем и единицей, а любыми значениями, определяемыми исходя из существа задачи, обозначаемыми

ymax ymin,

то формула логистического тренда принимает вид:


Как видно из табл. 4.8, абсолютные изменения нарастают до середины периода, затем уменьшаются. Все они положительны. Ускорения сначала возрастают, а после середины периода снижаются, становятся отрицательными, но уменьшаются по модулю. Сумма положительных и отрицательных ускорений приближенно равна нулю (если ряд продлить от — оо до + оо, то сумма их точно равна нулю). Темпы роста возрастают до конца первой половины ряда, затем снижаются. Если ряд достаточно длинный, то темпы начинаются со 100 % и завершаются на 100 %.



При логистическом тренде со снижающимися уровнями показатели динамики изменяются в следующем порядке: отрицательные абсолютные изменения по модулю возрастают до середины ряда и снижаются к концу, стремясь к нулю при t —> со. Ускорения в первой половине периода отрицательные и по модулю возрастающие; во второй половине периода ускорения положительные и уменьшающиеся в пределе до нуля. Темпы изменений все меньше 100 %, в конце первой половины периода наименьшие, во второй половине возрастающие с замедлением до 100 % в пределе. Графическое изображение логистического тренда приведено на рис. 5.2.


Глава 5. МЕТОДЫ РАСПОЗНАВАНИЯ ТИПА ТРЕНДА И ОЦЕНКИ ЕГО ПАРАМЕТРОВ

При изучении методов распознавания типа тренда не следует забывать о существе изучаемого процесса, который отображается временным рядом. Как правило, тип тренда должен соответствовать характерным особенностям процесса. В гл. 4 для каждого типа тренда приведены примеры выражаемых этим типом процессов. Определяя другие процессы по временным рядам, полезно по указанным примерам подобрать подходящие типы тренда. Если, например, изучается динамика продуктивности коров или валового надоя молока, то эти процессы аналогичны представленной в гл. 4 динамике урожайности, и скорее всего они отобразятся линейным трендом. Если изучается динамика расхода бензина на 100 км пробега автомобиля по мере развития и совершенствования двигателей, то этот процесс аналогичен динамике снижения трудоемкости при освоении технологии производства изделий, и, вероятнее всего, он будет отображаться гиперболическим трен-

Но жизнь, практика всегда гораздо богаче, разнообразнее любых гипотез и теорий: фактические временные ряды, особенно относящиеся к отдельным предприятиям, малоинерционным системам или к ограниченным отрезкам времени, могут и не соответствовать тем аналогам по существу процесса, которые приведены в предыдущей главе. Кроме того, характер тенденции часто маскируется значительной колеблемостью уровней ряда, поэтому требуется специальная методика распознавания типа тренда, наилучшим образом отражающего тенденцию фактического ряда уровней, чему и посвящена эта глава. После определения типа тренда необходимо вычислить оценки его параметров, как правило, по методу наименьших квадратов, а также с использованием специфических приемов для логарифмического или логистического типа тренда.


5.1. Применение графического изображения для распознавания типа тенденции

Графическое изображение во многих случаях позволяет приближенно выявить тип тенденции временного ряда. Но для этого следует соблюдать правила построения графика: точное соблюдение масштаба как по величине уровней ряда, так и по времени. Временные интервалы откладывают по оси абсцисс, величины уровней — по оси ординат. По каждой оси следует установить такой масштаб, чтобы ширина графика была примерно в 1,5 раза больше его высоты. Если уровни ряда на всем протяжении периода много больше нуля и между собой различаются не более чем на 20–30 %, то следует обозначить перерыв на оси ординат, увеличить масштаб так, чтобы меньший из уровней ненамного превышал разрыв оси. Если уровни ряда различаются в десятки, сотни и тысячи раз, ось ординат следует разметить в логарифмическом масштабе, чтобы равные отрезки означали различие уровней в одинаковое число раз. Интерпретация вида графика будет другой: при линейном масштабе график, близкий к прямой линии, означает линейную тенденцию, а при логарифмическом масштабе оси ординат прямая линия показывает экспоненциальную тенденцию.

Необходимо строго соблюдать равенство промежутков времени на равных отрезках оси абсцисс. Логарифмический масштаб по времени не рекомендуется, так как он крайне затруднит интерпретацию графика. Рассмотрим пример графического изображения, представленный на рис. 5.1.



Рис. 5.1. Динамика урожайности зерновых во Франции

—∙— фактические уровни

— тренд


Видно, что линейный тренд хорошо подходит для отражения тенденции динамики урожайности зерновых культур во Франции: прямая проходит как бы посреди колеблющихся точек — уровней лет.

Но не всегда график позволяет выбрать тип линии тренда. Трудно графически отличить параболу от экспоненты, логарифмическую кривую от гиперболы и т. д. Оценка типа тренда по типу графика включает субъективные моменты, что может привести к ошибке. Есть много способов объективной, статистико-математической оценки пригодности того или иного типа линии. Весьма популярен его выбор с помощью перебора на электронных вычислительных машинах (ЭВМ) всех имеющихся в пакете программ статистического анализа типов линий либо по наименьшему среднему квадратическому отклонению, либо по наименьшему модулю отклонений фактических уровней от расчетных по проверяемой линии. Недостатки данной методики заключаются в том, что, во-первых, не все пакеты программ статистического анализа содержат достаточный выбор линий тренда, но главное состоит в том, что, как уже указано в гл. 4, чем больше параметров содержит уравнение тренда, тем меньше и отклонений отдельных уровней от тренда. Парабола II порядка, а тем более III и более высоких порядков всегда при таком подходе «лучше», чем прямая или экспонента.

Но «преимущество» параболы над прямой может быть невелико. Следовательно, нужно применить опять же статистико-математические критерии существенности уменьшения среднего отклонения при переходе от прямой к параболе. Не отрицая допустимости указанной методики с дополнительной проверкой существенности снижения среднего отклонения от тренда, рассмотрим и другие методы выбора типа тренда без вычисления последнего, а также средних отклонений.


5.2. Методика проверки статистических гипотез о типе тренда

Предположим, что предварительная гипотеза о типе тренда выбрана на основе теоретических соображений об изучаемом процессе и на основе графического изображения. Для того чтобы проверить данную гипотезу, необходимо сформулировать ее математически. Так, гипотеза о том, что тренд является прямой линией, означает, что на всем периоде временной ряд в среднем сохраняет постоянную величину абсолютного изменения уровней. Гипотеза о параболе II порядка означает, что на всем периоде (в среднем) имеется постоянная величина ускорения абсолютных изменений. Гипотеза об экспоненциальном тренде подтвердится, если можно будет доказать, что на периоде сохраняется постоянная величина (в среднем) цепного темпа изменений.

Для указанных трех типов линий предлагается следующая методика статистической проверки гипотез, разработанная М.С. Каяйкиной и А.И. Манеллей:

1) чтобы снизить искажающее тренд влияние колебаний, проводится сглаживание ряда уровней, например, по пятилетней скользящей средней;

2) по ряду сглаженных уровней вычисляются цепные абсолютные изменения

Δi = yi+1yi, (для параболы — ускорения, для экспоненты — темпы);

3) ряд разбивается на несколько равных или примерно равных подпериодов, и по каждому вычисляется средняя величина того параметра, постоянство которого подтверждает выдвинутую гипотезу о типе тренда: средний абсолютный прирост — для прямой, среднее ускорение — для параболы, средний темп — для экспоненты;

4) методом дисперсионного анализа при многих средних значениях проверяемого параметра или по t-критерию при двух значениях проверяется существенность различия средних значений параметра в разных подпериодах исходного ряда. Если нельзя отклонить гипотезу о несущественности различий средних величин параметра в разных подпериодах, то принимается гипотеза о соответствующем типе тренда. Если различия средних признаются существенными, гипотеза о данном типе тренда отвергается и выдвигается следующая гипотеза в порядке усложнения: после отклонения прямой линии — об экспоненте; после отклонения экспоненты — о параболе; при отклонении параболы — о других типах линий.

Рассмотрим применение данной методики на примере динамики урожайности зерновых культур во Франции. На основании графика, представленного на рис. 5.1, предложена гипотеза о линейном тренде (табл. 5.1).



Далее проводится дисперсионный анализ различий между средними абсолютными изменениями, результаты которого представлены в табл. 5.2.



Полученное значение F-критерия значительно ниже табличного для значения 0,05, следовательно, различия между средними значениями цепных абсолютных изменений в разных подпериодах не являются существенными; вероятность нулевой гипотезы (о случайном характере этих различий) много больше 0,05, и она не может быть отклонена. Принимается исходная гипотеза о том, что средние значения абсолютных приростов урожайности постоянны, тренд урожайности — прямая линия.

Еще один методический прием определения типа тренда — применение многократного аналитического выравнивания с последующим рассмотрением динамики изменений основного параметра тренда по скользящим интервалам. К этому методу следует обратиться после изучения многократного выравнивания, представленного в разд. 5.5.


5.3. Оценка параметров линейного, параболического и гиперболического трендов

Данные виды трендов объединены в связи с тем, что методика оценки их параметров имеет много общего. Основой этой методики служит метод наименьших квадратов, который дает оценки параметров, отвечающие принципу максимального правдоподобия: сумма квадратов отклонений фактических уровней от тренда (от выровненных по уравнению тренда уровней) должна быть минимальной для данного типа уравнения.

Эта методика близка к методике корреляционно-регрессионного анализа связей — парной регрессии. Однако между ними есть и принципиальные различия", выступающий при расчете уравнения тренда в качестве независимой переменной ряд номеров периодов или моментов времени не является случайной варьирующей переменной X регрессионного анализа.

Ряд значений времени — это жестко упорядоченный ряд величин, и, следовательно, не может быть речи о корреляции между ним и значениями зависимой переменной — варьирующих уровней показателя, изменяющегося во времени. Нередко применяемые в литературе и в программах ЭВМ коэффициенты корреляции со временем или фактических уровней с выровненными (т. е. тоже упорядоченными) уровнями тренда таковыми на самом деле не являются и не могут измерять какой-либо «тесноты связи». Чем длиннее период, охватываемый рядом, тем автоматически становятся больше так называемые коэффициенты корреляции при той же самой скорости роста уровней и той же самой силе колебаний. Таким образом, эти лже-коэффициенты не могут характеризовать соотношение между ролью факторов тенденции и ролью факторов колеблемости.


5.3.1. Уравнение прямой линии тренда

Уравнение имеет вид:

y^i = а + bti,

где y^i — уровень тренда для периода или момента с номером ti;

а — свободный член уравнения, равный среднему уровню тренда для периода (момента) с нулевым номером ti;

Ь — главный параметр линейного тренда — его константа — среднее абсолютное изменение за принятую в ряду единицу времени.

Величина параметров а и Ь определяется по методу наименьших квадратов путем приравнивания частных первых производных функции



После алгебраических преобразований получаем два «нормальных уравнения» метода наименьших квадратов (МНК) для прямой:



Решая эти уравнения с двумя неизвестными по данным фактического временного ряда yi (i = 1 — n), получаем значения а и Ь. Если номера периодов (моментов) времени отсчитываются от начала ряда так, что первый период (момент) обозначен номером t = 1, то свободный член а есть уровень тренда для предыдущего периода (момента), а не первого в ряду, как часто ошибочно полагают. Для первого периода уровень тренда у^1 равен а + Ь, для второго у^2 = а + 2Ь и т. д.

Однако рациональнее начало отсчета времени перенести в середину ряда, т. е. при нечетном n — на период (момент) с номером (n + 1)/2, а при четном числе уровней ряда — на середину между периодом с номером n/2 и (n/2) + 1. В последнем случае все номера периодов ti будут дробными. При нумерации периодов времени точно от середины ряда половина номеров ti будет отрицательными числами (аналогично годам до нашей эры), а половина — положительными, т. е. Σni=1= 0.

В таком случае система нормальных уравнений МНК распадается на два уравнения с одним неизвестным в каждом:



(5.5), (5.6)



К сожалению, многие компьютерные программы не предусматривают такого упрощения, и нумерация периодов (моментов) в них производится с начала ряда, с номера t = 1, причем пользователь об этом не предупреждается. При расчетах без компьютера, конечно, следует применить упрощенный прием. Знаменатель в формуле (5.8) при нумерации периодов от середины ряда вычисляется устно при n < 10 или по формуле:


Приведем расчет линейного тренда по временному ряду (см. рис. 4.1). Динамика численности занятых в народном хозяйстве России с 1990 по 1996 г. представлена в табл. 5.3. В целях экономии места в той же таблице приведены и другие показатели, необходимые для измерения колеблемости, описываемые в гл. 6.



a = = 493,6/7 = 70,5 млн. чел.; b = -45,2/28 = -1,615 млн. чел. в год

Уравнение тренда:

y^i = 70,5–1,615∙ti, ti = 0 в 1993 г.

В среднем численность занятых сокращалась на 1615 тыс. чел. в год. Сумма уровней тренда должна равняться сумме фактических уровней, различие в четвертой значащей цифре связано с округлением значений параметров


5.3.2. Уравнение параболического (II порядка) тренда

Уравнение: y^i = a + b*t + c*t2

Для вычисления параметров а, Ь, с по методу наименьших квадратов три частные производные функции:


приравниваются к нулю, и после преобразований получаем систему трех уравнений с тремя неизвестными:


При переносе начала отсчета периодов (моментов) времени в середину ряда суммы нечетных степеней номеров этих периодов

Σti и Σti3

обращаются в нуль. При этом второе уравнение обращается в уравнение с одним неизвестным, откуда:


Уравнения (5.9) и (5.11) образуют систему двух уравнений с двумя неизвестными:


где, напомним,


Приведем пример расчета параболического тренда по данным рис. 4.2 и табл. 5.4, в которой присутствуют также графы, необходимые для анализа колеблемости, описываемые в гл. 6.




Вычисляем параметры параболы

b = 1054/42 ~= 25,1;

8а + 42с = 2684,

42а + 388,5с = 14492;


а + 5,25с = 335,5,

a + 9,25с = 345,0;


4с = 10,5; с = 2,625,

а = 321,7.

Уравнение тренда:

y^i = 321,7 + 25,1ti + 2,62ti2,

где t = 0,5 в 1992 г.

Интерпретация параметров тренда такова: экспорт Японии в 1988–1995 гг. возрастал в номинальной оценке ускоренно, со средним ускорением: 2*2,625 = 5,25 млрд. дол, в год за год, средний за весь период прирост объема экспорта составил 25,1 млрд. дол. в год, средний уровень экспорта на середину периода был равен 321,7 млрд. дол.

Если бы параболический тренд вычислялся на ЭВМ по программе, предусматривающей нумерацию лет от начала с номера t = 1, то уравнение имело бы вид:

y^i = 261,9 + 1,47ti + 2,62ti2,

где ti = 0 в 1987 г.


5.3.3. Гиперболическое уравнение тренда

Уравнение имеет вид:

y^i = a + b/ti

т. е. отличается от линейного уравнения тем, что вместо ti первой степени включает номера периодов времени (моментов) в минус первой степени:

1/ti

Соответственно нормальные уравнения метода наименьших квадратов получат вид:


Однако при этом нельзя, в отличие от линейного тренда, переносить начало отсчета периодов времени в середину, так как гипербола не имеет постоянного параметра изменения уровней на протяжении всего периода, и все величины 1/ti должны быть положительными.

Рассмотрим расчет гиперболического уравнения тренда (табл. 5.5) по данным рис. 4.4 — динамика расхода условного топлива на производство электроэнергии на электростанциях региона (г. на 1 кВт-ч).



Нормальные уравнения МНК:

7а + 2,593b = 2555,

2,593а + 1,511b = 1041.

Решая систему уравнений, получаем:

a = 301,3; b = 171,9.

Уравнение гиперболического тренда удельного расхода топлива имеет вид:

y^i = 301,3 + (171,9/ti)

где ti = 0 в 1965 г.

Величина удельного расхода 301,3 — это предел, к которому стремится экономия топлива при данной технологии тепловых электростанций региона. Существенного резерва экономии уже нет.


5.4. Оценка параметров экспоненциального, логарифмического и логистического уравнений тренда

Данные типы трендов объединены в одну группу в связи с необходимостью при оценке их параметров прибегать к логарифмированию. При расчете логарифмического уравнения тренда логарифмируют номера периодов (моментов) времени, а при расчете параметров экспоненциального и логистического трендов — сами уровни. Поскольку отрицательные числа не имеют действительных логарифмов, если нужно логарифмировать номера периодов времени, то нельзя переносить начало их отсчета в середину ряда. Если же сами уровни могут принимать отрицательные значения, например, уровни финансового результата от реализации, уровни температуры воздуха или почвы, то необходимо перенести начало отсчета уровней на величину, алгебраически меньшую реального наименьшего уровня. Например, температуру следует выразить не в градусах Цельсия, а в Кельвинах, финансовый результат при наибольшем убытке 83 млн. руб., отсчитывать от -100 млн. руб., чтобы наинизший уровень выразился как 17 млн. руб. По окончании расчета тренда нетрудно восстановить обычные единицы измерения. Так, получив тренд финансового результата при отсчете от -100 млн. руб. как

y^i = 271,028Ii

нужно по нему рассчитать все уровни тренда, а затем прибавить к ним величину -100 млн. руб. Начиная с t = 48, уровни тренда станут положительными числами в обычном смысле:

47 < [ln(100:27):ln 1,028] < 48


5.4.1. Экспоненциальное уравнение тренда

Формула уравнения имеет вид:

y^i = akti

Для нахождения параметров а и к уравнение логарифмируем:

ln y^i = ln a + ti∙ln k

В такой форме, т. е. для логарифмов, уравнение соответствует линейному, следовательно, метод наименьших квадратов дает для логарифмов а и к нормальные уравнения, аналогичные таковым для параметров а и Ь линейного тренда (см. табл. 5.2).


Так как номера периодов времени не логарифмируются, можно перенести начало отсчета в середину ряда и упростить систему:


Приведем пример расчета экспоненциального тренда по данным рис. 4.3 (табл. 5.6).



ln a = 49,77/6 = 8,295; a = 4004;

ln k = 3,12/17,5 = 0,1783; k = 1,195;

Уравнение тренда:

y^i = 4004∙1,195ti

где t = 0,5 в 1980 г.

Итак, население Земли в период с 1950 по 2000 г. возрастало со среднегодовым темпом роста, равным корню десятой степени из среднего темпа за десятилетие, найденного по данным табл. 5.6, т. е. 10√1,195 = 1,01797, или 1,8 % прироста в год. Прогнозировать дальнейшую динамику численности населения по рассчитанному тренду не следует, так как уже в десятилетии 1990–2000 гг. темп стал замедляться, и этот процесс, очевидно, будет продолжаться. По данным Венского Международного института прикладного системного анализа, наиболее вероятный вариант роста населения Земли в XXI в. — постепенное замедление роста до полного его прекращения к 2100 г. при уровне населения 11,5 млрд. чел. Крайними и наименее вероятными вариантами к 2100 г. являются: очень слабо замедляющийся рост до 18 млрд. чел. или переход к снижению числа жителей Земли, начиная примерно с середины XXI в., до 5 млрд. чел.


5.4.2. Логарифмическое уравнение тренда

Особенность этого типа тренда заключается в том, что логарифмировать необходимо номера периодов (моментов) времени: у^ = а + b In t. Следовательно, все номера должны быть положительными числами. Однако это вовсе не означает, что нумерацию следует начинать с числа 1. Дело в том, что величина логарифма быстро возрастает при переходе от единицы к двум: натуральный логарифм единицы равен нулю, а логарифм двух равен 0,693, имеем рост на 0,693; в то же время логарифм четырех равен 1,386, а логарифм пяти равен 1,609, имеем прирост лишь на 0,223 и т. д. Если и уровень изучаемого ряда вначале возрастает втрое быстрее, чем между четвертым и пятым периодом, тогда нумерация от единицы допустима. Если же уменьшение прироста уровней происходит значительно медленнее, нумерацию периодов (моментов) следует начинать не с единицы, а с большего числа.

Покажем методику расчета логарифмического уравнения тренда на примере динамики валового сбора чая в Китае (см. рис. 4.5; табл. 5.7).

Временной ряд прежде всего нужно разделить на несколько частей, например на три части, и в каждой части вычислить средний уровень, тыс. т:

1978–1983 гг. — 331,7;

1984–1989 г. — 482,7;

1990–1994 гг. — 566,0.

Эти усредненные уровни относятся соответственно к середине между 1980 и 1981 гг., к середине между 1986 и 1987 гг. и к 1992 г. Если первую дату обозначить годом номер х, то вторая будет годом номер х + 6, а третья — годом номер х + 11,5. Исходя из уравнения логарифмического тренда имеем уравнения:



а + b∙ln x; = 331,7; (5.18)

а + b∙ln (x + 6) = 482,7; (5.19)

а + b∙ln (x + 11,5) = 566. (5.20)

Вычитая (5.18) из (5.19), имеем:

b∙[ln (х + 6) — ln (x)] =151. (5.21)

Вычитая (2) из (3), имеем:

b∙[ln (x + 11,5) — ln (x + 6)] = 83,3 (5.22)

Делим второй результат на первый:

[ln (х+11,5) — ln (х + 6)]/[ln (х + 6) — ln x] = 83,3/151 = 0,5517.

Это число говорит о степени замедления роста средних уровней между подпериодами ряда. Теперь необходимо подобрать такое значение х, при котором получаем наибольшее приближение к рассчитанному показателю замедления роста уровней.

При х = 2 получим:

[ln (2 + 11,5) — ln (3 + 6)]/[ln (2 + 6) — ln 2] = 0,5323/1,3863 = 0,384.

что слишком мало.

Увеличим х до 6:

[ln (6 + 11,5) — ln (6 + 6)]/[ln (6 + 6) — ln 6] = 0,3773/0,6931 = 0,5922.

все еще ниже наблюдаемой величины. Примем х = 8:

[ln (8 + 11,5) — ln (8 + 6)]/[ln (8 + 6) — ln 8] =0,3314/0,5596 = 0,5922

что уже больше наблюдаемого значения.

При х = 7 имеем:

[ln (7 + 11,5) — ln (7 + 6)]/[ln (7 + 6) — ln 7] = 0,3528/0,6190 = 0,5699 -

немного больше необходимого.

Примем х = 6,5:

[ln (6,5 + 11,5) — ln (5,5 + 6)]/[ln (6,5 + 6) — ln 6,5] = 0,3646/0,6539 = 0,5576.

Можно, принимая дробные значения х, подойти еще ближе к фактическому значению, однако вряд ли целесообразно применять мелкодробные номера периодов времени, да и сам процесс усреднения уровней по подпериодам ряда включает субъективные моменты, поэтому лучше ограничиться приближением х ~ 6,5 лет, следовательно, середина между 1980 и 1981 гг. — это номер 6,5 от начала отсчета номеров лет, тогда 1978 г. — это номер t = 4. Исходя из этого нумеруем все года в табл. 5.7, начиная с t = 4 до t = 20.

Зная величину х = 6,5, подставляем ее в уравнения (5.21) и (5.22), чтобы вычислить по ним величину параметра Ь. Из (5.21):

b∙(ln 12,5 — In 6,5) =151,

откуда Ь = 230,9.

Из уравнения (5.22):

b∙(ln 18 — In 12,5) =83,3,

откуда Ь = 228,4.

Принимаем среднее из двух независимых оценок параметра Ь, равное 229,6. Теперь, подставляя значения х и Ь в уравнения (5.18), (5.19) и (5.20), по лучим три независимые оценки параметра а:

из (5.18): а + 229,6∙ln 6,5 = 331,7; откуда а = -98,1;

из (5.19): а + 229,6∙In 12,5 = 482,7; откуда а = -97,2;

из (5.20): а + 229,6∙In 18 = 566; откуда а = -97,6.

Средняя оценка параметра а равна (-97,6). Итак, уравнение логарифмического тренда имеет вид:

у^i = -97,6 + 229,6∙ln t,

где t = 0 в 1974 г.

По этому уравнению рассчитаны уровни тренда у^i в табл. 5.7. Хотя суммы уровней немного разошлись, кривая, как видно на рис. 4.5, хорошо отражает тенденцию.


5.4.3. Логистическое уравнение тренда

Уравнение имеет наиболее общий вид:


При расчете этого уравнения логарифмируют величину, производную от уровней ряда, но не номера периодов (моментов) времени, эту нумерацию поэтому рациональнее проводить от середины ряда. Особенностью логистического тренда является этап обоснования значений максимального и минимального уровней временного ряда. Это обоснование осуществляется на основе, во-первых, уровней фактического ряда, во-вторых, теоретических, т. е. внешних по отношению к статистике, соображений. относящихся к содержанию изучаемого процесса.

Уравнение логистического тренда, в общем виде, непосредственно логарифмировать невозможно. Преобразуем его в форму


и обозначим его левую часть, т. е.


Условие метода наименьших квадратов:


подставляя значение In ; имеем:


После вычисления частных производных по а0 и по a1, получаем нормальные уравнения МНК для логистической кривой, аналогичные таковым для прямой линии, так как заменой на ζ, фактически проведена линеаризация функции логистической кривой:


При переносе начала отсчета периодов (моментов) времени в середину ряда система упрощается до двух уравнений с одним неизвестным в каждом из них:


Итак, алгоритм расчета логистической кривой состоит из десяти этапов:

1) обоснование величин уmах, уmin

2) вычисление по фактическому временному ряду значений


3) вычисление ln ζi;

4) нумерация периодов или моментов времени от середины ряда;

5) умножение ln ζi на ti;

6) подсчет итоговых сумм



7) вычисление

8) вычисление

9) вычисление для всех периодов

а0 и а1

ln ζi = а1 + aiti;

ζi = exp (а1 + aiti)

10) вычисление уровней тренда


Проведем расчет логистического тренда по данным рис. 5.2.



Рис. 5.2. Логистическая тенденция динамики доли тепловозной и электровозной тяги в грузообороте железных дорог СССР


Период охватывает почти весь процесс замены паровозов тепловозами и электровозами. Наиболее быстро этот процесс происходил с 1960 по 1964 г.

Исходя из границ периода времени и фактических уровней ряда получаем:

y^min = 10 %; y^max = 100 %;

a0 = -0,228/14 = — 0,016286; a1 = -99,325/227,5 = -0,436593

ζi = exp [-0,016286 + ti(-0,436593)]

Уравнение логистического тренда доли прогрессивных видов тяги в грузообороте железных дорог за 1955–1968 гг. имеет вид:


Табл. 5.8 показывает достаточно близкое приближение логистической кривой, судя по тому, что сумма уровней тренда различается от суммы фактических уровней менее чем на 1 %. Напомним, что, в отличие от прямой и параболы, алгоритм расчета других кривых не предусматривает автоматического равенства сумм выравненных и фактических уровней, они совпадают только при идеальном выражении тенденции ряда данным уравнением тренда.


5.5. Многократное скользящее выравнивание

Как видно из табл. 5.3–5.5, при расчете параметров тренда разные уровни имеют неодинаковые веса, так как умножаются на разные величины ti.


Наибольшие веса имеют уровни, стоящие в начале и конце временного ряда, что особенно явно видно при нумерации лет от середины ряда. То же самое происходит и при нумерации периодов (моментов) от начала ряда, так как можно легко доказать, что в этом случае в расчет входят не сами номера лет ti, а их отклонения от среднего номера, т. е. ti, а это то же самое, что и номера периодов от середины ряда.

Ввиду этого если в начале ряда находятся уровни с отрицательными отклонениями от нормы, от тренда (например, неурожайные годы), а в конце ряда располагаются уровни с положительными отклонениями от тренда (высокоурожайные годы), то среднегодовой прирост урожайности в линейном тренде, или ускорение прироста в параболе, будет завышен за счет случайной колеблемости. Если же в начале ряда будут находиться уровни с положительными отклонениями от тренда, а в конце его — с отрицательными, то параметры трендов будут занижены.

Следующий шаг в освобождении параметров тренда от влияния случайного распределения положительных и отрицательных колебаний уровней на протяжении временного ряда можно сделать, применяя методику многократного скользящего выравнивания [20].

Сущность данного метода довольно проста: чтобы избежать преимущественного влияния уровней, стоящих на концах временного ряда, следует сделать так, чтобы «на концах» побывали все уровни. Для этого следует достаточно длинный временной ряд выравнивать не в один прием, а скользящим способом по более дробным отрезкам. Например, ряд динамики урожайности зерновых культур во Франции (см. табл. 5.1), состоящий из 26 уровней (N = 26), необходимо выравнивать по 15 уровням: сначала — с 1970 по 1984 г., затем — с 1971 по 1985 г. и т. д., скользя по ряду на 1 год, вплоть до последних 15 уровней с 1981 по 1995 г. При этом каждый раз вычисляется среднегодовой прирост, например, Ь линейного тренда, а на концах будут года, то благоприятные для урожая зерновых, то неблагоприятные и по метеорологическим, и по экономическим условиям. Всего получим 12 разных баз выравнивания по 15 лет; обозначив буквой n длину каждой базы, т. е. число уровней, по которым производится расчет параметра, а число таких баз расчета, укладывающихся в ряд длиной N уровней, — буквой l, составим равенство:

n + l = N + 1.

В ряду из 26 уровней уложатся 12 баз по 15 уровней в каждой. Получим 12 значений среднегодового прироста урожайности, часть из них — заниженные, часть — завышенные, часть — неискаженные. Теперь разумно усреднить полученные значения параметра: ведь в средней величине случайные отклонения взаимно погашаются. Получим значение среднегодового прироста, максимально освобожденное от влияния случайного распределения неурожайных или благоприятных лет по длине исходного временного ряда.

Методика многократного скользящего выравнивания имеет, как, впрочем, и всякая иная, свои ограничения.

Во-первых, для ее применения необходимо иметь достаточно длинный временной ряд при наличии в нем единой качественной тенденции. Если для однократного расчета параметра достаточным (минимальным) можно считать ряд из 9-11 уровней, а для достаточной степени взаимопогашения в средней величине следует иметь не менее 6–8 заниженных и завышенных значений параметра, т. е. минимальное значение будет l ~ 6–8, то минимальная длина исходного временного ряда, т. е. N, должна составлять m + 1–1 = (9 + 6–1) — (11 + 8–1), или от 14 до 18 уровней. При более коротких рядах применение многократного скользящего выравнивания нецелесообразно.

Во-вторых, многократное выравнивание следует применять, если колеблемость исходных уровней достаточно существенная, скажем, коэффициент колеблемости (см. о нем в гл. 6) хотя бы не ниже 5 %. При более слабой колеблемости искажения параметра невелики и при однократном выравнивании, поэтому нет необходимости «стрелять из пушки по воробьям», применяя сложную методику многократного выравнивания.

В-третьих, при наличии долгопериодических (циклических) колебаний, чтобы многократное выравнивание не привело к искажению значения параметра тренда, необходимо соблюдать хотя бы одно из двух условий:

1) длина базы выравнивания, т. е. п, должна быть равна или кратна длине цикла;

2) число баз скользящего выравнивания, т. е. 1, должно быть равно длине цикла.

При соблюдении одного из указанных условий или обоих будут перебраны на началах и концах базы выравнивания все фазы цикла в равном количестве, и тогда циклическая колеблемость, равно как и случайная, в основном будет исключена из усредненного значения параметра тренда.

Наконец, следует помнить, что искажающее влияние распределения случайных отключений по длине временного ряда относится только к параметру динамики — среднегодовому (месячному и т. д.) приросту, ускорению и т. д., но не к среднему уровню ряда, не к свободному члену уравнения тренда. В связи с этим не нужно усреднять значения свободного члена по скользящим базам, а в качестве свободного члена для прямой следует взять общую среднюю величину уровней исходного ряда, т. е.


Для параболы, экспоненты и т. д. свободный член определяется расчетом на основе этой же средней величины. Так, для параболы:


Рассмотрим пример многократного скользящего выравнивания по данным табл. 5.1. Тренд, как показано ранее, линейный, но колеблемость существенная. Сделаем 12 скользящих баз расчета среднегодового прироста по 15 уровней в каждой. Вид таблицы для расчета без помощи ЭВМ приведен в приложении 1.



Средний уровень: а = y¯ = 1332,4/26 = 51,25 ц/га.

Среднее среднегодовое изменение (прирост):


Уравнение тренда: y^i = 51,25 + 1,452∙ti, где = 0,5 в 1983 г.

По этому уравнению в приложении 1 вычислены уровни тренда и отклонения от него.

Как видно из табл. 5.9, среднегодовой прирост по скользящим базам расчета сначала несколько возрастает, а затем снижается. Поскольку нет определенного направления тенденции изменения величины bi, можно считать, что их различие — следствие колебаний уровней и небольших колебаний скорости роста урожайности, однако, в пределах единой линейной тенденции. В связи с этим допустимо усреднение значений среднегодового прироста.

Если же в результате многократного скользящего выравнивания обнаружится систематическое и существенное возрастание или убывание среднегодового прироста, это означает, что тенденция на самом деле не линейная, а параболическая, экспоненциальная, гиперболическая или логарифмическая. Таким образом, по результатам многократного выравнивания можно исправить допущенную на предыдущих этапах (если они выполнялись) ошибку в определении типа тренда или в периодизации динамики.

Особенно сложно оценить параметры тренда при несинусоидальных и сезонных колебаниях (см. разд. 6.3). Для каждого типа тренда необходима специальная методика, иначе параметры тренда будут искажены, а значит, и сами колебания преувеличены или наоборот. Такие методики не излагаются, насколько нам известно, ни в каких учебниках или монографиях, их нет и в пакетах статистических программ для ЭВМ. Данное пособие не позволяет по своему объему включить много таких методик, поэтому изложена одна — для линейного тренда в разд. 6.3.

В заключение данной главы на примере последнего тренда покажем, как рассчитать описанные в гл. 3 показатели динамики.

Абсолютное изменение: если тренд линейный, то оно — главный параметр, т. е. Ь или Ь¯ при многократном выравнивании. Если тренд криволинейный, то абсолютное изменение — непостоянная величина. За любой период его можно вычислить, вычитая из текущего выровненного уровня базисный выровненный, т. е. абсолютное изменение равно у^m — y^0.

Абсолютное ускорение: для параболического тренда II порядка оно — главный параметр, но не забывайте, что оно равно 2 с, т. е. удвоенному квадратическому члену (ускорение — вторая производная по времени; вторая производная от ct2 по t будет равна 2 с).

При других типах тренда ускорение за период т можно найти из уравнений:

(у^m — у^m-1) — (у^m-1 — у^m-2) = у^m — 2у^m-1 + у^m-2

Например, ускорение валового сбора чая в КНР в 1980 г. (см. табл. 5.7) составило:

у^80 — 2у^79 + у^78 = 314 — 2∙272 + 221 = -9 тыс. т в год за год (-9 тыс. т/ год2).

Темп роста — основной параметр экспоненциального тренда к. Для всех других типов тренда для вычисления темпа роста за некоторый период т следует разделить у^m на у^0, т. е. на выровненный уровень базисного года. Так, для линейного тренда (см. табл. 5.3) темп изменения числа занятых в народном хозяйстве России в 1996 г. по сравнению с 1990 г. составил:

65,7:75,3 = 0,8725, или 87,25 %.


Глава 6. МЕТОДЫ РАСПОЗНАВАНИЯ ТИПА КОЛЕБАНИЙ И ОЦЕНКИ ПАРАМЕТРОВ КОЛЕБЛЕМОСТИ

В гл. 2 было показано, что временной ряд, как правило, содержит два основных элемента: тенденцию динамики и колеблемость. Эти составляющие в разных реальных временных рядах находятся в неодинаковом соотношении, а в крайних случаях остается один элемент: ряд без колеблемости уровней представляет собой тренд в чистом виде, а ряд без тенденции динамики, но с колебаниями уровней около постоянной средней величины — это стационарный временной ряд. Оба крайних случая крайне редки на практике. Обычно тенденция и колеблемость сочетаются в исходном ряду, и методы статистического анализа, изложенные в гл. 4 и 5, призваны «очистить» тенденцию от колебаний, измерить ее параметры. Колеблемость в этом случае выступала как помеха, «шум», мешающий выделить и интерпретировать «сигнал», т. е. параметры тренда. Нередко в учебной литературе взгляд на колеблемость, как на помеху в изучении тенденции, преобладает или является единственным.

Однако сама колеблемость также представляет собой важный предмет статистического исследования временных рядов. Значение колеблемости многогранно:

1) она позволяет выдвинуть гипотезы о причинах колебаний, о путях влияния на них;

2) на основе параметров колеблемости ее можно прогнозировать или учитывать как фактор ошибки прогноза (гл. 10), т. е. сделать прогноз наиболее надежным и (или) точным;

3) на основе параметров и прогнозов колебаний можно рассчитать резервы, страховой запас, необходимый для преодоления вредных последствий колебания уровней, например валовых сборов зерна.

Колебания уровней временного ряда могут иметь разную форму, разное распределение по времени, разную частоту и амплитуду. В данной главе рассматриваются методы исследования этих свойств колеблемости, их отображения в системе показателей, характеризующих колеблемость тех или иных явлений. Что же касается дальнейшего изучения причин, механизма колебаний, то эта задача выходит за пределы статистического исследования и должна выполняться наукой, изучающей те явления и процессы, динамика которых отражена временным рядом.


6.1. Графическое отображение и основные свойства разных типов колебаний

Так же, как изучение тенденции, исследование колебаний целесообразно начать с графического изображения — обобщающего, целостного впечатления о временном ряде.

Все многообразие встречающихся колебаний во временных рядах можно представить как «смесь» в разных пропорциях трех основных типов:

• пилообразной или маятниковой колеблемости;

• долгопериодических циклов колебаний;

• случайно распределенной во времени колеблемости.

Графическое изображение каждого из этих типов и описание основных свойств каждого типа колеблемости, во-первых, помогают по виду фактического ряда определить, каков преобладающий в нем тип колебаний, во-вторых, помогают экономисту, менеджеру, другому специалисту понять, какие последствия могут иметь колебания для его сферы деятельности и как с этими колебаниями (если нужно) бороться.


6.1.1. Пилообразная колеблемость

Характерной чертой этого типа колеблемости является правильное, регулярное чередование отклонений от тренда вверх и вниз, т. е. положительных по знаку и отрицательных, через одно. Поскольку это похоже на колебание маятника часов вправо-влево, данный тип колеблемости называют также маятниковой колеблемостью. Название же пилообразная происходит от вида графика (рис. 6.1), похожего на зубья пилы (хотя величина зубьев, разумеется, не должна быть, как у хорошей пилы, одинаковой).



Рис. 6.1. Пилообразная колеблемость:

_._ фактические уровни

___ тренд


Свойства пилообразной колеблемости таковы: из-за частой смены знака отклонения от тренда не происходит аккумуляции ни положительных, ни отрицательных отклонений. Следовательно, нет необходимости создавать для их компенсации значительный страховой запас. Регулярность чередования отклонений обеспечивает их надежное прогнозирование: если в данный период отклонение отрицательное, то в периоде 5 вперед оно будет положительным (данный период считать нулевым номером). Число положительных отклонений при достаточно большой длине ряда равно (точнее, стремится к равенству) числу отрицательных отклонений, а общее количество локальных экстремумов (отклонений от тренда, которые либо меньше, либо больше двух соседних по алгебраической величине) равно числу уровней.

Причины пилообразной колеблемости зависят как от внутренних факторов системы, так и от внешних. Внутренние для агротехнической системы причины пилообразной колеблемости урожайности — это колебания содержания питательных веществ в почве. Если по какой-либо внешней причине в данном году получен особо высокий урожай, то он выносит из почвы больше питательных веществ, чем в среднем в ней образуется за счет деятельности микроорганизмов, им вносится с осадками и ветром. Следовательно, в следующем году ввиду более низкого содержания питательных веществ в почве урожай будет ниже нормы (средней, тренда), в результате будет вынесено меньше питательных веществ из почвы, чем в ней образуется за год, а следовательно, следующий урожай (второго от базы выравнивания периода) опять будет выше среднего и т. д. Конечно, рациональная агротехника подавит пилообразные колебания, например, увеличив после высокого урожая внесение в почву удобрений, и компенсирует повышенные этим затраты, сократив (а не повысив, как обычно думают) внесение удобрений после низкого урожая, например, после засухи. В чистом виде пилообразные колебания урожаев не наблюдаются в нашу эпоху, но как составляющая часть колеблемости, особенно на коротких отрезках времени, они существенны.

Распознать наличие пилообразных колебаний как элемента во временном ряду можно, во-первых, по виду графика, во-вторых, подсчетом числа локальных экстремумов в ряду отклонений от тренда: чем это число ближе к числу уровней ряда, тем большую роль играют пилообразные колебания в их общем комплексе. Третий способ распознавания — по знаку и величине коэффициента автокорреляции отклонений от тренда I порядка, т. е. со сдвигом (лагом) на 1 год.

Коэффициент автокорреляции отклонений имеет формулу


Числитель коэффициента — сумма произведений каждого отклонения на следующее, кроме последнего, в ряду отклонений. В этих произведениях первое отклонение и последнее, т. е. U1 и Un, участвуют только по одному разу, а отклонения от U2 до Un-1 — по два раза. Соответственно в знаменателе в сумму квадратов отклонений от Un-1 до Un входят квадраты с единичным весом, а квадраты первого и последнего отклонений U21 и U2n, — с половинным весом.

Чем ближе коэффициент автокорреляции к -1, тем большую роль играет пилообразная составляющая в общей колеблемости изучаемого временного ряда. При коэффициенте, по алгебраической величине превышающем -0,3, можно считать пилообразную составляющую несущественной или отсутствующей вовсе, если длина ряда не больше 20 уровней.


6.1.2. Долгопериодическая циклическая колеблемость

Характерной чертой этого типа колебаний является наличие нескольких (многих) подряд отклонений одного знака, затем сменяющихся примерно таким же количеством отклонений противоположного знака подряд. Затем весь цикл вновь повторяется, причем, как правило, длина всех циклов одинакова или хотя бы примерно равная. Если равенство отдельных циклов существенно нарушается, говорят о квазициклической колеблемости, т. е. как бы циклической.

Свойства циклической колеблемости (рис. 6.2) таковы: отклонения одного и того же знака следуют подряд в течение примерно половины длины цикла. Следовательно, эти отклонения аккумулируются, и для их компенсации (если таковая требуется) нужен большой страховой запас. Например, надой молока от коров находится ниже тренда в течение 6 месяцев года (с октября до марта включительно) в большинстве сельхозпредприятий Ленинградской области и других регионов России. Следовательно, для удовлетворения спроса на молоко в осенне-зимний период нужен запас в форме сухого молока, масла и других хранящихся молочных продуктов.



Рис. 6.2. Циклическая долгопериодическая колеблемость:

_._ фактические уровни

___ тренд


Для прогнозирования циклическая колеблемость благоприятна, особенно если длина цикла строго постоянна. Прогноз на любой будущий период состоит из прогноза тренда и циклического отклонения от него, соответствующего фазе цикла в прогнозируемый период. Например, зная, что солнечная активность имеет 10-11-летнюю периодичность и что предыдущий цикл имел максимум в 1990–1991 гг., можно уверенно прогнозировать следующий максимум на 2000–2001 гг.

Как правило, за цикл наблюдаются два экстремума отклонений от тренда — один максимум и один минимум. Следовательно, за период, состоящий из N уровней, насчитывается экстремумов:

K = 2∙(N/l) (6.2)

где l — длина цикла.

Причиной циклической колеблемости является какая-либо основная сила, влияющая на уровень изучаемого явления. Иначе говоря, есть главный фактор, вызывающий колебания. Сезонные колебания температуры, осадков, а следовательно, и производства, и потребления многих видов продукции зависят от одного фактора — наклона земной оси к плоскости орбиты Земли. Причина циклической колеблемости солнечной активности пока науке не известна.

Распознать циклическую долгопериодическую колеблемость можно по виду графика, подсчетом числа экстремумов в ряду отклонений от тренда и по коэффициенту автокорреляции отклонений I порядка. Если число локальных экстремумов в ряду отклонений мало, то можно предположить наличие циклической колеблемости. Поскольку отклонения одного и того же знака следуют подряд, их произведения являются положительными числами, а отрицательные произведения встречаются лишь дважды за цикл — при пересечении графиком фактического ряда уровней тренда вниз и вверх. Следовательно, коэффициент автокорреляции при долгопериодической колеблемости — величина положительная, стремящаяся к +1 при l —> оо. При наличии фактического коэффициента больше чем +0,3 можно считать, что в общей колеблемости временного ряда есть существенная циклическая составляющая, а при ιalU > 0,7–0,6 циклическая составляющая является главной.

Для нахождения длины цикла, особенно если цикличность не строгая, а «квази», нужно последовательно вычислить коэффициенты автокорреляции отклонений от тренда разных порядков, т. е. с лагом 1, 2, 3 и т. д. периодов времени. Наибольший по абсолютной величине коэффициент автокорреляции отметит длину цикла.


6.1.3. Случайно распределенная во времени колеблемость

Характерной чертой данного типа колебаний является хаотичность последовательности отклонений: после отрицательного отклонения от тренда может следовать снова отрицательное или даже два-три отрицательных отклонений, а может и положительное (два-три). Это как бы мелкие «куски» пилообразной и циклической колеблемости разных длин цикла, перемешанные друг с другом. Иногда случайно распределенную колеблемость и называют «интерференция колебаний» (термин, заимствованный из физики).



Рис. 6.3. Случайно распределенная во времени колеблемость

_._ фактические уровни

___ тренд


Для колеблемости, изображенной на рис. 6.3, характерны два свойства:

• из-за хаотического чередования знаков отклонений от тренда их взаимопогашение наступает только на достаточно длительном периоде, а на коротких отрезках отклонения могут аккумулироваться, например, могут быть три неурожайных года подряд или два-три высокоурожайных. Значит, необходимы довольно значительные резервы, страховые запасы для гарантии от колебаний;

• случайно распределенная во времени колеблемость неблагоприятна для прогнозирования, ибо в любом прогнозируемом периоде может осуществиться с равной вероятностью как положительное, так и отрицательное отклонение от тренда. (Как увидим в гл. 10. прогнозировать можно лишь интервал, в котором с заданной вероятностью может оказаться уровень.)

Причиной случайно распределенных колебаний служит наличие большого комплекса независимых или слабосвязанных между собой факторов, влияющих на уровни изучаемого явления. Так, колебания урожайности зависят от осадков в разные периоды роста культур, от температуры воздуха и почвы, от силы ветра, от развития вредных насекомых, болезнетворных микроорганизмов, от соблюдения агротехники, от качества семян и еще от многих других факторов. Практика статистических исследований колеблемости урожаев показала, что преобладают именно случайно распределенные колебания. Наличие множества примерно равноправных и независимых факторов означает также, что нельзя существенно уменьшить колеблемость, воздействуя только на какой-либо отдельный фактор. Необходимо, если это возможно, регулировать все основные факторы, как, например, и делается в защищенном грунте (теплицах).

Распознать случайно распределенную во времени колеблемость по виду графика труднее, чем два других типа колебаний. Число локальных экстремумов может также колебаться. В среднем, как доказал английский статистик М. Кендэл [10], их число составляет 2/3 (n — 2) при среднем квадратическом отклонении, равном

√[(16n — 29)/90]

Ряд, изображенный на рис. 6.3, имеет 10 локальных экстремумов (точек перегиба ломаной линии) при 2/3(15 — 2) = 8,7 и среднем квадратичном отклонении, равном

√[(16∙15–29)/90] = 1,53

Как видим, фактическое число экстремумов попадает в интервал х¯± σ, т. е. вероятность того, что распределение отклонений от тренда является случайным, довольно велика, следовательно, эта гипотеза не может быть отклонена.

Коэффициент автокорреляции отклонений от тренда при случайно распределенной колеблемости стремится к нулю при n —> оо. Если ряд состоит менее чем из 19–22 уровней, коэффициенты автокорреляции I порядка, не превышающие 0,3 по абсолютной величине, свидетельствуют о преобладании случайной компоненты в общем комплексе колебаний. В случае, изображенном на рис. 6.3, ra1U = -0,025.


6.2. Измерение показателей силы и интенсивности колебаний

Показатели силы и интенсивности колебаний аналогичны по построению, по форме показателям силы и интенсивности вариации признака в пространственной совокупности. По существу они отличаются тем, что показатели вариации вычисляются на основе отклонений от постоянной средней величины, а показатели, характеризующие колеблемость уровней временного ряда, — по отклонениям отдельных уровней от тренда, который можно считать «подвижной средней величиной».


6.2.1. Показатели абсолютной величины (силы) колебаний

Первый показатель — амплитуда (размах) колебаний — разность между наибольшим и наименьшим по абсолютной величине отклонениями от тренда. Например, размах колебаний объема экспорта из Японии за 1988–1995 гг. (см. табл. 5.4) составил: 5 — (-4) =9 млрд. дол. Размах колебаний затрат условного топлива на 1 кВт-ч электроэнергии (см. табл. 5.5) составил: 14 — (-8) = 22 г топлива на 1 кВт-ч.

Размах колебаний урожайности зерновых культур во Франции (см. приложение 1) составил 6,6 — (—7,4) = 14 ц/га. Показатель амплитуды колебаний характеризует лишь крайние пределы, но не среднюю силу колеблемости. Чем длиннее ряд, тем больше вероятность того, что в нем встретится особенно большое отклонение от тренда. Поэтому с увеличением длины изучаемого периода возрастает в среднем и амплитуда колебаний в отличие от всех других показателей колеблемости, которые не зависят от длины ряда.

Вторым показателем колеблемости по абсолютной величине (силе) является среднее по модулю отклонение от тренда, которое мы обозначим как a (t):


Знак t отличает указанный и все последующие показатели от аналогичного среднего по модулю отклонения от постоянной средней величины, меры силы вариации в пространственной совокупности. Средний модуль отклонений измеряется в тех же единицах, что уровни ряда. Например, согласно данным табл. 5.6 среднее по модулю отклонение от тренда численности населения Земли в 1950–2000 гг. может составить примерно 43,3 млн чел. Средний модуль отклонений урожайности зерновых культур от тренда во Франции по данным приложения 1 составил 2,68 ц/га.

Хотя средний модуль отклонений тренда вполне пригоден как обобщающий показатель силы колебаний за изучаемый период, но, как известно, модули имеют и существенные недостатки, в частности, с ними невозможно связать вероятностные законы распределения. Поэтому модули не пригодны для прогнозирования доверительных границ возможных колебаний с заданной вероятностью (см. гл. 10).

Чаще всего в качестве третьего показателя силы колебаний используется среднее квадратическое отклонение уровней ряда от тренда, обозначаемое как σ(t) или S(t).

Если речь идет только об измерении колеблемости во временном ряду и не ставится задача оценки силы колебаний вообще в прогнозе на будущее, тогда следует вычислять и использовать обычное среднее квадратическое отклонение:


Если же речь идет о вычислении оценки генерального показателя колеблемости, а исходный временной ряд рассматривается как выборка из генерального ряда, продолжаемого и в прошлое и в будущее, то следует учитывать потерю степеней свободы колеблемости и применять показатель:


где р — число параметров в уравнении тренда.

Причину учета числа параметров тренда можно проиллюстрировать следующими примерами.

Линейный тренд имеет два параметра — а и Ь. Если из ряда уровней взять только уровни двух любых периодов, то, как известно из геометрии, прямая точно пройдет через две любые точки, мы увидим только тренд и не увидим никаких колебаний. Аналогично, если оставить от ряда три любых уровня, тренд в форме параболы II порядка, имеющий три параметра, точно пройдет через три точки графика, в результате колеблемость останется «за кадром», так как у нее нет ни одной степени свободы. Поэтому, оценивая генеральное среднее квадратическое отклонение уровней от тренда, нужно учесть потерю степеней свободы колебаний на величину, равную количеству параметров уравнения тренда. Именно такая несмещенная оценка генерального параметра может быть распространена на будущие периоды, т. е. она необходима в прогнозировании (см. гл. 10). Среднее квадратическое отклонение, как известно, входит в формулу нормального закона распределения вероятностей, на его основе можно рассчитывать вероятности ошибок прогнозов и их доверительные границы.


6.2.2. Показатели относительной интенсивности колебаний

Показатели относительной интенсивности вариации рассчитываются как отношение ее абсолютных показателей к постоянной средней величине, относительной интенсивности колебаний — как отношение индивидуальных отклонений отдельного периода к уровню тренда за этот же период, а обобщающие показатели — как отношение обобщающих показателей силы колебаний за весь ряд к обобщающему показателю уровней ряда — среднему уровню.

Например, мы хотим оценить интенсивность отклонения урожайности зерновых во Франции от ее тренда в 1976 г. Абсолютное отклонение составило -7,4 ц/га, а уровень тренда (см. приложение 1) = 41,8 ц/га. Интенсивность отклонения (колебания) равна: -7,4: 41,8 =-0,177, или -17,7 %. Это очень серьезный неурожай. В 1995 г. отклонение урожайности зерновых от тренда по абсолютной величине тоже было значительным: -6,2 ц/га. Но в том же году уровень тренда поднялся уже до 69,4 ц/га, поэтому интенсивность отклонения составила: -6,2: 69,4 = — 0,0896, или -8,96 %, что можно считать не сильным, а умеренным неурожаем.

Обобщающим показателем интенсивности колебаний урожайности зерновых культур во Франции служит отношение оценки генерального среднего квадратического отклонения уровней от тренда S(t) к средней величине урожайности за весь период 1970–1995 гг., что, согласно приложению 1, составляет: 3,54 ц/га: 51,25 ц/га = 0,069 ц/га, или 6,9 %.

Напомним, что при криволинейном тренде средний уровень не равен свободному члену уравнения тренда, так же как и при прямолинейном тренде, но при отсчете периодов от начала, а не от середины ряда. В этих случаях делить обобщающий показатель силы колебаний S(t) нужно не на свободный член уравнения, а на средний уровень изучаемого показателя. Например, интенсивность колебаний расхода условного топлива на выработку 1 кВт-ч электроэнергии (см. табл. 5.5) составляет:

√[382/(7–2)]:(2555/7) = 8,74:365 = 0,0239, или 2,39 %.

Колеблемость очень слабая. Аналогично коэффициенту пространственной вариации отношение среднего квадратического отклонения от тренда к среднему уровню временного ряда называют коэффициентом колеблемости, который мы обозначаем, для отличия от коэффициента пространственной вариации, как V(t). Его формула

V(t) = S(t)/y¯(6.6)

— для оценки генеральной величины и прогнозов или

V(t) = σ(t)/y¯(

— для измерения интенсивности колебаний за данный период как изолированный отрезок, без распространения на прошлые и будущие периоды времени.

Величина коэффициента колеблемости также играет важную роль при анализе устойчивости в динамике (см. гл. 8).

В заключение необходимо подчеркнуть, что любая погрешность в определении типа тренда или при расчете его параметров приводит к преувеличению показателей силы и интенсивности колебаний. Так как реальные временные ряды всегда отклоняются от строго линейной, параболической, экспоненциальной или иной любой абстрактно-математической линии, то колеблемость всегда несколько преувеличивается за счет неполного соответствия истинной тенденции динамики какому-либо принятому типу линии тренда. Например, наверняка часть колеблемости численности населения Земли (см. табл. 5.6) на самом деле объясняется тем, что «истинная» тенденция роста населения не являлась за 1950–2000 гг. строго экспоненциальной.


6.3. Особенности измерения сезонных колебаний

Сезонными называют колебания, связанные со сменой времен года и повторяющиеся поэтому ежегодно. Связь может быть непосредственной, как, например, связь сезонной смены температур воздуха с объемом товарооборота разных видов одежды и обуви или мороженого. В других случаях связь колебаний изучаемого показателя с временами года опосредована социальными, юридическими и экономическими факторами, как, например, сезонное увеличение средней заработной платы и среднедушевого дохода в декабре (13-я зарплата, премии по итогам годовой деятельности, распределение доходов к Новому году и Рождеству и т. п.). Таковы же сезонные колебания числа браков, приурочиваемых традицией к тем или иным праздникам.

Непосредственно связанные со сменой температуры колебания имеют характер плавных циклов, без скачкообразных изменений уровней, т. е. так, как меняется в течение года сама температура воздуха. Опосредованные же сезонные колебания могут иметь резкие скачки уровней, несколько максимумов и несколько минимумов за год. Это различие существенно для выбора статистической модели сезонной колеблемости.

Для правильного измерения сезонных колебаний очень важно, чтобы тренд был рассчитан правильно, что, в свою очередь, требует учета сезонных колебаний (см. разд. 5.5).


6.3.1. Плавные синусоидальные колебания при несущественности тренда

Поскольку колебания такого рода связаны с сезонным ходом температуры воздуха, целесообразно рассмотреть колебания самой температуры (табл. 6.1).



Данные табл. 6.1 позволяют сделать ряд важных выводов для методики изучения сезонных колебаний:

1) температура воздуха в одноименные месяцы разных лет неодинакова. Самым холодным является то январь, то февраль, то декабрь; самым теплым бывает июнь, июль или август. Вывод: в уровнях отдельного года отражены не только закономерные сезонные колебания для климата данного города, но и случайные отклонения погоды в отдельные годы от климатической нормы. А значит, случайные колебания будут (были!) присущи и всем экономическим показателям этих лет, связанным с изменением температуры воздуха;

2) средняя температура воздуха за 1995–1997 гг. совпадает со средней за 1988–1997 гг., что означает отсутствие существенной общей тенденции на протяжении 10 лет (более подробные исследования динамики температуры воздуха в Ленинграде (Санкт-Петербурге) за 40 лет показали, что тенденция существует, но слабая: среднегодовой абсолютный прирост температуры составил 0,0255° в год, что на протяжении до 10 лет, конечно, несущественно);

3) по данным одного только года нельзя точно измерить сезонные колебания, так как они будут смешаны со случайными колебаниями. Чтобы измерить сезонные колебания, необходимо усреднить уровни каждого месяца за достаточное число смежных лет, чтобы случайные колебания уровней в основном взаимопогасились. В данном примере усреднены месячные температуры за 10 лет. Часто в учебниках по статистике для экономии места приводят при анализе сезонных колебаний среднемесячные уровни за 2–3 года, что, конечно, совершенно недостаточно для взаимопогашения случайных колебаний, особенностей отдельных лет.

В чем же состоит измерение сезонных колебаний по усредненным за ряд лет данным? Традиционным показателем служат так называемые индексы сезонности, под именем которых понимают отношения уровней каждого месяца к среднемесячному уровню за весь год. Обычно их выражают в процентах. Например, средняя температура июля составляет в Ленинграде (Санкт-Петербурге) 310 % к средней температуре за год. Отрицательные индексы в данном примере неинтерпретируемы, так как температура исчислялась от условного нуля, а не от абсолютного нуля (в шкале Кельвина).

Обобщающим абсолютным показателем силы сезонных колебаний служит среднее квадратическое отклонение средних температур месяцев от среднегодовой температуры:


Эта величина — один из основных показателей климата данной территории. Например, в регионах с так называемым морским климатом, на островах, побережье океанов сезонные колебания температур намного слабее, чем в глубине материков, в регионах с континентальным климатом, где колебания гораздо сильнее. Например, на северо-западе Великобритании σ ~ 3°, а в Узбекистане (г. Бухара) σ ~ 12°.

Относительный показатель интенсивности колебаний для температур в Петербурге непригоден по уже указанной причине, как и для всех рядов, имеющих положительные и отрицательные уровни.

Сезонные колебания можно изобразить графически двумя способами: в прямоугольных и полярных координатах. На рис. 6.4 хорошо видно, что в разные годы продолжительность лета и зимы разная.

Выше 15 °C — дни считаются летними, ниже 0 °C — зимними.

Графическое изображение сезонных колебаний в полярных координатах покажем на примере другого вида колебаний (рис. 6.4).



Рис. 6.4. Колебания месячной температуры воздуха в Санкт-Петербурге за 1995–1997 гг.


6.3.2. Сезонные колебания, не имеющие синусоидальной формы при наличии существенной тенденции

В качестве примера такого вида сезонных колебаний рассмотрим динамику реализации свиней после откорма, имеющую пик в 4-м квартале года (табл. 6.2), и сезонные колебания затрат труда на развивающемся предприятии с двумя пиками в мае-июне и в августе-сентябре (табл. 6.3).



a = 42,67; b = 308/60 = 5,13

Первичный тренд: у^ = 42,67+ 5,13ti, где ti = 0 в 1-м квартале II года.

При наличии сезонных колебаний, не имеющих синусоидального характера, особенно для рядов, имеющих резкий пик в первые или в последние месяцы года, методики расчета параметров тренда, описанные ранее (см. гл. 5), оказываются недостаточно пригодными, особенно если ряд не очень длинный и нельзя применить многократное выравнивание. Рассмотрим, например, ряд квартальных уровней за два года и один квартал, так как необходимо, как уже подчеркивалось в гл. 5, чтобы начало и конец ряда (база выравнивания) приходились на одну и ту же фазу цикла или часть года (квартал, месяц). Далее будем считать, что резкий пик уровней приходится ежегодно на 4-й квартал.

Резко выделяющийся пик уровней приходится на периоды со значениями ti, равными -1 и 3, в среднем положительными. Наоборот, минимальные уровни первых кварталов приходятся на значения ti, равные соответственно -4; 0; 4, в среднем нулевые веса; низкие значения уровней вторых кварталов приходятся на значения ti, равные соответственно -3 и 1, в среднем отрицательные. Значения уровней третьих кварталов также более низкие, чем в среднем за год, приходятся на значения ti, равные -2 и 2, в среднем нулевые. Итак, в целом высокие значения уровней входят в расчет параметра Ь с положительными весами, а остальные, низкие, уровни — с нулевыми или отрицательными весами. Следовательно, параметр Ь (средний годовой прирост) завышается за счет асимметричного расположения пика уровней в году. Не помогло даже соблюдение правила об окончании ряда (базы расчета параметров) на той же фазе (квартале), как и на начало ряда.

Чтобы скорректировать расчет, необходимо «снять» из числителя параметра Ь указанное неравенство, т. е. превышение положительных произведений отклонений от тренда на веса по четырем кварталам над отрицательными произведениями отклонений от тренда по остальным кварталам.

Средний вес пиковых уровней равен 1, следовательно, положительное превышение за счет асимметрии весов равно: (100 + 60) 1 = 160. Нулевые произведения не дают искажений, а отрицательные произведения дают уровни 2 кварталов, их средний вес равен -1, произведение равно: (26 + 38) (—1)= -64. Избыток положительного искажения над отрицательным составил: 160 — 64 = 96. Эту величину следует исключить из числителя при расчете параметра Ь. В результате имеем:

Ькор = (308 — 96)/160 = 3,533.

Итак, корректированное уравнение тренда имеет вид:

y^i корр = 42,67 + 3,53∙ti, t = 0 в 1-м квартале II года.

Таким образом, преувеличение среднего прироста уровней за квартал за счет несимметричного распределения сезонных пиков уровней составляло: 5,13 — 3,53: 3,53 = 0,45, или 45 %. Индекс сезонности для 1 — го квартала I года при первичном тренде составил бы: 20: 22 = 0,909, а при корректированном тренде — 0,690, т. е. величина сезонного снижения уровня составила бы не 9,1 %, а 31 %, т. е. втрое больше. Следовательно, без корректировки тренда вся картина динамики была бы сильно искажена.

К сожалению, еще более сложные методики корректировки для других типов тренда не могут быть здесь изложены, тем более что многие из них еще предстоит разработать и ввести в пакеты статистических программ для ЭВМ.

При длительном временном ряде и расположении пика сезонных колебаний в середине года либо примерно на равном расстоянии от середины года достаточно выполнить многократное скользящее выравнивание. Рассмотрим подробно измерение сезонных колебаний затрат труда на прогрессивно развивающемся сельскохозяйственном предприятии за три года (табл. 6.3).



Примечание. Я — январь, Ф — февраль, М — март, А — апрель, И — июнь. Ил. — июль, Ав. — август, С — сентябрь, О — октябрь, Н — ноябрь, Д — декабрь.


После вычисления тренда и его уровней за все месяцы вычисляются отношения фактических уровней к уровням тренда, т. е. индексы сезонности. Однако в них включены и случайные колебания. Чтобы очистить индексы сезонных колебаний от случайности, нужно их усреднить за несколько (лучше 10 и более) лет. В учебном примере у нас только три года (для января — четыре), что на самом деле недостаточно для отделения сезонных, типичных колебаний от случайных особенностей процесса в разные годы. Вычисляем средние индексы сезонных колебаний:



Сумма индексов составила 12,14 6, хотя средний индекс должен быть равен единице. Следует откорректировать индексы на пропорциональную величину, т. е. от больших отнять больше, от меньших — меньше, примерно на 0,01 от общей величины. Корректированные индексы запишем слева от названий месяцев.

Далее, умножая уровень тренда на корректированные средние индексы, находим уровни с учетом тренда и сезонных колебаний, но, исключая случайные колебания, y^ii¯сезi округлены в табл. 6.3 до целых. То, что 37Σi=1y^ii¯сезi меньше 37Σi=1y^i, не является недостатком расчета: дело в «лишнем» январе, уровень которого с учетом сезонного колебания в среднем за три года ниже тренда на 30, в результате даже с учетом этого остается небольшой избыток 37Σi=1y^ii¯сезi, объясняемый округлением. Избыток на 6 при сумме уровней 2220, разумеется, несуществен.

Далее вычисляем отклонения фактических уровней от y^ii¯сезi, т. е. случайные колебания и их квадраты, с целью вычисления среднего квадратического отклонения уровней затрат труда от «модели», учитывающей тренд и средние сезонные колебания:

S(t)случ = √[393/(37 — 2 -11)] = 4,05 тыс.ч.

В знаменателе стоит число степеней свободы случайной колеблемости: вычитается из числа уровней 37 две степени свободы линейного тренда и 11 степеней свободы месячных колебаний (двенадцатый индекс сезонности — величина несвободная, так как задана их сумма за год, равная 12 целым). Коэффициент случайной колеблемости составил: 4,05: 60 = 0,0675, или 6,75 %. Колеблемость слабая. Силу самих же сезонных колебаний можно оценить по их среднему квадратическому колебанию:


Сезонные колебания за год имели 11 степеней свободы вариации, но в ряду отклонении у y^iy^ x сезi повторяются три раза, так что правильно будет считать всего 33 квадрата сезонных колебаний и делить сумму квадратов на 33, иначе получится нереально большая величина. Вопрос о степенях свободы вариации при сезонных колебаниях требует дальнейшего исследования. Коэффициент сезонной колеблемости V(t)ceз = 31,35/60 = 0,522, или 52,2 %. Сезонная колеблемость сильная.

Графическое изображение сезонных колебаний затрат труда на сельскохозяйственном предприятии построим в полярных координатах (рис. 6.5), т. е. каждый месяц в окружности занимает 30° (360°: 12). Радиус равен 1, а точки откладываются от центра на величину р = сезi



Рис. 6.5. Сезонные колебания затрат труда на сельскохозяйственном предприятии.


При отсутствии сезонности фигура I (см. рис. 6.5) лежала бы точно по окружности.


6.3.3. Представление синусоидальных колебаний в форме тригонометрического уравнения Фурье

Выдающийся французский математик Жан Батист Жозеф Фурье (1768–1830) предложил метод преобразования периодических функций в ряд тригонометрических уравнений, называемых гармониками. Этот метод подходит для аналитического выражения сезонных колебаний, имеющих синусоидальную форму. Исходным рядом для преобразования Фурье лучше всего принять не первичный ряд за несколько лет, а усредненный ряд месячных уровней, в котором исключен тренд и (или) в основном погашены случайные колебания. Рассмотрим сезонные колебания среднего по ферме надоя молока на 1 корову (табл. 6.4).



Тригонометрическое уравнение ряда Фурье для его первой гармоники, которой мы здесь и ограничимся, имеет форму:


Смысл уравнения состоит в том, что без сезонных колебаний все уровни были бы равны среднемесячному, т. е. у¯; колебания же в равной мере разнесены на sin t и cos t. В первом квадранте (т. е. от января до апреля) косинус является положительной величиной и снижается от 1 до 0, синус тоже положителен и возрастает от 0 до 1. Во втором квадранте (апрель — июль) косинус отрицателен и снижается от 0 до -1, синус положителен и снижается от 1 до 0. В третьем квадранте (июль — октябрь) косинус отрицателен, но возрастает от -1 до 0, а синус снижается от 0 до -1. В четвертом квадранте косинус возрастает от 0 до 1 (к декабрю до 0,866), а синус возрастает от -1 до 0 (к декабрю до -0,5). Цикл завершается новым январем. За счет комбинации изменений косинуса и синуса при разных значениях параметров b1 и Ь2 удается отобразить, как показывает табл. 6.4 (графа y^i), любое синусоидальное колебание уровней временного ряда. Имеем: b1 = -484/6 = -80,7; Ь2 = 284/6 = 47,3. Уравнение сезонных колебаний продуктивности коров имеет вид:

y^i = 310 — 80,7∙cos ti + 47,3 sin ti,

где ti = 0° в январе, а месяц = 30° дуги.

Отклонения фактических уровней (но усредненных за ряд лет) от расчетных по ряду Фурье очень малы: максимальное отклонение 7, среднее (по модулю) 3,33, что составляет лишь 1,07 %. Такая точность вполне достаточна для прогнозов и других расчетов. Если же отклонения оказались значительными, следует на основании ряда отклонений повторить расчет, т. е. рассчитать вторую гармонику, и тогда окончательные уровни модели (ряда Фурье) будут представлять собой сумму всех гармоник:


где т — число гармоник;

к — номер гармоники.

Однако если колебания явно не имеют синусоидальной формы, то требуется много гармоник, расчет становится трудоемким и гораздо проще применить метод, описанный в разд. 6.3.2.


6.4. Измерение тренда колеблемости

Неоднократно указывалось на большое значение мониторинга колебаний. Как правило, производство, экономика заинтересованы в уменьшении колеблемости. Чтобы измерить изменение абсолютного показателя силы колебаний S(t), проще всего рассчитать эту величину за последовательные отрезки времени, а затем по полученным значениям S(t)1, S(t)2 и т. д. до S(t)n провести аналитическое выравнивание, т. е. вычислить тренд того или другого типа. Однако для более надежного вычисления меры колеблемости необходимо как минимум 7–9 уровней первичного временного ряда, а для вычисления тренда по этим мерам колеблемости — опять 7–9 таких же частных мер S(t). А для этого первичный ряд должен содержать примерно 8 x 8 = 64 уровня. Такие ряды анализируются нечасто, а значит, пет и условий для расчета тренда мер колеблемости.

Положение отчасти спасает то, что для вычисления тренда колеблемости вовсе необязательно, чтобы за весь изучаемый период существовал единый тренд уровней показателя. Вполне допустимо для расчета тренда колеблемости объединить отрезки времени с разными по типу трендами или с кусочно-линейным трендом. От изменения скорости роста или даже типа роста, или направления тенденции динамики колеблемость зависит мало или совсем не зависит. Но и с учетом этой ее особенности измерить тренд колеблемости по ряду отдельных отрезков времени сложно. При длине первичного ряда в 15–20 уровней получается всего два значения S(t), чего явно не хватает для расчета тренда.

Не вполне корректными с математической точки зрения являются расчет скользящих показателей колеблемости со сдвигом в один период времени и последующее их аналитическое выравнивание. Конечно, скользящие показатели уже зависят друг от друга, но выявить общую тенденцию изменения силы колебаний и приближенно измерить тренд S(t) все же возможно. Покажем применение этого метода на примере временного ряда урожайности зерновых культур во Франции (см. разд. 5.1). В приложении 1 вычислены отклонения уровней от тренда, с которых и начинается измерение тренда среднего квадратического отклонения (табл. 6.5).

Скользящие показатели колеблемости S(t)i будем рассчитывать по 11-летним подпериодам, т. е. первый за 1970–1980 гг., второй ~ за 1971–1981 гг. и т. д. Первая величина S(t) будет относиться к середине подпериода, т. е. 1975 г. и т. д., последняя скользящая средняя за 1985–1995 гг. относится к 1990 г. Итого получаем 16 скользящих значений показателей колеблемости, которые и выравниваем по уравнению прямой.

Тренд среднего квадратического отклонения уровней урожайности от их тренда имеет вид:

S^(t) = 3,42-0,1235 x ti; ti = 0,5 в 1983 г.

Таким образом, имеется тенденция снижения силы колебаний урожайности зерновых культур во Франции за рассмотренный период. Остается проверить надежность расчета среднегодового снижения величины S(t), т. е. сравнить bS(t) со средней ошибкой репрезентативности. Это необходимо для применения полученного тренда силы колебаний в прогнозировании урожайности, т. е. для распространения выборочной оценки на генеральную совокупность периодов времени.

Для указанной цели придется использовать излагаемую только в гл. 7 методику вероятностных оценок параметров.

Средняя ошибка репрезентативности среднегодового изменения — bS(t), т. е.



S¯(t) = 54,65/16 = 3,42; bS(t) = -42,0/340 = -0,1235 ц/га в год.

Здесь в числителе стоит величина среднего квадратического отклонения скользящих значений S(t)i от их трендовых значений S^(t)i (вторая справа графа в табл. 6.5). Имеем:


Критерий Стьюдента[21] равен отношению

bS(t)/mb(S)t = 0,1235/0,0545 = 2,28

Табличное значение критерия Стьюдента при 15 степенях свободы вариации и значимости 0,05 составляет 2,13. Фактическое значение критерия больше табличного, следовательно, можно считать достаточно надежно установленным уменьшение колебаний урожайности зерновых культур во Франции за 1970–1995 гг. (см. также разд. 8.3).


6.5. Автокорреляция отклонений от тренда

Автокорреляция — это корреляция уровней ряда друг с другом либо отклонений от тренда друг с другом, т. е. корреляция внутри одного и того же временного ряда, но с разными сдвигами во времени. Автокорреляция уровней ряда, если она существенна, говорит о наличии тренда, т. е. служит одним из методов обнаружения тренда. В данном разделе рассматривается автокорреляция отклонений от тренда как один из способов исследования колеблемости.

Методика состоит из последовательного вычисления коэффициентов автокорреляции отклонений с разными сдвигами во времени. Коэффициент автокорреляции со сдвигом на один интервал времени был рассмотрен в разд. 6.1. Аналогично строятся и формулы коэффициентов автокорреляции со сдвигом в два, три и т. д. периодов времени. В общем виде коэффициент автокорреляции порядка m, т. е. со сдвигом на m периодов времени, вычисляется по формуле:



Первые (т — 1) отклонений от тренда и последние (т — 1) отклонений участвуют в произведениях (в числителе) по одному разу, остальные — дважды. Соответственно в знаменателе первые (т — 1) квадратов и последние (т — 1) квадратов входят с половинным весом в сравнении со средними отклонениями. Рассмотрим пример расчета коэффициентов автокорреляции отклонений от тренда и их значения (табл. 6.6).



Авторы расчетов дают следующую интерпретацию серий коэффициентов автокорреляции по Северному региону: «смешанный тип динамики колебаний, при котором какая-либо закономерность визуально не просматривается».

Мы считаем полезным добавить, что по Северному региону семь коэффициентов из восьми незначимо отличны от нуля, это говорит об отсутствии каких-либо циклов, о случайном распределении отклонений во времени.

По Центрально-Черноземному региону: «квазипериодические волны — чередование подъемов и спадов колебаний урожайности относительно тренда, различных по продолжительности».

Относительно Поволжского региона: «маятниковая колеблемость, которая характеризуется последовательным чередованием подъемов и спадов колебаний урожайности относительно тренда».

По нашему мнению, можно добавить, что чистой маятниковой колеблемости здесь нет, так как наблюдается и по два отклонения одного знака подряд; есть, видимо, смесь маятниковой и случайно распределенной колеблемости. Строго циклическая колеблемость, например сезонная, в рядах коэффициентов автокорреляции отклонений от трендов проявится как волнообразные изменения значений этих коэффициентов с алгебраическими минимумами при лагах величиной в 0,5; 1,5 и т. д. длины цикла и алгебраическими максимумами при лагах величиной в целое число длительности цикла.


Глава 7. ВЕРОЯТНОСТНАЯ ОЦЕНКА СУЩЕСТВЕННОСТИ ПАРАМЕТРОВ ТРЕНДА И КОЛЕБЛЕМОСТИ

Статистика лишь в виде редкого исключения может вести анализ какого-то процесса от начала до конца. Обычно исходный временной ряд — это лишь выборка во времени, отражающая некоторый этап или просто отрезок развития данного процесса и его показателей. Однако задача исследования может заключаться не только в получении характеристик процесса на ограниченном отрезке времени (показателей выборки), но и в оценке генеральных параметров процесса (показателей гипотетической генеральной совокупности). Например, проведен анализ динамики среднегодовой температуры воздуха в Санкт-Петербурге за последние 40 лет и измерен линейный тренд. Но нас интересует среднегодовой прирост не только как факт, относящийся к 1957–1997 гг., но и как характеристика процесса потепления климата города вообще для распространения ее на будущее, например, на столетие. В этом случае параметры полученного тренда — лишь выборочные оценки генеральных параметров с некоторой вероятной ошибкой.

Наличие случайных колебаний уровней в отдельные периоды или моменты времени вносит неизбежный элемент случайности во все показатели динамики, если их хотят распространить на генеральную совокупность.

Само наличие тренда или его отсутствие на изучаемом отрезке времени может быть доказано лишь с некоторой вероятностью, для чего используются специальные критерии. При изучении случайной колеблемости очень важно определить вероятность крайних, максимальных отклонений от тренда: сильных неурожаев, морозов, наводнений и т. п.

По указанным причинам в данной главе рассматриваются методы вероятностной оценки параметров тренда и колеблемости, которые приводились в предыдущих главах без таковой, но на самом деле обязательно должны сопровождаться указанием степени надежности и доверительным интервалом для оценки генеральной величины показателя.


7.1. Оценка надежности параметров тренда

Вероятностная оценка любого выборочного показателя осуществляется путем сравнения его величины с величиной средней квадратической ошибки (среднего квадратического отклонения выборочных показателей при данном типе и объеме выборки от генерального показателя). Подробнее об этом можно узнать в учебных пособиях, посвященных выборочному методу.

Надежность следует проверять для основного параметра тренда: среднегодового абсолютного изменения при линейном тренде, ускорения при параболе II порядка, коэффициента роста при экспоненте. Свободный член, если он ненадежно отличен от нуля, нужно оцепить с точки зрения экономики, технологии или другой науки по существу процесса, и если такое положение допустимо, то тренд надежен, если надежен его главный параметр. Если же по существу свободный член, т. е. уровень тренда в период, принятый за начало отсчета времени, не может быть равен нулю, то тренд ненадежен, несмотря на надежность главного параметра.

Рассмотрим проверку надежности тренда численности занятых в народном хозяйстве России за 1990–1996 гг. (см. рис. 4.1 и табл. 5.3).

Тренд имеет вид:

у^i = 70,5–1,614ti, млн чел.,

где ti = 0 в 1993 г., среднее квадратическое отклонение уровней от тренда S(t) = 0,2864 млн. чел.

Средняя ошибка репрезентативности выборочного коэффициента линейного тренда определяется по формуле


где S(t) — оценка среднего квадратического отклонения уровней от тренда;

nΣi=1 t2i— рассчитывается при отсчете ti от середины ряда или

nΣi=1(tit‾)2 отсчете ti от начала ряда;

n — число уровней ряда

mb = 0,2864/√28 = 0,0541

Отношение среднегодового изменения к его средней ошибке — это t-критерий Стьюдента:

t = |b/mb| = |-1,614/0,0541 | = 29,8

Величину критерия сравниваем с табличной величиной критерия Стьюдента для 7–2=5 степеней свободы, которая для значимости (вероятности нулевой гипотезы) 0,05 равна 2,57, а для значимости 0,01 она достигает 4,07. Фактическая величина критерия много больше табличных, следовательно, вероятность нулевой гипотезы (о равенстве параметра Ь нулю) чрезвычайно мала. Достоверно известно, что тренд существовал, и что численность работников народного хозяйства снижалась не случайно.

Если исходный ряд достаточно велик и применялось многократное скользящее определение среднего изменения уровней, формула средней ошибки параметра тренда видоизменяется. Рассмотрим актуальную научную задачу: насколько надежно можно установить наличие тренда среднегодовой температуры воздуха, например, по данным ряда температур в Санкт-Петербурге за 1957–1997 гг. (табл. 7.1).



Проведено многократное выравнивание: 21 раз по 21 уровню в каждой базе.

Тренд имеет вид:

у^i = 51,83 + 0,02554ti t = 0 в 1977 г.

Колеблемость характеризуется величиной S(t) = 1,121 градуса.

Величина среднегодового прироста температуры очень мала — сотые доли градуса за год, что вызывает подозрение в его несущественном, ненадежном отличии от нуля. Необходимо проверить вероятность нулевой гипотезы.

Каждое из 21 значения параметра тренда — это одна выборка. Можно для каждой такой выборки определять величину S(t) и ошибки оценки среднегодового изменения, а затем вычислить ошибку среднего значения параметра всей 21 выборки, которая будет в √21 раз меньше. Однако, по нашему мнению, можно упростить расчет ошибки, применив формулу


Здесь l — число баз расчета среднего параметра;

21Σi=1 t2i — сумма квадратов номеров периода при отсчете от середины ряда в 21 уровень.

Имеем:

mb‾ = 1,121/√(21∙707) = 0,00920 градуса

При этом г-критерий Стьюдента равен:

b‾/mb= 0,02554/0,00920 = 2,78

Табличное значение критерия для значимости 0,05 (вероятность нулевой гипотезы) при 41 — 2 = 39 степенях свободы вариации составляет 2,02. Следовательно, вероятность нулевого значения среднегодового прироста температуры менее 0,05, а надежность того, что среднегодовая температура воздуха в городе повышается, больше 0,95. Необходимо, конечно, уточнить причины потепления: не только общее изменение температуры по всему Земному шару, но и рост энергопотребления в самом городе. Для того чтобы установить, происходит ли общее потепление, нужно вести анализ не по городам, а по территориям, не имеющим местных источников возможного потепления, и на большом числе таких территорий.

Для основного параметра параболы II порядка с средняя ошибка репрезентативности выборочной оценки параметра вычисляется по формуле


Под корнем, при условии отсчета номеров периодов (моментов времени) от середины ряда, стоят выражения: средняя величина четвертых степеней ti минус квадрат среднего квадрата ti; по существу это дисперсия, но не линейная, а квадратическая аргумента параболы. Если же отсчет периодов времени идет не от середины ряда, а от начала, то подкоренное выражение принимает вид:


Здесь черта над скобками — знак средних величин. Рассмотрим пример по данным, представленным на рис. 4.2, - динамика экспорта Японии в 1988–1995 гг., имеющая параболический тренд. Его уравнение имеет вид:

y^i = 323,2 + 25,2ti + 2,40ti2.

Проверим, надежно ли отличие от нуля параметра с, половины ускорения. Колеблемость уровней экспорта измеряется величиной

S(t) = √ [67/(8–2)] = 3,66.

Находим необходимые для расчета ошибки параметра величины при измерении периодов от середины ряда при п = 8. Имеем:


Имеем:

mc = 3,66/√(48,56–27,56) = 0,7987 ~ 0,8

Критерий Стьюдента равен отношению

c/mc = 2,4/0,8 = 3,0

Табличное значение критерия при пяти степенях свободы составляет 2,57. Таким образом, отличие ускорения роста экспорта Японии от нуля за 1988–1995 гг. установлено с надежностью, большей, чем 0,95.

Для оценки основного параметра экспоненциального тренда — среднего коэффициента изменения уровней k — целесообразнее всего применить предложенную Е.М. Четыркиным [18, с. 173–174] методику: проверяется отличие от нуля логарифма среднего коэффициента изменения с учетом среднего квадратического отклонения логарифмов фактических уровней от логарифмов уровней тренда. Иначе говоря, методика та же, как для прямой линии, но только не для абсолютных величин, а для их логарифмов.

Формула средней ошибки логарифма коэффициента изменения к имеет вид:


Рассмотрим эту методику на примере экспоненциального роста народонаселения Земли по десятилетиям 1950–2000 гг. (см. рис. 4.3 и табл. 5.6). Тренд имеет вид:

y^i = 4004∙1,195t

В логарифмическом виде

In y^i = 8,295 + 0,1783ti.

Дополнительно вычисляем отклонения логарифмов уровней от логарифмов тренда (табл. 7.2).

Среднее квадратическое отклонение логарифмов:



S(t)lnyi = √[0,000859/(6–2)] = 0,014654

Средняя ошибка логарифма коэффициента изменения:

mlnk = 0,014654/√17,5 = 0,003503

Критерий Стьюдента:

lnk/mlnk = 0,1783/0,003503 = 50,9.

Табличный критерий Стьюдента при четырех степенях свободы и значимости 0,01 равен 4,60. Полученное значение критерия много больше табличного, так что вероятность нулевой гипотезы можно считать равной нулю, а рост населения Земли — достоверным. Понятно, что столь очевидное явление и не требовало проверки, пример приведен для показа методики надежности экспоненциального тренда, а не для проверки самого факта роста населения, как это имело место в примере с ростом среднегодовой температуры.

Для кривых, не имеющих постоянного основного параметра, вышеизложенный метод проверки надежности неприменим. В таких случаях можно, во-первых, проверять сам факт наличия какого-либо тренда путем сравнения средних уровней за первую и за вторую половины периода, во-вторых, с помощью обычной методики проверки надежности различия двух средних величин в теории выборочного метода. Если различие средних уровней в более ранний период и в более поздний период надежно (нулевая гипотеза отвергается), значит, тренд существует. А о форме уравнения тренда судим по тем методикам и показателям, которые изложены в гл. 5.


7.2. Доверительные границы тренда

Если уравнение тренда рассматривается как выборочное, имеющее ошибки репрезентативности своих параметров, то можно рассчитать доверительные границы, внутри которых с заданной, достаточно большой вероятностью, проходит линия тренда в генеральной совокупности. Рассмотрим этот случай на примере простейшего, линейного тренда. Оба его параметра — свободный член а и среднее изменение за единицу времени Ь имеют ошибки репрезентативности выборочных оценок. Свободный член уравнения тренда — это выборочная средняя величина уровней временного ряда, средняя ошибка репрезентативности которой определяется по формуле

ma = S(t)/√n

Средняя ошибка репрезентативности параметра Ь, как упоминалось выше, равна:


Свободный член уравнения линейного тренда и среднее изменение за единицу времени — величины независимые, а следовательно, согласно теореме сложения дисперсий независимых величин, дисперсия их суммы равна сумме дисперсий слагаемых, а среднее квадратическое отклонение (средняя ошибка) — корню квадратному из суммы дисперсий, т. е. из суммы квадратов ошибок m2а и m2Ь. Однако мы рассматриваем ошибку не в статике, а в динамике. Средняя ошибка положения линии тренда за счет ошибки свободного члена — это константа для любой точки линии тренда, а средняя ошибка изменения уровня тренда за счет ошибки параметра Ь — это величина переменная, ибо в разных точках линии тренда его уровень равен а + bti, и ошибка параметра Ь возрастет в ti раз по сравнению с ошибкой в точке, где ti = 1. Следовательно, ошибка линии тренда минимальна в середине базы его расчета — в середине временного ряда. В этой точке, где t = 0, средняя ошибка положения линии тренда равна ошибке его свободного члена, т. е. S (t)/√n, а в любой иной точке тренда его средняя ошибка вычисляется по формуле



— для однократного выравнивания и при ti = 0 в середине ряда. При нумерации периодов времени от начала ряда вместо ti в формулу следует подставить величину (ti — t‾);(tm - t‾)2.

При многократном скользящем определении параметра Ь второе слагаемое подкоренного выражения примет вид:


где n — длина одной базы расчета тренда;

l — число баз.

Рассчитаем среднюю ошибку тренда среднегодовой температуры воздуха в Санкт-Петербурге:


Для середины ряда — 1977 г. — средняя ошибка тренда составила:

1,121∙√(1841) = 0,175°

А для крайних уровней — 1957 г. и 1997 г.-

средняя ошибка тренда составляет:

Таким образом, ошибка тренда возрастает от середины базы его расчета (середина ряда) к его краям, образуя конусообразную зону вероятных значений генерального тренда.

Если эту зону мы хотим определить с достаточно большой вероятностью, то среднюю ошибку следует умножить на величину t-критерия Стьюдента для соответствующей вероятности. Границы доверительной зоны тренда среднегодовой температуры с вероятностью 0,95 изображены на рис. 7.1.

Чем сильнее колеблемость уровней и чем меньше база расчета тренда, тем шире доверительная зона генерального тренда и тем быстрее она расширяется от середины ряда к его концам. Зона для параболического тренда расширяется при этом гораздо сильнее, чем для линейного тренда.



Рис. 7.1. Доверительные границы генерального тренда среднегодовой температуры воздуха в Санкт-Петербурге

____ — средний тренд

____ — границы тренда с вероятностью 0,95


7.3. Вероятностная оценка показателей колеблемости

Для сравнения показателей колеблемости разных временных рядов необходимо использовать известные в математической статистике методы вероятностной оценки среднего квадратического отклонения или коэффициента вариации. Их можно применять для вероятностных оценок среднего квадратического отклонения уровней ряда от тренда и коэффициента колеблемости.

Средняя ошибка репрезентативности выборочной оценки генерального среднего квадратического отклонения от тренда при их нормальном распределении имеет вид [19, с. 499–500]:

mS(t) = S(t)/√2n

где S(t) — среднее квадратическое отклонение уровней от тренда;

n — число уровней.

Критерий Стьюдента — отношение среднего квадратического отклонения уровней от тренда к его средней ошибке — примет вид: S(t): mS(t) = √2n. Так как эту величину, как и табличное значение критерия Стьюдента для вероятностей 0,95 и 0,99, можно свести в одну таблицу, получаем готовую таблицу для оценки надежности отличия генерального среднего квадратического отклонения уровней от нуля (табл. 7.3).



Таким образом, если обнаружена колеблемость уровней ряда, число уровней которого более 5, то можно считать достаточно надежно установленным, что отличие S(t) от нуля не случайно.

Доверительная граница среднего квадратического отклонения уровней от тренда с заданной вероятностью равна

S(t) ± tСтьюдmS(t).

Например, доверительный интервал средней силы колебаний среднегодовой температуры воздуха в Санкт-Петербурге за 1957–1997 гг. с вероятностью 0,95 составил:

1,121 ± 2,03∙1,121/√(2∙41) = 1,121 ± 0,251°.

Доверительный интервал среднего квадратического отклонения урожайности зерновых культур во Франции за 1970–1995 гг. (см. табл. 6.5) с вероятностью 0,99 составляет:

3,54 ± 2,80∙3,54/√(2∙26) = 3,54 ± 1,37 ц/га

Ввиду довольно значительной силы колебаний, доверительный интервал оценки генерального среднего квадратического колебания также довольно широк, Ошибка возрастает прямо пропорционально силе колеблемости и росту надежности оценки, а уменьшается обратно пропорционально корню квадратному из числа уровней ряда.

Средняя ошибка репрезентативности выборочной оценки генерального коэффициента колеблемости имеет вид [20]:


где V(t) — коэффициент колеблемости, %.

Например, коэффициент вариации урожайности зерновых во Франции за 1970–1995 гг. составил 6,9 %. Если рассматривать этот показатель как выборочный для Франции вообще на больший период, то средняя ошибка коэффициента как оценки генерального равна:

[6,9/√(2∙26)]∙√(1 + 2∙0,0692) = 0,96%

С вероятностью 0,95 при 25 степенях свободы вариации доверительные границы генерального коэффициента вариации составят 6,9 % ± 2,06 0,96 %, или от 4,94 до 8,86 %. Таким образом, почти наверняка колеблемость слабее 10 %.

Не менее, а может и более, важной задачей, чем вероятностная оценка генеральных параметров колеблемости, является вероятностная оценка крайних отклонений от тренда, например, сильных неурожаев, экстремальных температур и влажности воздуха, скорости ветра и т. п. Эти экстремальные отклонения определяют производственные риски, а оценка вероятности рисков — одна из главных задач менеджмента в любой отрасли народного хозяйства.

Вероятностная оценка отклонений от тренда возможна в том случае, если известен закон вероятностей их распределения по величине отклонений. Хотя ни в одном реальном временном ряду отклонения не подчиняются абсолютно точно какому-то теоретическому распределению вероятностей, во многих процессах распределение вероятностей отклонения от тренда близко к нормальному закону. В нашем примере распределение отклонений от тренда среднегодовой температуры воздуха в Санкт-Петербурге близко к нормальному (табл. 7.4).



Вероятность попасть в интервал при условии нормального распределения отклонений по их величине Pi — это половина разности интегральных функций нормального распределения:

0,5[F(t1) — F(t2)], где t1, t2 — значения критерия для границ интервала. Для среднего интервала от

t1 = -0,36 до t2 = +0,36

вероятность Р = F(0,36). теоретические частоты fTi есть произведение n∙ Pi, где n = 41.

Итог последней графы — это критерий χ2 (хи-квадрат). Табличное значение критерия для значимости 0,10 равно 4,60 при двух степенях свободы, а фактическое — много ниже табличного. Следовательно, вероятность сходства распределения отклонений температуры от тренда с нормальным много больше, чем 0,1, и гипотеза о нормальном распределении не отвергается.

Другие временные ряды, рассмотренные в данном учебном пособии, слишком коротки для проверки по χ2. В 1976–1980 гг. кафедрой статистики Ленинградского сельскохозяйственного института (ЛСХИ) было проведено по договору с Управлением статистики сельского хозяйства Центрального статистического управления (ЦСУ) СССР изучение колебаний урожайности по многим культурам в областях и краях РСФСР. Среди других был получен вывод о близости распределения отклонений урожайности от трендов по величине отклонений к нормальному закону распределения [19, с. 3–9].

Этот эмпирический вывод подкрепляется теоретическими соображениями: колебания урожайности зависят от очень большого числа сравнительно независимых факторов, каждый из которых не играет определяющей роли. Следовательно, колебания урожайности отвечают условиям «предельной теоремы Ляпунова», которая устанавливает, когда случайная переменная имеет нормальное распределение вероятностей. На этом основании будем считать, что и колебания урожайности зерновых во Франции подчинены нормальному закону. Среднее квадратическое отклонение, согласно данным табл. 6, равно 3,54 ц/га. Находим вероятности рисков, т. е. что отклонение от тренда вниз (неурожай) превышает уровни -5 ц/га; -7 ц/га; -10 ц/га; -12 ц/га (табл. 7.5).

Вероятность Р равна половине разности между единицей и F(t), т. е. применяется односторонний критерий (иногда в литературе приводится готовая таблица вероятностей именно этого критерия). Поясним определение этой вероятности с помощью графика (рис. 7.2), из которого ясно и то, что у нас обозначено как F(t).




Рис. 7.2. Вероятность отрицательного отклонения, большего по величине, чем заданная граница


Таким образом, вероятность небольшого неурожая (отклонения на 5 ц/га или больше) почти равна 8 %, т. е. в среднем может случиться 8 раз за 100 лет, а вот вероятность сильного неурожая во Франции (больше, чем на 10 ц/га вниз от тренда) очень мала — всего 0,002. Таким риском можно пренебречь. Конечно, это относится к стране в целом, а для отдельного фермера и колеблемость урожаев будет гораздо больше, и вероятность риска. Для ее определения нужно анализировать временной ряд урожайности на ферме.

Логически ясно (это видно из графика, рис. 7.2), что точно такова же, как вероятность неурожая больше, чем на 2S(t) от тренда вниз, так и вероятность высокого урожая больше, чем на 2S(t) от тренда вверх. И с таким «сверхурожаем» тоже может быть связан коммерческий риск — риск сильного падения цены на товар.

Если же распределение колебаний по их величине далеко от нормального, а закон распределения вообще неизвестен, приближенную оценку вероятностей риска возникновения больших отклонений от тренда можно получить на основе эмпирических частостей таких отклонений. Для этого, конечно, необходим достаточно длинный временной ряд. Нельзя на основе данных за 5–6 лет предсказывать вероятность отклонения, случающегося в среднем раз в 20–25 лет. Методику эмпирической оценки возможности крупных отклонений покажем на условном примере, приведенном в табл. 7.6.



Средняя ошибка репрезентативности выборочной доли (частости), как известно, равна:


Вычислив средние ошибки всех частостей, умножаем их на 2 и получаем вероятные ошибки приблизительно с вероятностью 0,95 или на 3 и тогда получаем приблизительно с вероятностью 0,995. Так как распределение не является нормальным, лучше для гарантии взять трехкратную среднюю ошибку частости и сделать вывод о возможной частости отклонения от тренда на указанный процент по величине этой частости плюс трехкратная средняя ошибка.

Таким образом, крайне маловероятно, что отклонение вниз от тренда более чем на 20 % встретится чаще, чем 16 раз за 100 рассматриваемых периодов (это могут быть и годы, и месяцы, и другие отрезки времени в исходном ряду). Вероятность отклонения от тренда вверх более чем на 30 %, наверняка, не превысит 0,12, или 12 раз за 100 интервалов времени. Напомним, что расчет этот сделан с большим запасом осторожности ввиду неизвестности закона распределения и не очень большого объема выборки (числа уровней в исходном ряду).

В заключение рассмотрим задачу о сравнении двух значений показателей колеблемости, которая тоже требует вероятностной оценки. Задача связана с мониторингом колебаний; при этом весьма важно следить за тем, чтобы прогресс агротехники приводил к уменьшению величины колебаний хотя бы той же урожайности. Для того чтобы определить, надежно ли изменение величины S(t) в сравнении с прошлым периодом (например, десятилетием), нужно проверить нулевую гипотезу о случайном различии величин S(t)0 — базисного периода и S(t)1— текущего периода. Для решения задачи о различии двух или более дисперсий (т. е. S(t)2) применяется критерий Бартлетта. Он основан на том, что если сравниваемые величины равны, то их арифметическая средняя (взвешенная или простая) равна их геометрической средней, а если величины различаются, то чем больше они различаются, тем больше и различие между арифметической и геометрической средними.

Взвешенная арифметическая средняя дисперсия равна:


где k — число дисперсий;

ni — их веса, число уровней в подпериодах.

Взвешенная геометрическая средняя:


Критерий Бартлетта имеет вид:


его средняя ошибка:


Отношение М/С имеет распределение χ (хи-квадрат) с числом степеней свободы k — 1.

При сравнении двух дисперсий и равном числе уровней в каждом подпериоде (средние будут невзвешенные) формулы упрощаются:


Например, сравним силу колебаний урожайности зерновых культур во Франции (см. гл. 5 и 6) за первые 11 лет (1970–1980 гг.) и за последние 11 лет (1985–1995 гг.):

S(t)70–80 = √[(180,96/(11 — 1)] = 4,254 ц/га;

S(t)80–95 = √[(71,04/(11 — 1)] = 2,665 ц/га;

Соответственно дисперсии равны:

S2(t)70–82 = 18,1; S2(t)85–95 = 7,1;

их арифметическая средняя равна:

S2арифм = 12,6

а их геометрическая средняя:

S2геом = √(18,1–7,1) = 11,34;

M = 2∙ln (12,6/11,34)∙22 = 4,636;

C = 1 + [(1/11) — (1/22)]/3 = 1,015.

М/С = 4,57. Табличное значение критерия % при одной степени свободы и значимости 0,05 составляет 3,84. Фактическое значение 4,57 больше табличного, следовательно, можно считать, что колеблемость в последние 11 лет ниже, чем в первые 11 лет изучавшегося периода, т. е. колеблемость урожайности зерновых во Франции уменьшилась.


Глава 8. МЕТОДЫ ИЗУЧЕНИЯ И ИЗМЕРЕНИЯ УСТОЙЧИВОСТИ УРОВНЕЙ РЯДА И ТРЕНДА

Устойчивость временного ряда — понятие многоплановое. Его следует рассматривать с двух позиций:

• устойчивости уровней временного ряда;

• устойчивости тенденции (тренда).

Вопрос определения понятия устойчивости невозможно решить без статистической теории динамического ряда, разработанной известными статистиками А.М. Обуховым, Н.С. Четвериковым, Альб. Л. Вайнштейном, С. П. Бобровым, Б. С. Ястремским. Согласно этой теории статистический показатель содержит в себе элементы необходимого и случайного. Необходимость проявляется в форме тенденции динамического ряда, случайность — в форме колебаний уровней относительно кривой, выражающей тенденцию. Тенденцией характеризуется процесс эволюции. В явном виде невозможно видеть все причины, порождающие тенденцию (тренд). Полное разделение элементов случайного и необходимого существует только в виде научной абстракции.

Расчленение динамического ряда на составляющие элементы — условный описательный прием. Тем не менее, несмотря на взаимозависимость тенденции и колеблемости, решающим фактором, обусловливающим тенденцию, является целенаправленная деятельность человека, а главной причиной колеблемости — изменение условий жизнедеятельности. Исходя из вышеизложенного можно отметить следующее. Устойчивость не означает обязательное повторение одинакового уровня из года в год; такое понимание устойчивости приравнивало бы ее к застойному состоянию изучаемого явления. Слишком узким и жестким было бы понятие устойчивости ряда — как полное отсутствие в динамическом ряду всяких колебаний, так как полностью устранить влияние случайных факторов на показатель невозможно. Сокращение колебаний уровней ряда — одна из главных задач при повышении устойчивости, но этим она не исчерпывается, необходимо развитие явления. Отсюда и следует, что устойчивость временного ряда — понятие не простое, а многоплановое.

Устойчивость временного ряда — это наличие необходимой тенденции изучаемого статистического показателя с минимальным влиянием на него неблагоприятных условий.

Из этого вытекают основные требования устойчивости:

• минимизация колебаний уровней временного ряда;

• наличие определенной, необходимой для общества тенденции изменения.

Устойчивость временного ряда можно оценивать на различных явлениях. При

этом в зависимости от явления будут меняться показатели, которые используются в качестве форм выражения существа исследуемого процесса, но содержание понятия устойчивость будет оставаться неизменным.


8.1. Методы измерения устойчивости уровней ряда

Наиболее простым, аналогичным размаху вариации при измерении устойчивости уровней временного ряда, является размах колеблемости средних уровней за благоприятные и неблагоприятные, в отношении к изучаемому явлению, периоды времени:

RY^ = УблагУнеблаг (8.1)

Причем к благоприятным периодам времени относятся все периоды с уровнями выше тренда, к неблагоприятным — ниже тренда (однако, например, при изучении динамики производительности труда если это трудоемкость, то все должно быть наоборот).

Отношение средних уровней за благоприятные периоды времени к средним уровням за неблагоприятные Ублаг/Унеблаг также может служить показателем устойчивости уровней. Чем ближе отношение к единице, тем меньше колеблемость и соответственно выше устойчивость. Назовем это отношение индексом устойчивости уровней динамических рядов и обозначим:

iУ = Ублаг/Унеблаг, или iУ = Уб/Ун (8.2)

— отношение средней уровней выше тренда к средней уровней ниже тренда (при тенденции роста).

Например, по данным табл. 5.7 индекс устойчивости уровней валового сбора чая в Китае за 1978–1994 гг. составил 1,02.

При измерении колеблемости уровней исчисляются обобщающие показатели отклонений уровней от тренда за исследуемый период.

Основными абсолютными показателями являются среднее линейное и среднее квадратическое отклонения (см. гл. 6, формулы 6.4; 6.5):

среднее линейное отклонение


среднее квадратическое отклонение


где yi — фактический уровень;

Уi - выровненный уровень;

n — число уровней;

р — число параметров тренда;

t — номера лет (знак отклонения от тренда).

Эти показатели выражаются в единицах измерения анализируемых уровней и не могут служить для сравнения колебаний различных динамических рядов. Сравнение средних линейных и квадратических отклонений по базам скольжения при многократном аналитическом выравнивании дает информацию о снижении или о повышении устойчивости уровней за период исследования. Аналитическое выравнивание a(t) и Sy(t) и расчет параметров уравнения их трендов позволяют определить количественные характеристики изменения абсолютной колеблемости во времени: среднегодовое изменение, темп изменения. Снижение колеблемости во времени будет равнозначно повышению устойчивости уровней (см. разд. 6.4).

Для характеристики устойчивости (неустойчивости) Д. Бланфорд и С. Оффат рекомендуют следующие показатели [23]:

1. Процентный размах (Percentage Range)


PR оценивает разность между максимальным и минимальным относительными приростами в процентах.

2. Показатель скользящие средние (Moving Average) — МА, который оценивает величину среднего отклонения от уровня скользящих средних:



3. Среднее процентное изменение (Average Percentage Change) — АРС, которое оценивает среднее значение абсолютных величин относительных приростов и квадратов относительных приростов:



Бланфорд и Оффат, анализируя вышеперечисленные коэффициенты, отмечают их хорошую согласованность относительно коэффициента Спирмена.

Относительные показатели колеблемости, чаще всего используемые в статистике, вычисляются делением абсолютных показателей на средний уровень за весь изучаемый период (см. разд. 6.2.2):

коэффициент линейной колеблемости: Vdy(t) = dy(t)/y‾ (8.8)

коэффициент колеблемости: Vy(t) = Sy(t)/y~ (8.9)

где y~ — средний уровень ряда.

Эти показатели отражают величину колеблемости в сравнении со средним уровнем ряда. Они необходимы для сравнения колеблемости двух различных явлений и чаще всего выражаются в процентах. Если Vy(t) — коэффициент колеблемости, то величину

Ку = (100 — Vy(t)) (8.10)

называют коэффициентом, устойчивости. Такое определение коэффициента устойчивости интерпретируется как обеспечение устойчивости уровней ряда относительно тренда лишь в (100 — Vy(t)) случаях. Если Ку составил 0,9, это означает, что среднее колебание составляет 10 % среднего уровня. Однако вероятность того, что отдельное колебание (т. е. отклонение от тренда в отдельном периоде) не превзойдет средней величины колебаний Sy(t), составляет лишь 0,68, если распределение колебаний по их величине близко к нормальному.

Например (см. гл. 6, разд. 6.2.2), коэффициент колеблемости урожайности зерновых культур во Франции за 1970–1995 гг. составил 6,9 %, следовательно, коэффициент устойчивости уровней равен 93,1 %.


8.2. Методы измерения устойчивости тенденции динамики

Наиболее простым показателем устойчивости тенденции временного ряда является коэффициент Спирмена Кр [3, с. 39]:



где d — разность рангов уровней изучаемого ряда (Ру) и рангов номеров периодов или моментов времени в ряду (Pt); n — число таких периодов или моментов.

Для определения коэффициента Спирмена величины уровней изучаемого явления у^ нумеруются в порядке возрастания, а при наличии одинаковых уровней им присваивается определенный ранг, равный частному от деления суммы рангов, приходящихся на эти значения, на число этих равных значений. При наличии дробных рангов необходима поправка к формуле Спирмена:


j — номера связок по порядку (см. нижнюю формулу);

Aj — число одинаковых рангов в j-й связке (число одинаковых уровней).

При малой вероятности совпадения уровней и достаточном их числе эта поправка несущественна.

Коэффициент рангов периодов времени и уровней динамического ряда может принимать значения в пределах от 0 до ±1.

Интерпретация этого коэффициента такова: если каждый уровень ряда исследуемого периода выше, чем предыдущего, то ранги уровней ряда и номера лет совпадают, Кр = +1. Это означает полную устойчивость самого факта роста уровней ряда, непрерывность роста.

Чем ближе Кр к +1, тем ближе рост уровней к непрерывному, выше устойчивость

роста. При Кр = 0 рост совершенно неустойчив. При отрицательных значениях чем ближе Кр к -1, тем устойчивее снижение изучаемого показателя. В рассмотренном ранее ряду динамики урожайности зерновых во Франции за 1970–1995 гг. коэффициент Спирмепа составил 95,62 %.

Коэффициент устойчивости роста (Кр) можно получить и по другой формуле.



Этот вариант расчета несколько сокращает вычисления. Коэффициент Спирмена здесь применен в совершенно новой функции, и его нельзя трактовать как меру связи изучаемого явления со временем. Преимуществом коэффициента корреляции рангов как показателя устойчивости является то, что для его вычисления не требуется аналитическое выравнивание динамического ряда. Это сложная и чреватая ошибками стадия анализа динамики.

Следует иметь в виду, что даже при полной (100 %) устойчивости роста (снижения) в ряду динамики может быть колеблемость уровней, и коэффициент их устойчивости будет ниже 100 %. При слабой колеблемости, но еще более слабой тенденции, напротив, возможен высокий коэффициент устойчивости уровней, но близкий к нулю коэффициент устойчивости изменения.

Например, коэффициент устойчивости уровней урожайности картофеля в России за 1982–1997 гг. составил 0,919, а коэффициент устойчивости (снижения) тренда — только -0,612. Устойчивого тренда нет.

Обычно эти показатели изменяются совместно: большая устойчивость уровней наблюдается при большей устойчивости изменения.

Недостатком коэффициента устойчивости роста Кр является его слабая чувствительность к изменениям скорости роста уровней ряда, он может показать устойчивый рост при незначительно отличающихся от нуля приростах уровней.

В качестве характеристики устойчивости изменения можно применить индекс корреляции:


где Уi — уровни динамического ряда;

у‾ — средний уровень ряда;

у‾i — теоретические уровни ряда.

Индекс корреляции показывает степень сопряженности колебаний исследуемых показателей с совокупностью факторов, изменяющих их во времени. Приближение индекса корреляции к 1 означает большую устойчивость изменения уровней динамического ряда.

Сравнение индексов корреляции по разным показателям возможно лишь при условии равенства числа уровней. Так, с ростом длины периода при том же среднем приросте (by), той же абсолютной (Sy(t) и относительной колеблемости (Vy(t)) он автоматически увеличивается из-за накопления изменений за счет тренда.


8.3. Комплексные показатели (критерии) устойчивости

Сущность комплексных показателей заключается в определении их не через уровни динамического ряда, а через показатели их динамики. Так, М.С. Каяйкиной [9] был предложен один из таких показателей (К). Он определяется как отношение среднего прироста линейного тренда у‾ = а + btj, т. е. параметра Ь к среднему квадратическому отклонению уровней от тренда Sy(t):

K = b/Sy(t) (8.15)

Чем больше величина К, тем менее вероятно, что уровень ряда в следующем периоде будет меньше предыдущего. Например, если считать, как и ранее, что распределение колебаний близко к нормальному, то при К = 1 вероятность того, что отклонение от тренда будет не больше прироста (по модулю), составляет F(l) ~ 0,68. Поскольку отклонения от тренда разных знаков одинаково вероятны, можно сказать, что вероятность того, что уровень следующего года (месяца, дня) будет ниже, чем предыдущего, составит: 0,5 — F(t):2 = 0,5–0,34 = 0,16. Если же показатель К составляет только 0,25, то вероятность снижения уровня следующего периода по сравнению с предыдущим составит: 0,5 — F(0,25) = 0,5–0,1974:2 = 0,4013. При отрицательном Ь вероятность снижения уровня становится больше 0,5: так, если Ь = — 0,4 Sy(t), т. е. К= -0,4, вероятность снижения следующего уровня такова:

0,5 — F(-0,4):2 = 0,5 + F(0,4):2 = 0,5 + 0,3108:2 = 0,6554.

Как видим, при К = -0,4 тенденция снижения уровней еще довольно неустойчива.

Рассмотрим показатели такого же рода для экспоненциального и параболического трендов. Основным параметром, характеризующим динамику по экспоненте, служит средний темп роста (коэффициент роста уровней в разах) к уравнения экспоненты:

у~ = акtk

величина отвлеченная, притом всегда положительная (знакопеременные уровни здесь не рассматриваются).

Недопустимо сопоставлять темпы с абсолютным показателем колеблемости Sy(t), логично сравнить темпы роста уровней по экспоненциальному тренду с темпами изменения колеблемости. Для этого необходимо построить динамический ряд величин S'y(t) хотя бы скользящим способом и выравнивать его тоже по экспоненте, чтобы определить величину среднегодового темпа (в разах) величины колебаний, т. е. показатель KS(t). Так как для одноразового надежного вычисления показателя колеблемости уже необходимо иметь не менее 11–15 уровней, то для получения динамического ряда Sy(t) и его среднегодового темпа изменения необходим динамический ряд исходных уровней значительной длины (не менее 11–15 плюс еще 9-11), т. е. более 20 уровней, а лучше около или более 30. Далеко не всегда можно получить такой длинный ряд достаточно однокачественных уровней с единым трендом.

Сопоставляя темпы роста уровней ряда с темпами изменения колеблемости, получим показатель опережения:

Q = k‾/k‾Sy(t) (8.16)

Если Q > 1, это свидетельствует, что уровни ряда в среднем растут быстрее колебаний (или снижаются медленнее колебаний). В таком случае, как понятно без доказательства, коэффициент колеблемости уровней будет снижаться, а коэффициент устойчивости уровней повышаться. Если наоборот, колебания растут быстрее уровней тренда и коэффициент колеблемости растет, а коэффициент устойчивости уровней снижается. Таким образом, величина Q определяет направление динамики коэффициента устойчивости уровней.

Параболический тренд y~ = a + bti + cti2 имеет два динамических параметра: среднегодовой прирост Ь и половину ускорения прироста с. Величина Ь в параболе не является константой, и для построения показателей комплексной устойчивости W нужно взять среднюю за весь ряд величину Ь. В остальном интерпретация та же, что и для прямой. Второй показатель — половину ускорения с или ускорение прироста 2с — логично сопоставлять уже не с самой величиной колеблемости Sy(t), а с ее среднегодовым приростом bSy(t), полученным по достаточно длинному ряду путем выравнивания показателей Sy(t), скользящих или следующих друг за другом. Имеем показатель

Qc = 2c/bSy(t) (8.17)

Интерпретация показателя Ос такова: если Ос > 1, значит, положительное ускорение (прирост абсолютного прироста уровней) больше, чем прирост среднего квадратического отклонения от тренда. Значит, отношение прироста уровней к среднему отклонению от тренда станет увеличиваться, т. е. показатель К будет возрастать, что свидетельствует о повышении устойчивости динамики тренда. Если Ос < 1, значит, колебания растут сильнее, чем происходит прирост уровней, показатель устойчивости К будет снижаться.

Это общее положение, однако требует конкретизации, так как числитель и знаменатель показателя Ос могут принимать как положительные, так и отрицательные значения. Следовательно, может иметь место восемь возможных сочетаний: четыре — по знакам и два — по величине. Рассмотрим интерпретацию каждого из восьми возможных сочетаний:

1. с > 0; bSy(t) > 0; > bSy(t).

Прирост уровней ряда растет, колебания тоже растут, но медленнее, в результате К увеличивается, т. е. устойчивость тенденции возрастает. Уточним, что при этом не обязательно растут и уровни ряда, так как параметр by может быть и отрицательным, так что часть периода уровни ряда могут снижаться.

2. с > 0; bSy(t) > 0; < bSy(t).

Хотя прирост уровней возрастает (ускоряется), но колеблемость растет еще быстрее, а, значит, показатель устойчивости тенденции К снижается. Это менее благоприятный тип динамики, чем случай 1.

3. с > 0; bSy(t) < 0; > bSy(t).

— очевидная ситуация. Эта комбинация означает, что прирост уровней растет, а колеблемость снижается. Ясно, что при этом показатель устойчивости тенденции К возрастает.

4. с > 0; bSy(t) < 0; < bSy(t).

— нереальная комбинация, третье неравенство противоречит двум первым.

5. с > 0; bSy(t) > 0; > bSy(t).

— также нереальное сочетание по той же причине.

6. с > 0; bSy(t) > 0; < bSy(t).

— очевидная ситуация. Это означает, что прирост уровней снижается, а колебания возрастают. Естественно, показатель устойчивости тенденции уменьшается и за счет знаменателя, устойчивость падает, это самый неблагоприятный тип динамики производства относительно его устойчивости.

7. с < 0; bSy(t) < 0; > bSy(t).

Отсюда следует, что прирост уровней сокращается, но медленнее, чем колеблемость, так как неравенство 2с > bSy(t) понимается по алгебраической величине, а не по модулю, т. е., например, с = -0,05, а > bSy(t) = -0,13, имеем: = -0,1, что больше, чем -0,13. В таком случае показатель устойчивости тенденции К будет возрастать, хотя уровни ряда либо тоже снижаются, либо растут с замедлением, так что для производства это не самый благоприятный тип динамики.

8. с > 0; bSy(t) < 0; < bSy(t).

— также понимается по алгебраической величине.

Прирост уровней снизится быстрее, чем колебания, показатель устойчивости К снижается, тип динамики неблагоприятный, хотя и не столь сильно, как тип 6.

Итак, исключив два нереальных сочетания из восьми, получим при параболическом тренде шесть типов динамики устойчивости, из них типы 1 и 3 благоприятные для производства, 2 и 7 благоприятны в одном отношении, но неблагоприятны в другом, а типы 6 и 8 явно неблагоприятны относительно устойчивости.

Еще раз подчеркнем, что для надежного определения всей предлагаемой системы показателей устойчивости при параболическом тренде необходим достаточно длинный динамический ряд — не менее 20 уровней при едином типе тенденции. При более коротких рядах следует ограничиться показателями, не требующими оценки тенденции динамики колебаний bSy(t).


Глава 9. ИЗУЧЕНИЕ ДИНАМИКИ КОМПЛЕКСА ВЗАИМОСВЯЗАННЫХ ПРИЗНАКОВ

В предыдущих главах рассматривалась динамика одного признака, выраженного тем или иным показателем, но фактически наука и практика всегда имеют дело не с изолированными признаками, а с их системами, жестко связанными функциональной либо корреляционной связью. В данной главе будут последовательно рассмотрены методики анализа таких систем признаков, а также свойства трендов и колеблемости при агрегировании объектов по совокупности, описаны связи, особенно корреляционные, в динамике. Все эти проблемы на порядок сложнее ранее изложенных и ввиду ограниченности объема учебника могут быть изложены только очень кратко. Желающим глубже изучить проблемы анализа и прогнозирования систем взаимосвязанных признаков рекомендуется обратиться к специальной литературе [1, 5, 6, 10, 14, 16, 18, 21].


9.1. Динамика жестко связанной системы признаков (показателей)

Насколько нам известно, в полном объеме динамика жестко связанной системы в нашей литературе впервые описана Л.Н, Кривенковой в диссертации, защищенной при Санкт-Петербургском университете экономики и финансов[22]. Изложение материала начнем с конкретной задачи: необходимо рассмотреть тенденции и колеблемость трех функционально взаимосвязанных признаков: площади посева зерновой культуры, ее урожайность и валовой сбор зерна (табл. 9.1). Если площади в разные годы обозначим как ni урожайность — yi, валовой сбор — bi, то имеем функциональную связь: bi = Пiyi, справедливую для каждого года (ошибки регистрации не принимаем во внимание). Для соблюдения жесткости связи численные значения округлим до целых (табл. 9.1). Тренды площади и урожайности берем линейные.



Тренд площади: П^i = 120 + 5ti, t = 0 в пятом периоде от начала ряда.

Тренд урожайности: У^i = 29 + ti, t = 0 в пятом периоде от начала ряда.

Тренд валового сбора: b^i = 3472,2 + 264,3ti + 4,94ti2, t = 0 в пятом периоде от начала ряда.

Сначала рассмотрим взаимосвязь трендов в случае, когда колеблемость отсутствует. Тогда валовой сбор каждого года является произведением уровней трендов площади и урожайности, которые совпадают с фактическими уровнями площади и урожайности, т. е. имеет место равенство:

b^i = П^iyi = bi, а вектор валового сбора представлен в табл. 9.2.



Как видим, тренд валового сбора при отсутствии колебаний площади и урожайности был бы параболой II порядка с параметрами: B^i = 3480 + 265t +5t2.

(Напомним, что параметр с — это половина ускорения; параметр Ь — средняя по всем периодам величина среднего абсолютного прироста; параметр а — уровень тренда в период с нулевым значением ti).

Уравнение тренда валового сбора с уравнениями трендов площади и урожайности при условии отсутствия колебаний связано так же, как сам показатель валового сбора с показателями площади и урожайности.

Тренд признака-произведения есть произведение трендов признаков-сомножителей. если колеблемость равна нулю:

Ь^ = П^у^ = (120 + 5t)∙(29 + t = 120∙29 + 5t∙29 + 120t + 5tt = 3480 + (145 +120)t + 5t2,

что точно совпадает с ранее полученным по ряду уровней самого валового сбора уравнением его тренда. Полученный результат полностью соответствует логике взаимосвязи показателей и кажется тривиальным. Однако фактический тренд валового сбора по данным табл. 9.1 вовсе не соответствует этой логике, т. е. тренд валового сбора при наличии колеблемости площади и (или) урожайности уже не равен произведению трендов площади и урожайности. Парабола II порядка, вычисленная по данным ряда валового сбора табл. 9.1, имеет вид:

B^i = 3472,2 + 264,3ti + 4,9ti2.

И если в данном примере расхождения параметров невелики, то при более сильной колеблемости они могут оказаться уже значительно большими. Главный результат наших исследований состоит в том, что установлен факт несовпадения тренда произведения с произведением трендов сомножителей.

Следующая наша задача — теоретическое объяснение этого факта. Введем обозначения: Xi и Zi — фактические значения уровней временных рядов признаков-сомножителей; X^i, Z^i — их трендовые значения; y^i — трендовые значения признака-произведения; yi — его фактические уровни. При этом имеется точное равенство: yi = XiZi. Тренды X^i, Z^i полагаем линейными, следовательно, тренд y^i — парабола II порядка. Будем также для упрощения записи вести отсчет номеров периодов времени ti от середины временных рядов. Фактические уровни признаков можно представить как сумму уровня тренда и отклонения от него, обозначаемого соответственно Uxi, Uzi, Uyi, так что

xi = x^i + Uxi; zi = z^i + Uzi; yi = y^i + Uyi.

Так как

yi = xizi, то yi = (x^i + Uxi)∙(z^i + Uzi). (9.1)

Рассмотрим произведение трендов сомножителей:

x^iz^i = (x‾ + bxti)∙(z‾ + bzti) = x‾z‾ + x‾bzti + z‾bxti + bxtibzti = x‾z‾+ (x‾bz + z‾bx)∙ti + bxbzti2 (9.2)

Уравнение (9.2) есть уравнение параболы 11 порядка, в котором свободный член равен произведению средних величин признаков-сомножителей, он же — средняя величина признака-произведения у‾. Второй член — это средний абсолютный прирост признака-произведения за период, а третий член — половина ускорения признака-произведения. Эти результаты не новы, но следует твердо усвоить, что при равномерном росте (изменении) признаков х и z их произведение у изменяется не равномерно, а с ускорением. Если изменения признаков-сомножителей имеют одинаковые знаки, то это ускорение — положительная величина; если изменения признаков имеют разные знаки, ускорение их произведения — отрицательная величина. При наличии более двух сомножителей тренд их произведения будет параболой более высокого порядка со значительно сложным поведением, в данном учебнике подробно не рассматривается.

Упомянем все же, что если оба признака-сомножителя изменяются по параболе II порядка, то тренд их произведения будет уже параболой IV порядка. Если тренды сомножителей — экспоненты, то и тренд их произведения — тоже экспонента, но вот каков ее параметр, об этом часто судят неверно. Многие руководители предприятий полагают, что если число работников будет возрастать на 10 %, а производительность их труда — на 8 % в год, то выпуск продукции будет увеличиваться на 10 + 8 = 18 % или даже на 10∙8 = 80 %) в год! Оба эти ответа неправильны. Тренд произведения будет иметь среднегодовой темп роста, равный произведению темпов сомножителей, т. е. 1,08∙1,10= 1,188, или 118,8 %); следовательно, прирост продукции составит 18,8 %) в год к предыдущему уровню.

Далее рассмотрим свойства тренда признака-произведения при наличии колебаний каждого из признаков-сомножителей, опишем структуру каждого из параметров его параболического тренда

y^i = ay + byti + cyti2,

начиная со среднего абсолютного прироста Ьу который и вычисляется первым из уравнения МНК:



Далее не будем указывать границ суммирования, они всегда проходят по всем уровням ряда (по всем периодам). При этом, так как yi = XiZi, имеем:


Рассмотрим суммы каждого из слагаемых в числителе (9.3):


основание равенства нулю: так как сумма или математическое ожидание произведений величин, математические ожидания (или суммы) каждого из которых равны нулю, тоже равны нулю:


Эти члены разложения (9.3) в общем случае не равны нулю, так как UZiti2, UXiti2, - случайные величины, зависящие от распределения отклонений от тренда по периодам времени.


Этот член произведения (9.3) в общем случае не равен нулю, если имеет место корреляция отклонений от трендов признаков х и z.

Итак, кроме членов, равных аналогичным параметрам произведения трендов сомножителей, средний прирост в тренде произведения Ьу содержит еще три члена, в общем случае не равных нулю. Следовательно, в общем случае by не равен bXbZ, что мы и наблюдаем на примере табл. 9.1.

Рассмотрим далее квадратический параметр тренда признака-произведения, т. е. с. Из расчета по методу наименьших квадратов (см. гл. 6) для параболы II порядка имеем:


Выражение (9.4) во второй скобке не содержит величин признаков и не нуждается в анализе. В первую скобку подставляем значения:


Рассмотрим каждый из 18 членов разложения, используя уже известные из предыдущего анализа равенства.


т. е. равен первому (свободному) члену произведения трендов сомножителей.


Этот член произведения в общем случае не равен нулю при наличии корреляции между отклонениями от тренда.


— в общем случае, как ранее показано, не равны нулю, так как зависят от распределения отклонений от трендов по времени.


В общем случае эти члены не равны нулю при асимметричном распределении отклонений от тренда по длине периода, особенно при ограниченной длине ряда.


в общем случае и этот член не ранен нулю при наличии корреляции между отклонениями.

Суммируя члены разложения 1,4, 10 и 13, получаем:


После деления этого элемента на правую часть формулы (9.4) имеем: bxbz, т. е. точные значения квадратического члена произведения трендов сомножителей.

Но в общем виде из-за наличия дополнительных членов разложения, не равны нулю члены разложения 9, 14, 15, 16, 17 и 18, квадратический член параболы — тренда признака-произведения не равен аналогичному члену произведения трендов сомножителей, что и видим по данным табл. 9.1.

Свободный член тренда признака-произведения вычисляется системно вместе с квадратическим членом, а, значит, расхождение последнего с таковым в произведении трендов сомножителей означает, что и свободные члены расходятся. Следовательно, в общем случае ау = x‾∙z‾, свободный член уравнения параболическоготренда при неравенстве нулю квадратического параметра вообще никогда не равен средней арифметической величине признака:

ау не= y‾ = x‾∙z‾

Итак, на вопрос о причинах отличия параметров тренда признака-произведения от произведения соответствующих параметров трендов сомножителей можно дать ответ: параметры тренда признака-произведения при наличии колебаний уровней признаков-сомножителей относительно их трендов содержат дополнительные случайные члены, зависящие от распределения отклонений признаков-сомножителей от тренда по длине ряда и от наличия корреляции между этими отклонениями.

Можно сказать, что тренд произведения больше зависит от случайностей, чем зависело бы произведение трендов сомножителей. Это положение необходимо учитывать при обсуждении методики прогнозирования системы жестко связанных признаков.

Теперь кратко рассмотрим связи между колебаниями признаков.

Из табл. 9.1 видно, что лишь четыре раза из девяти позиций знак отклонения от тренда валового сбора соответствует знаку произведения отклонений от тренда площади и урожайности. Представляется на первый взгляд, что колебания признаков вообще никак не связаны.

Более точный анализ связи показал, что коэффициенты корреляции между отклонениями от трендов составили:


Следовательно, колебания валового сбора в основном были вызваны колебаниями урожайности, а колебания размеров площади слабо связаны и с колебаниями урожайности, и с колебаниями валового сбора.

Что касается интенсивности и силы колебаний, то имеем следующие показатели:

S(t)n = 7,4 га; V(t)n = 6,2 %; колеблемость площади слабая;

S(t)y = 4,4 ц/га; V(t)y = 15,2 %; колеблемость умеренная;

S(t)b = 633,6 ц; V(t)b = 15,3 %; колеблемость умеренная.

Величина каждого отклонения валового сбора от тренда, ввиду несовпадения тренда последнего с произведением трендов площади и урожайности, не равна сумме произведения отклонения площади па трендовый уровень урожайности плюс произведение отклонения урожайности на трендовую величину площади, как «должно было бы быть». Между отклонениями от тренда нет жесткой функциональной связи: множественный коэффициент детерминации колебаний валового сбора колебаниями площади и урожайности равен лишь 0,566, или 56,6 %. Жесткая связь колебаний была бы только при такой же жесткой связи колебаний площади и урожайности. Но такой связи не может быть на практике, ибо причины колебаний размера посевной площади в основном имеют экономическую или организационно-хозяйственную основу, а па колебания урожайности влияют причины природного характера.

Итак, можно сделать лишь качественные выводы о связи и силе колебаний жестко взаимосвязанных признаков:

1) при существенной и прямой связи колебаний факторов-сомножителей колебания признака-произведения будут в среднем сильнее, чем каждого из сомножителей, а при обратной и существенной связи колебаний сомножителей колеблемость признака-произведения будет в среднем слабее, чем колеблемость сомножителей;

2) при слабой связи между колебаниями сомножителей колебания признака-произведения приблизительно такие же, как колебания сомножителя с наибольшей колеблемостью по величине коэффициента V(t),

3) ввиду случайного распределения колебаний сомножителей во времени для изучения их связи необходимо рассмотреть достаточно длинные ряды, не менее 13–15 уровней в каждом.


9.2. Агрегирование трендов и колебаний по совокупности объектов

9.2.1. Тренды объемных признаков

Рассмотрим проблему соотношения тренда и колеблемости по совокупности объектов (например, тренда и колеблемости валового сбора по району в целом) и соотношения трендов и колебаний того же показателя в каждой единице совокупности (по каждому хозяйству). Иначе говоря, в отличие от мультипликативной системы, представленной в разд. 9.1, рассмотрим аддитивную систему.

Эта проблема в нашей статистической литературе рассматривалась очень кратко для частного случая И. Поповой [13, с. 57–61] ив общем случае В.Н. Афанасьевым [2].

Сначала обсудим проблему агрегирования трендов объемных признаков, например валового сбора. Очевидно, что каждый уровень признака по совокупности хозяйств равен сумме валовых сборов всех единиц этой совокупности:

Xi = Σkj=1xj.

Средний уровень за ряд лет по совокупности — свободный член линейного тренда — равен, следовательно, сумме свободных членов линейных трендов валового сбора по всем единицам совокупности.

Далее покажем, из чего складывается среднегодовой прирост валового сбора по совокупности:


где j — номера единиц совокупности.

Следовательно, средний абсолютный прирост тренда по совокупности в целом равен сумме средних абсолютных приростов по всем единицам совокупности. Таким образом, теорема агрегирования для линейных трендов доказана.

Для параболических трендов средний абсолютный прирост совпадает с таковым для прямой, доказательство уже имеется. Система уравнений МНК для других параметров параболы по совокупности в целом имеет вид:


Подставляя в правые части

Xi = Σkj=1xij.

имеем


Решая эту систему уравнений, получаем:


Вторая скобка не содержит величины признака Хij и в рассмотрении не нуждается. Первая скобка преобразуется в следующее выражение:


что после деления каждого из у слагаемых на вторую скобку дает

Σkj=1Cj.

т. е. квадратический параметр параболы по совокупности в целом равен сумме квадратических параметров по всем единицам совокупности. Свободный член параболического тренда по совокупности А вычисляем после нахождения С по формуле


Таким образом, свободный член параболы по совокупности в целом равен сумме свободных членов уравнений трендов по всем единицам совокупности. Доказана и теорема сложения для параболических трендов. Разумеется, если по части единиц совокупности тренды линейные, а по другим единицам — параболические, то и в этом случае соблюдается правило суммирования трендов. Прямую можно считать частным случаем параболы при пулевом ускорении.

В случае экспоненциальных трендов по каждой единице совокупности тренд по совокупности в целом также является экспонентой, коэффициент роста которой к является не постоянной, а переменной величиной, в каждом периоде равной средней арифметической взвешенной из индивидуальных темпов к у по величине уровней предыдущего периода. С течением времени общий темп роста по совокупности асимптотически приближается к величине темпа роста, являющегося наибольшим из всех индивидуальных темпов, так как уровень признака у единицы совокупности с наибольшим темпом роста со временем становится преобладающим в совокупности, его доля стремится к единице. Разумеется, теорема сложения трендов к экспонентам неприменима. Она заменяется теоремой усреднения трендов, которую здесь излагать не будем.


9.2.2. Тренды качественных признаков

Более сложная проблема — агрегирование трендов качественных признаков, таких, как урожайность, производительность труда, коэффициент рентабельности и т. д. Очевидно, что величина каждого уровня качественного признака по совокупности в целом есть средняя взвешенная арифметическая величина, из значений данного признака по единицам совокупности; весами являются значения объемного признака — знаменателя изучаемого качественного показателя; для урожайности — это площадь посева.

Кратко изложим результат исследования, начиная с простейшего случая: при постоянстве весов, т. е. постоянном распределении площади (весового признака) между единицами совокупности, параметры тренда урожайности по совокупности в целом (для всех парабол, включая прямую линию) есть средние взвешенные на доли единиц совокупности в общей площади параметры из всех трендов по каждой единице:

А = a‾; В = Ь‾. Таким образом, тренд урожайности по совокупности хозяйств есть средняя величина, состоящая из трендов по отдельным хозяйствам. При малой колеблемости долей хозяйств в общей площади культуры по совокупности тренд урожайности в совокупности будет приблизительно равен среднему взвешенному тренду отдельных хозяйств. При существенных изменениях в распределении площадей между хозяйствами с разными трендами общий тренд урожайности по совокупности уже не будет равен среднему из трендов по хозяйствам.

Если бы число единиц совокупности было достаточно большим, а изменения их долей в общем объеме признака-веса были случайными, не связанными или слабо связанными с уровнями урожайности и со скоростями ее изменения в отдельных хозяйствах, то, в силу закона больших чисел, параметры тренда урожайности по совокупности в целом в вероятностном смысле приближались бы к их математическому ожиданию, т. е. к среднему из всех индивидуальных трендов. Насколько реальное изменение площадей в совокупности хозяйств отвечает этим условиям, необходимо конкретно исследовать в каждой отдельной задаче.


9.2.3. Агрегирование показателей колеблемости

Ранее доказано, что каждый фактический уровень объемного признака Xi по совокупности в целом равен сумме уровней этого признака для всех единиц совокупности:

Xi = Σkj=1xji.

Точно так же каждый уровень тренда X^i по совокупности есть сумма уровней трендов по единицам совокупности:

X^i = Σkj=1x^ji.

Тогда и каждое отклонение от тренда по совокупности в целом:

Ui = XiX^i = Σkj=1xjix^ji = Σkj=1uij

Квадрат отклонения в i-м году от тренда по совокупности в целом равен:


сумма квадратов отклонении по совокупности в целом:


Формула (9.5) означает, что сумма квадратов отклонений уровней признака по совокупности от их тренда равна сумме по годам сумм по единицам совокупности квадратов их отклонений от своих трендов плюс удвоенная сумма произведений отклонений за тот же год уровней для разных единиц совокупности от своих трендов. Эта последняя удвоенная сумма парных отклонений по всем (сочетание из к по 2) есть удвоенная сумма ковариаций колебаний по всем возможным парам единиц совокупности. Так как коэффициент каждой парной корреляции колебаний — величина


то


где γ — число степеней свободы (для прямой γ = n — 2, для параболы γ = n — 3).


В свою очередь, Σni=1Ui2 по совокупности в целом можно выразить как γ х S2(t)cов по совокупности в целом. Учитывая это и результат (9.6), можно записать вместо (9.5):


Сократив обе части равенства на число степеней свободы γ, имеем окончательный результат для объемных признаков:


Итак, можно сделать вывод: дисперсия колебаний признака в целом по совокупности с объемом k единиц, равна сумме дисперсий по всем к единицам плюс удвоенная сумма произведений средних квадратических отклонений по всем сочетаниям единиц совокупности Ck2 на парные коэффициенты корреляции колебаний.

Из этого важного вывода вытекает следствие: если бы колебания признака у всех единиц совокупности были независимы друг от друга (все rumup = 0), дисперсия признака по совокупности в целом была бы равна сумме дисперсий признака для всех единиц совокупности.

Например, если в каждом из 20 предприятий района валовой сбор имел бы дисперсию колебаний, равную 9000 ц2, то дисперсия валового сбора по району была бы равна 180000 ц2. В таком случае имели бы: S(t)сов = √180000 = 424,26 ц, в то время, как по каждому предприятию S(t)j = √9000 = 94,87 ц, и их сумма по 20 предприятиям составила бы: 94,87∙20 = 1897,49. Отсутствие связи колебаний у разных единиц совокупности, независимость их распределения во времени более чем вчетверо снизили бы величину колебаний признака по совокупности в целом. К сожалению, в границах не только административного района, но даже и области, края, небольшого государства многие факторы колебаний валового сбора сельскохозяйственных культур являются общими, действующими на всей территории более или менее согласованно. Это означает, что коэффициенты корреляции rumup в преобладающей части — положительные величины. Если предположить, что в среднем общие факторы объясняют половину колебаний, т. е. r‾2 = 0,5, г‾ ~= 0,7, то получим следующий результат по (9.7):

S(t)сов = √(180000 + C220∙94,872) = √(180000 + 190∙94,872) = 1374,8 ц.

Как видим, и эта величина все еще существенно меньше, чем сумма колебаний по 20 единицам. Так как на практике невозможно, чтобы все факторы колеблемости для всех единиц совокупности были только общими, всегда есть и часть специфических факторов колеблемости для отдельных предприятий, то коэффициенты корреляции отклонений от трендов всегда в среднем меньше единицы, а тогда правая часть выражения (9.7) меньше, чем квадрат суммы колебаний. В результате имеем общий закон агрегирования колебаний объемного признака для совокупности хозяйств или любых иных объектов: абсолютная колеблемость объемного признака в совокупности всегда меньше, чем сумма абсолютных мер колеблемости по всем единицам совокупности, и коэффициент колеблемости по совокупности меньше средней величины коэффициентов колеблемости в единицах совокупности:

S(t)сов < Σkj=1S(t)j

V(t)сов < V(t)j.

Если же имеет место обратная корреляция колебаний между единицами совокупности, например, между колебаниями валового сбора в разных регионах большой страны или всего мира, то компенсирующие друг друга колебания могут еще резче снизить общую колеблемость по совокупности и даже свести ее к нулю[23].

Данный закон справедлив и для вторичных признаков, таких, как урожайность. Если бы колебания урожайности у всех единиц совокупности были жестко связаны (т. е. все rumup были равны единице), то колебания урожайности по совокупности были равны средней из показателей S(t)j каждой единицы совокупности. Но так как на разных предприятиях, в хозяйствах есть не только общие для совокупности факторы колеблемости, но и специфические, все rumup < 1, а, значит, колебания средней урожайности по совокупности хозяйств, даже если взять простую среднюю, будут меньше, чем среднее квадратическое отклонение по всем единицам. А если еще среднюю урожайность по совокупности вычислить как взвешенную по площадям, то их колебания, конечно, не строго согласованные по всем единицам совокупности, также будут снижать колеблемость средней урожайности по совокупности.

Знающие векторную алгебру легко усвоят закономерности уменьшения колеблемости при агрегировании объектов, если примут во внимание, что колебания — не скалярная величина, а векторная, направление которой — ее распределение во времени. Векторная сумма, как известно, всегда меньше скалярной суммы векторов, не учитывающей их направленности.


9.3. Корреляция между временными рядами: сущность, ограничения

Предполагается, что читатель знаком с теорией корреляции в пространственных совокупностях и ее показателями, которые здесь используются. Корреляция временных рядов применяется:

• взамен пространственной корреляции, ввиду отсутствия однородной совокупности или данных о таковой. Например, при изучении связи между средним душевым доходом в стране и душевым потреблением картофеля. Совокупность стран явно неоднородна, не везде потребляется картофель, единственная возможность измерить связь — по данным той же страны за ряд лет;

• при изучении взаимодействующих процессов, например при изучении связи между урожайностью и колебаниями солнечной активности. Изучать эту связь по пространственной совокупности вообще невозможно: для всех регионов на Земле показатели солнечной активности одинаковы;

• там, где следует применять пространственную корреляцию. Например, дипломник проходил практику в отдельном колхозе, на предприятии, а не в районе. У него нет данных по совокупности хозяйств о внесении удобрений и об урожайности, он берет данные колхоза за 7-11 лет и по ним измеряет связь урожайности с дозой удобрений, получая, как правило, низкий коэффициент корреляции или даже отрицательный, потому что урожайность разных лет колеблется вовсе не из-за различия доз удобрения, а совсем из-за других причин. Это просто суррогат настоящей пространственной корреляции, к которому прибегать не рекомендуется.

Корреляция между двумя (для простоты возьмем два) признаками означает, что если величина одного из них больше средней по совокупности, то и величина другого в основном тоже больше его средней (прямая связь) или же в основном меньше его средней (обратная связь). Но если оба признака имеют одинаково направленные тренды, то уровни лет после середины периода, как правило, больше средних величин или, при трендах к снижению, оба признака имеют уровни меньше средних. Выходит, что в динамике между любыми признаками, имеющими тенденцию изменения, всегда есть связь: либо прямая (оба тренда в одном направлении), либо обратная (тренды в разных направлениях). Результат абсурдный. В любой развитой стране в 1970–1990 гг. рос уровень производства компьютеров. Одновременно росло число инфицированных ВИЧ-инфекцией и больных СПИД. Но при очень высокой корреляции уровней обоих рядов никакой реальной связи процессов нет. Это один из видов ложной корреляции. Как же отличить ложную корреляцию от истинной? Конечно, прежде всего, как и при изучении связей в пространственной совокупности, нужно обосновать связь по существу, объяснить ее причинный механизм. Эта задача не статистическая, поэтому в данном учебнике не рассматривается. Она решается специалистом в той сфере знаний, которая изучает объект, процесс, — агрономом, инженером, экономистом, социологом, биохимиком, астрономом и т. д. Без причинного обоснования лучше не начинать измерение связи в динамике.

Но даже и после такого обоснования остается открытым вопрос: при наличии одинаково направленных трендов двух причинно-связанных признаков не преувеличится ли теснота связи за счет трендов? Если, например, в стране растет производство и применение минеральных удобрений, растет и урожайность сельскохозяйственных культур, но последняя растет не только по причине увеличения применения удобрений, а также и за счет других факторов — селекции новых сортов, мелиорации, орошения, механизации производства, роста экономической заинтересованности фермеров и др. А при коррелировании уровней урожайности и доз удобрений за 20–25 лет прогресс всех факторов урожайности будет отнесен на дозу удобрений. Получится коэффициент детерминации, превышающий 50 или даже 70 %, и где гарантия, что к истинной корреляции и здесь не примешана ложная? Такой гарантии нет.

Могут возразить: «А разве не может так случиться, что и в пространственной совокупности предприятий, у тех из них, которые вносят большие дозы минеральных удобрений, одновременно и семена лучше, и сельскохозяйственные машины, и кадры более подготовлены, и экономика сильнее?» Да, это возможно, но именно лишь возможно, как возможно и несовпадение факторов, влияющих на урожайность. А параллельная тенденция динамики факторов во времени — это не просто возможность, а в 90 % стран и регионов — достоверный факт. Так что примесь ложной корреляции в пространственных совокупностях намного меньше, чем при коррелировании временных рядов. И, следовательно, если есть возможность изучать, измерять, моделировать связь результативного признака с его факторами не по рядам динамики, а в пространственной совокупности, это обязательно следует делать.

Проблема ложной корреляции почти целиком снимается, если причинная связь обоснована не столько между тенденциями динамики, сколько между колебаниями факторного и результативного признаков. Например, колебания урожайности во влагонедостаточных регионах, например, таких, как Оренбургская область, причинно связаны не с какой-либо тенденцией изменения суммы осадков, а с ее колебаниями в отдельные годы. К тенденции же роста урожайности осадки никакого отношения (причинной связи) не имеют. Снимается ложная корреляция тем, что колебания других факторов, влияющих на урожайность, — экономических, организационных — не связаны или слабо связаны с колебаниями осадков. Тенденции факторов связаны часто, колебания — почти никогда. Поэтому связь между колебаниями одного фактора с результативным показателем (его колебаниями) почти всегда свободна от ложной корреляции, наведенной другими факторами.

В последующих разделах данной главы в основном будут рассматриваться корреляция между колебаниями признаков, а также методики ее измерения и моделирования. Что же касается измерения связи между тенденциями, между самими уровнями временных рядов, включающих тенденцию, а не только колебания, то эта проблема не может считаться решенной. Некоторые указания читатели учебника могут найти в разделе о смешанных прогностических моделях (гл. 10). Излагаемые здесь методики решают только ограниченный класс задач — измерение связи между колебаниями факторного (факторных) признака и колебаниями результативного признака.

Строго говоря, это жесткое ограничение относится и к пространственной корреляции в том смысле, что и в ней измеряется связь вариации результативного признака с вариацией фактора. Например, за счет вариации дозы минеральных удобрений объясняется 38 % вариации урожайности пшеницы между хозяйствами области (r2 = 0,38), а не 38 % уровня урожайности, как иногда неверно считают.


9.4. Методы измерения корреляции между колебаниями признаков

Итак, в предыдущем разделе было установлено, что единственная «чистая» задача об измерении корреляции временных рядов — это измерение связи между колебаниями их уровней. Колебания — это, как правило, случайная составляющая, в отличие от тренда. Если же и колебания не случайны, а строго упорядочены, как, например, сезонные, то и задача о связи таких колебаний не является «чистой», так как содержит риск ложной связи. В связи с этим далее рассматриваются лишь случайно распределенные во времени колебания, например колебания урожайности.

Классический пример, иллюстрирующий отличие корреляции отклонений от тренда и корреляции уровней ряда, — это связь, наблюдавшаяся в 1970–1989 гг. в СССР между урожайностью сельскохозяйственных культур и себестоимостью единицы их продукции. Урожайность большинства культур в подавляющей части регионов в 70–80 % хозяйств имела тенденцию роста, хотя и медленного, а в отдельных хозяйствах — довольно быстрого. Согласно законам экономики, как рыночной, так и плановой, рост урожайности должен приводить к снижению себестоимости единицы продукции. Однако на самом деле в большинстве, если не во всех хозяйствах и регионах, наоборот, себестоимость имела тенденцию роста. Скрытой причиной этого явления была не признаваемая официально инфляция — рост цен на все элементы затрат на производство: сельскохозяйственные машины, энергоносители, удобрения. Рассмотрим пример, представленный в табл. 9.3.

Средние: х‾ =119,92 ~= 120; у‾ = 19,0.

Уравнения трендов:

урожайности: х^ = 119,9 + 3,81t;

себестоимости: у^ = 19,0 + 1,22t, где t = 0 в 1983 г.

Если рассчитывать коэффициент корреляции между уровнями рядов по обычной формуле



то получаем величину -0,055, незначимо отличную от нуля. Параллельность трендов урожайности и себестоимости погасила обратную связь их колебаний, что привело к результату, противоречащему законам экономики.

Рассмотрим теперь другую методику: измерение корреляции между отклонениями уровней от трендов. Подставляя отклонения от трендов в обычную формулу коэффициента корреляции, имеем:



Однако так как средние величины отклонений от линейных и параболических трендов всегда равны нулю, а от других форм тренда близки к нулю, если эти формы трендов правильно выбраны, то

Ux = Uy = 0

и формула приобретает вид:


Соответственно формула коэффициента регрессии также меняется:



Свободный член уравнения регрессии определяем по обычной формуле: а = у‾ — Ьх, т. е. для отклонений от трендов: а = UybUx = 0

Уравнение регрессии имеет вид:

UYi = bUXi (9.10)

Подставляя данные из табл. 9.3, получаем:

rUxUy = -952,7/√(7678∙133,3) = -0,9414; r2 = 88%

Таким образом, колебания себестоимости картофеля в совхозе почти целиком были связаны с колебаниями урожайности, связь обратная, как и требуют законы экономики. И вся она была подавлена тем, что оба тренда имели одно и то же направление по совершенно разным причинам: прогресс агротехники — не причина инфляции и роста цен. Равно как и наоборот: инфляция скорее тормозила прогресс урожайности.

Коэффициент регрессии:

b = -952,7/7678 = -0,124

уравнение регрессии: UYi = -0,124∙UXi. Смысл этого уравнения таков: в среднем отклонение себестоимости от ее тренда в i-м году составляет 0,124 величины отклонения урожайности от своего тренда с обратным знаком. Значения себестоимости, рассчитанные по модели с учетом тренда себестоимости и колебаний урожайности, приведены в последней графе табл. 9.3:

y^(x)i = (19,0 + 1,22ti) + (-0,124UXi).

Как видим, полученные по этой модели уровни себестоимости довольно близки к фактическим.

Другим методом измерения корреляции между временными рядами служит метод корреляции цепных показателей динамики, которые являются константами трендов. Для линейных трендов — это абсолютные цепные изменения. Метод предпочтительно применять для таких рядов, в которых среднее изменение (параметр Ь) существенно меньше, чем среднее колебание S(t), иначе говоря, показатель К значительно меньше единицы.

Логика применения метода заключается в том, что если колеблемость намного больше изменения тренда за единицу времени, то цепные абсолютные изменения, т. е. разности соседних уровней, в основном состоят из колебаний. В связи с этим корреляция абсолютных изменений будет мало отличаться от корреляции отклонений от тренда. Метод имеет и преимущество: не нужно вычислять тренд, ошибка в выборе типа тренда не влияет на конечный результат. Расчет идет непосредственно по исходным временным рядам. По данным табл. 9.3 имеем:

Δx = +5,57 ~= +5,8; Δy = +0,738 ~= +0,74.

В отличие от отклонений от тренда средняя величина цепных абсолютных изменений не равна нулю. В связи с этим для расчета параметров корреляции необходимо пользоваться полными формулами, а не сокращенной формулой (9.8). Соответствующие суммы квадратов и произведения отклонении от средних приростов приведены в табл. 9.4.



Исходя из них имеем:


что почти совпадает с ранее полученной величиной коэффициента корреляции отклонений от трендов.

Если тренды признаков являются экспонентами, то вместо корреляции отклонений от трендов можно применить метод корреляции цепных темпов роста уровней, поскольку именно темпы роста — основной параметр экспоненциальных трендов.

Остаются недостаточно проработанными следующие вопросы: насколько допустима корреляция абсолютных изменений, если тренды имеют другой вид (гиперболический, логистический, логарифмический и т. д.)?; если тренд факторного признака одного типа, а результативного — другого типа? Достаточного практического опыта для убедительного ответа на эти вопросы у авторов нет, они будут благодарны читателям, если кто-то из них предложит свои ответы на эти вопросы. Еще раз, и не последний, авторы подчеркивают, что наука — открытая система, продолжающийся процесс познания, открытия новых «материков» (реже) и «островов» (чаще) в бесконечном океане неведомого.

В заключение напомним, что метод корреляции отклонений от трендов основной, он работает независимо от того, одинаковы типы трендов коррелируемых показателей или нет. Прочие методы — суррогаты, имеющие чаще всего, ограничения по типам трендов.

Эти методы лучше применять только при явном преобладании колеблемости над тенденцией изменения за единицу времени, т. е. при малом показателе К для линейных трендов или малых аналогичных показателях для других типов трендов (см. разд. 8.3).


9.5. Корреляция с учетом лага и циклов

Среди природных и общественных явлений нередко встречаются такие, которые связаны между собой не в одном и том же периоде времени, а с некоторым запозданием — по-английски — lag, откуда пошел термин лаг. Например, капиталовложения в создание машиностроительного, автомобильного завода отразятся в росте объема производства не в том году, когда они произведены, а через два-три и более лет, капиталовложения в строительство крупной гидроэлектростанции — через 6–8 лет. При наличии лага в реальной связи изучаемых явлений измерять корреляцию факторного признака с результативным нужно, конечно, не по одновременным уровням, а с учетом лага. Например, отклонение от тренда капиталовложений скажется на отклонении от тренда выпуска продукции через к лет. Значит, измерять корреляцию нужно через произведения

Методика корреляции с учетом лага делится на два подвида:

А. Случай, когда величина лага известна заранее.

Б. Случай, когда саму величину лага следует определить на основе измерения корреляции.

Вначале рассмотрим случай А. Например, на сельскохозяйственном предприятии принят и длительное время действует следующий севооборот: после трех лет многолетних трав участок занимает пропашная культура: картофель, бобовые, овощи, под которые вносится большая доза органических удобрений, а в следующем году на участке высевают зерновые культуры. Необходимо измерить связь между дозой органических удобрений, внесенных под пропашные культуры, и урожайностью зерновых. В данном случае k = 1 году, расчет корреляции приведен в табл. 9.5.



При этом будем считать, что тренд дозы внесенных органических удобрений отсутствует или несуществен.

Средняя доза удобрений: X = 451:11 = 41 т/га.

Тренд урожайности: y^i = 18,0 + 0,6∙ti; t = 0 в 1992 г.

Коэффициент корреляции с учетом лага в 1 год имеет вид:


Связь колебаний дозы удобрений под предшественник зерновых с колебаниями их урожайности на следующий год оказалась средней силы: за счет этой связи объясняется 35 % всей колеблемости урожайности.

Коэффициент регрессии: Ь(х) = 70,4/305 = 0,2308, т. е. 1 т удобрений под пропашные культуры в среднем давала прибавку урожайности зерновых на следующий год 0,23 ц/га.

Уравнение регрессии имеет вид: UYi+1(x) = 0,2308∙ΔXi, свободного члена это уравнение не имеет, так как средние отклонения от тренда и от средней дозы равны нулю. Рассчитанные по этой формуле значения урожайности, т. е. трендовые значения у^i + UY(X)i+1, даны в последней графе табл. 9.5.

Обратите внимание на особенности сумм произведений и сумм квадратов в формулах коэффициента корреляции и коэффициента регрессии: в сравнении с суммами при корреляции отклонений без лага число слагаемых на единицу меньше: в одной из сумм — от конца, в других — от начала. Если же лаг велик, то число слагаемых сильно сократится, а значит, корреляция станет менее надежной: ведь оценка надежности коэффициентов должна рассчитываться в этом случае не по общему числу членов первичного ряда, а исходя из числа реально участвующих в работе коэффициентов. При лаге в 5 лет это число составит (n — 5), а затем еще надо исключить две степени свободы при парной корреляции. Откуда следует еще один вывод: при коротком исходном ряде (рядах) и большом лаге показатели связи колебаний признаков будут заведомо ненадежны.

Теперь рассмотрим случай Б, когда величина лага заранее неизвестна и должна быть определена с помощью корреляционного анализа. Имея в данном случае дело с недостаточно изученными явлениями, назовем коррелируемые признаки «икс» и «игрек». Если их временные ряды достаточно велики, находим тренды x^ и у^, отклонения отдельных уровней от трендов UXi, UYi и начинаем вычислять корреляцию между ними: сначала без лага, затем с лагом в один период, с лагом в два периода и т. д. Получается серия (или вектор) коэффициентов корреляции между колебаниями признаков х и у с возрастающим лагом. Графическое изображение этого вектора принято называть коррелограммой.

Коррелограмма может иметь два вида:

• коэффициенты до какого-то сдвига растут, а затем убывают до незначимо отличных от нуля величин, тогда лаг считается равным тому сдвигу отклонений, при котором коэффициент корреляции по модулю максимален;

• коэффициенты поочередно растут и убывают, образуя циклы или квазициклы, т. е. локальные максимумы наблюдаются, скажем, то через три года, то через четыре года. Лагом в этом случае считается средний промежуток времени между локальными максимумами коэффициентов корреляции, между отклонениями от трендов.

Рассчитываем коэффициенты корреляции отклонений от тренда, начиная с нулевого лага (табл. 9.6):





Нет смысла продолжать корреляцию, так как остается все меньше и меньше слагаемых в суммах и коэффициент становится все более случайным. Можно сделать достаточно уверенно вывод о том, что лаг равен трем годам, так как коэффициент с лагом три года довольно резко выделяется. Такой вывод будет справедлив, если по существу известно, что связь должна быть прямой, например, х — капиталовложения, млрд. руб., у — ввод в эксплуатацию жилой площади, млн. м2. Если же неизвестен априори не только лаг, но даже и направление связи, то следует проверить и альтернативную гипотезу: обратную связь при лаге в два года.


Глава 10. МОДЕЛИРОВАНИЕ И ПРОГНОЗИРОВАНИЕ ВРЕМЕННЫХ РЯДОВ

В данной главе рассмотрим следующий за анализом этап — построение модели развития изучаемого показателя и прогнозирование его возможных значений на будущее. Собственно, уравнение тренда (см. гл. 5) уже есть модель временного ряда. В гл. 6, в частности, в разделе о сезонных (и иных циклических) колебаниях получены и некоторые модели колеблемости. Остается свести их в общую модель изменения изучаемого показателя с течением времени и оценить возможность прогнозирования его будущих значений.

Прогноз (в переводе с греческого языка — предвидение, предсказание, предзнание) — неотъемлемая составляющая всей человеческой деятельности, в том числе экономической. Это промежуточное звено между познанием объективной реальности и деятельностью людей по ее преобразованию. Один из основоположников позитивизма Огюст Конт (1798–1857) говорил:

«Savoir pour prevoir; prevoir pour agir» (знать, чтобы предвидеть; предвидеть, чтобы действовать).

Самые разные прогнозы — от прогноза погоды на завтра до прогноза результатов президентских выборов — составляют значительную часть информации, циркулирующей в обществе. Разработкой прогнозов рынка сбыта, финансовых потоков, курса валют и других важнейших показателей деятельности заняты тысячи, если не миллионы работников банков, фирм, государственных органов, частных компа-

Создание методов прогнозирования — одна из главных проблем науки и, может быть, труднейшая их них. Не случайно ученый-геолог, писатель-фантаст и один из самых глубоких мыслителей России XX в. Ив. Аит. Ефремов (1907–1972) предусмотрел в далеком будущем человечества наличие специальной «Академии Стохастики и Прогнозирования» для изучения возможных рисков при осуществлении проектов изучения других звездных систем и крупных проектов на Земле. Увы, сейчас нет ни такой академии, ни методики предсказания землетрясений, ни погоды хотя бы на полгода вперед. Излагаемые в данной главе методы, как будет показано, имеют серьезные ограничения, которые нужно хорошо знать пользователям. Но задача настолько важна, что любой, пусть и несовершенный, ограниченный метод прогнозирования заслуживает внимательного изучения и проверки в практической деятельности.


10.1. Сущность и условия прогноза по тренду с учетом колеблемости

Рассказывают, что однажды к древнегреческому философу Диогену Синопскому (ок. 400 — ок. 325 до н. э.), проживавшему в бочке на берегу залива, обратился неизвестный путник с посохом и мешком за плечами:

«Скажи, мудрый человек, дойду ли я отсюда к закату до Афин?» Диоген посмотрел на стоящего путника и сказал ему: «Иди!» — «Но я же тебя спрашиваю, дойду ли я до Афин засветло?» — повторил странник. — «Иди!!» — еще громче, сердито закричал Диоген. Путник пожал плечами и пошел вдоль берега. Диоген смотрел вслед ему некоторое время и закричал: «Вернись!» Путник вернулся. «Вот теперь я могу тебе сказать, что до заката солнца ты до Афин не дойдешь. Лучше оставайся до завтра у меня». — «А что же ты мне сразу не сказал, зачем прогнал меня?» — «А как же я скажу, дойдешь ли ты к закату до Афин, если я не видел, как быстро ты идешь?»

В этом предании выражена, можно сказать, суть прогнозирования по тренду: чтобы знать, какого уровня достигнет тот или иной «идущий» процесс, например, через пять лет, нужно знать среднюю скорость изменения уровня за год, т. е. знать параметры тренда.

Более того, притча о Диогене содержит и ограничения прогноза по тренду. Представим себе, что путник, спросивший «прогноз» у Диогена, был бы хорошим атлетом и, услышав неудовлетворительный прогноз, взял бы да побежал в Афины бегом, таким образом, опровергнув прогноз Диогена! Ведь и в экономике предприятие или другой объект прогноза могут принять меры к ускорению движения в сравнении с прежним трендом, и прогноз по нему не оправдается. Однако и в этом случае прогноз вовсе не бесполезен, наоборот, он сыграл роль «предупреждения» о необходимости изменить скорость процесса. Роль предупреждающего прогноза не в том, чтобы он исполнился, наоборот, его роль заключается именно в том, чтобы менеджер фирмы, агроном, банкир, правительство страны приняли меры, не допускающие исполнения прогноза.

Тренд производственных показателей не всегда может быть изменен даже в отдельном предприятии. Для этого необходимы средства: капитал, знания (ноу-хау), воля менеджера, квалифицированные и заинтересованные в прогрессе предприятия работники. Если эти условия налицо — прогноз по прежнему тренду сохраняет только значение предупреждающего. Если же указанные условия изменения тренда отсутствуют, то прогноз по тренду осуществится на деле. Как говорил В. Черномырдин: «Хотели, как лучше, а получилось, как всегда!», т. е. хотели изменить тренд, но не сумели.

Если же объектом прогнозирования является крупная система, например сельское хозяйство региона, страны, то изменить тренд в короткие сроки, как правило, невозможно: для этого потребовались бы нереально большие средства. Невозможно за пять-шесть лет существенно изменить плодородие почв области, чтобы резко увеличить урожайность. Тем более за десяток лет не изменится тренд численности народонаселения Земли. Не остановится и не замедлится существенно тенденция роста энергопотребления человечеством топлива и других источников энергии, а значит, и тенденция роста средней температуры воздуха. Отсюда вывод:

• для крупных систем и объектов, обладающих большой инерционностью развития, прогноз по тренду за предыдущее время, как правило, возможен и реален;

• второе условие возможности прогноза по тренду связано с надежностью его параметров, рассмотренной в гл. 7. Если эти параметры ненадежны, ненадежен и прогноз;

• период прогнозирования, т. е. срок удаления прогнозируемого уровня во времени от конца базы расчета тренда, должен быть не более трети, в крайнем случае половины длительности базы (так рекомендуют, как правило, пособия по статистическому прогнозированию). Если, например, тренд урожайности зерновых культур во Франции был рассчитан за 1970–1995 гг. (база в 25 лет), то прогноз урожайности нежелательно строить более чем на восемь лет вперед, т. е. до 2003 г. Чем дальше удален прогнозный уровень от базы расчета тренда, тем больше ошибка прогноза, как будет показано в дальнейшем.

Прогноз по тренду — лишь один из статистических методов прогнозирования. Полезно сравнить его свойства, положительные и негативные, со свойствами прогнозирования на основе многофакторных регрессионных моделей. Начнем с положительных свойств прогноза по тренду. Коэффициент при номере периода в уравнении тренда (Ь — в линейном уравнении) — это комплексный коэффициент регрессии при всех реальных факторах, влияющих на уровень изменяющегося показателя, которые сами изменяются во времени. Подчеркнем: при всех факторах! Ни в одну (факторную регрессионную модель мы не можем включить все факторы, влияющие па изучаемый показатель, например на урожайность. Во-первых, часть факторов вообще неизвестна, так как наши знания, наука не имеют статуса абсолютной, полной истины. Во-вторых, часть факторов теоретически известна, но на практике по ним нет достаточно надежной или даже вообще никакой информации. В-третьих, если число известных факторов велико, то всех их явно невозможно включить в уравнение регрессии по математическим ограничениям: мультиколлипеарность, гетероскедастичность, превышение числа факторов над численностью выборки и т. п. Таким образом, уравнение тренда имеет преимущество в охвате (хотя и в неявной форме) всех факторов изменения уровней прогнозируемого показателя.

Второе преимущество состоит в том, что уравнение тренда есть модель динамики процесса, и на ее основании мы прогнозируем динамику, т. е. логическая основа тренда соответствует задаче. Напротив, уравнение многофакторной регрессии — это модель вариации уровня показателя в статической совокупности. Эта модель объясняет не изменение, например, урожайности во времени, а ее различия в совокупности хозяйств в данный период. Логическая база прогноза по многофакторной регрессии в статике неадекватна задаче прогнозирования. Конкретный пример: один из главных факторов вариации урожайности в регрессионной модели — тип почвы, почвенная разность, но почвы области не будут в динамике за несколько лет меняться, и на динамику этот фактор не влияет. Зато в регрессионной модели за данный год по всем хозяйствам области средняя температура месяца почти одинакова, и из регрессионной модели этот фактор исключается. Однако в динамике температура месяца может сильно колебаться, и в прогнозе это следовало бы учитывать.

Последнее, хотя и не очень существенное преимущество прогноза по тренду заключается в том, что для него не требуется большого объема исходной информации о факторах. Достаточно однородного по характеру тенденции периода за 20–25 лет, т. е. всего два десятка уровней, например, урожайности.

Но у прогнозирования по тренду есть, конечно и свои недостатки. Неявность факторов динамики, скрытых за «номером периода», лишает исследователя возможности учесть ожидаемый или планируемый перелом, скачок в развитии того или иного фактора. Нет возможности проигрывать разные варианты прогноза при разных сочетаниях значений факторов, что обычно делается при прогнозе по регрессионной модели с управляемыми факторами.

Прогноз по тренду несет в себе как бы черты фатализма: будет то-то, изменить ничего нельзя. Ведь мы не можем изменить или отменить ход времени, а аргумент уравнения тренда — это время. Конечно, на самом деле тренд образовался как под влиянием природных факторов, так и деятельности человека. Но слитность этих факторов все равно оставляет впечатление, что человек устранен из процесса, так что психологически данный метод нередко отторгается именно по причине своего фаталистического имиджа. Особенно это чувствовалось в плановокомандной экономике, когда считалось, что в будущем будет то и столько, сколько мы запланируем. Прогнозирование в этой системе управления было подавлено «прямым директивным планированием».

Теперь ясно, что прогнозирование — неотъемлемый элемент менеджмента, оно составляет этап и разработки стратегии развития. и плана деятельности предприятия, фирмы, правительства.


10.2. Простая трендовая модель и прогноз по ней

Простая трендовая модель динамики — это уравнение тренда с указанием начала отсчета единиц времени. Прогноз по этой модели заключается в подстановке в уравнение тренда номера периода, который прогнозируется. Например, тренд урожайности зерновых культур во Франции, рассчитанный в гл. 5, имеет вид:

y^i = 51,25 + 1,452∙ti, t = 0 в 1983 г.

Прогноз по этому тренду на 2000 г., номер которого от 1983 г. равен 17, составит:

y^2000 = = 51,25 + 1,452∙17 = 75,93 ц/га.

Интерпретация этого прогноза должна быть следующей: если урожайность зерновых во Франции будет возрастать до 2000 г. с той же средней скоростью (среднегодовым приростом), с какой она росла в период с 1970 по 1995 г., то тренд урожайности в среднем пройдет в 2000 г. через точку 75,93 ц/га. Такой прогноз и называется точечным прогнозом. Разумеется, точечный прогноз — это скорее абстракция, чем реальность. Если уровни урожайности и параметры тренда можно было бы определять с бесконечной степенью точности, то и вероятность точного осуществления точечного прогноза урожайности, составляющего 75,9324501387455603279… ц/га, была бы равна нулю. Поскольку мы дали прогноз с двумя знаками за запятой, то реально это уже не строго точечный прогноз, а прогноз попадания тренда в интервал от 75,9250001 до 75,934 9999 ц/га, т. е. в интервал шириной 0,01 ц/га. Если точечный прогноз дать в целых центнерах с гектара, то это означает прогноз на прохождение линии тренда в прогнозируемом периоде в интервале от 75,500001 до 76,49999…, т. е. в интервале шириной в 1 ц/га. Вероятность этого события уже не мала.

От строго математических дефиниций перейдем к более практическим свойствам точечного прогноза. Он означает, что при нормальном законе распределения отклонений от тренда вероятности того, что урожайность окажется ниже точечного прогноза или выше пего, равны между собой (каждая равна 0,5). Точечный прогноз в то же время указывает наивероятнейшее из всех возможных значений прогнозируемого показателя. Он, таким образом, является и средней величиной, и медианой, и модой возможных значений прогнозируемого показателя.

При расчете точечного прогноза не обращалось внимания на колеблемость уровней признака. Если бы колеблемость полностью отсутствовала, точечный прогноз был бы уже не только средним ожидаемым значением, но и единственно возможным значением признака (при соблюдении, естественно, условий реальности прогноза по тренду вообще). Также и автомобиль с отъехавшим от нас товарищем, двигаясь по шоссе пять часов со строго постоянной скоростью 90 км/ч, оказался бы на расстоянии 450 км от точки отъезда. Но ни автомобиль не может пять часов ехать с точно неизменной скоростью, ни тем более урожайность пять лет не может возрастать без малейших колебаний точно на 1,452 ц/га. В гл. 7 было показано, что, распространяя уравнение тренда на будущее, мы обязаны считать его лишь выборочной оценкой генеральных параметров, точно нам не известных. Наличие случайной колеблемости уровней порождает ошибку репрезентативности выборочных оценок тренда, которую следует принимать во внимание при прогнозировании.

Есть, однако, такие процессы, при которых колеблемость несущественна. Таковы, например, процессы распада радиоактивных элементов. Зная точную скорость протекания ядерных реакций, персонал атомных электростанций может рассчитать долю прореагировавшего урана 235 в топливных элементах на любой срок вперед, а значит, и планировать их замену. Итак, при несущественности колебаний процесса точечный прогноз оказывается самодостаточным и не требует каких-либо дополнений. В экономике, увы, «бесколебательные» процессы не встречаются.

Загрузка...