Урок 13: Дробові диференційовані та порогові моделі

Цього тижня ми розглянемо дві варіації моделей ARIMA - довгі моделі пам’яті (дробові різниці) та порогові моделі (моделі перемикання режимів).

Завдання

  • Визначте та інтерпретуйте прості дробово різниці моделей
  • Визнайте, коли брати перші відмінності порівняно з дробовими
  • Визначити та інтерпретувати моделі ARFIMA
  • Застосовуйте різні моделі протягом двох інтервалів часового ряду

Розділ 5.1 “Shumway and Stoffer” дає короткий огляд моделей “довгої пам’яті ARMA”. Цей тип моделі може використовуватися, коли ACF серії зменшується повільно до 0.

Звичайним рішенням у цій ситуації є дослідження перших відмінностей серії. Часто дані, для яких перша різниця є успішною, зазвичай мають першу автокореляцію відставання, досить близьку до 1.

\ (x_t - x_ \) = умови AR та MA.

Це можна переписати як

\ (x_t = x_ + \) AR та MA терміни.

У цьому формулюванні ми маємо термін першого відставання AR з коефіцієнтом, рівним 1. Це створює автокореляцію першого порядку для оригінальної серії, близької до 1.

У деяких випадках, однак, ми можемо побачити стійкий зразок ненульових кореляцій, який починається з першої кореляції затримки, яка не близька до 1. У цих випадках можуть бути корисними моделі, що включають "дробове диференціювання". Простий моделлю, яка використовує дробове диференціювання, є

де d - таке значення, що | d | Для цього можна використовувати arfima. Знову ж таки, ознакою того, що ця модель може бути корисною, є повільно звужується зразок ACF без особливо високих автокореляцій.

Приклад 5.1 у тексті розглядає дробово різну модель для ряду n = 634 (річних) значень геологічних вимірювань, званих varve. Це осадовий шар піску та мулу, що залишився при таненні льодовиків. Далі наводиться графік часових рядів даних.

може бути

Через період більш екстремальної мінливості автори пропонують проаналізувати логарифм даних. (Це може стабілізувати дисперсію.)

Далі наводиться графік перетвореного в журнал ряду:

Зразок ACF даних, перетворених журналом, демонструє стійкий характер помірно високих значень. Ось і ACF, і PACF. У розділі 3 тексту автори використовують перше розмежування та досліджують відносні переваги моделей ARIMA (0,1,1) та ARIMA (1,1,1) для цих даних. У розділі 5.1 автори досліджують дробово різну модель.

Пакет arfima дає оцінку різниці частки \ (\ widehat = 0,373 \). Таким чином, розрахункова модель дорівнює \ ((1-B) ^ x_t = w_t \), де \ (x_t \) - відцентрований журнал, перетворений журнал.

Ця модель добре підходить для даних, про що свідчать наступні ACF та PACF залишків.

Узагальнення

Модель може бути розширена, включаючи AR та MA терміни, а також дробову різницю. Ці моделі називаються моделями ARFIMA. Для ідентифікації моделі ARFIMA спочатку ми використовуємо просту дробно-різницеву модель \ ((1-B) ^ dx_t = w_t \), а потім досліджуємо ACF та PACF залишків із цієї моделі. Це аналогічно дослідженню ACF та PACF перших відмінностей, коли ми виконуємо звичайні кроки для нестаціонарних даних. Пакет arfima може бути використаний для розміщення загальних моделей ARFIMA.

Складність інтерпретації

Основна складність полягає в тому, що дробову різницю важко інтерпретувати. В основному це математичний пристрій, який використовується для розширення моделі до AR високого порядку з автокореляціями, які відповідають стійкій схемі "довгої пам'яті" ACF серії.

Код R R для прикладу 5.1

Для запуску наступного коду потрібно встановити пакет arfima; це настійно рекомендується щодо пакета fracdiff, викладеного в тексті (http://www.stat.pitt.edu/stoffer/tsa4/Rexamples.htm). Після того, як пакет встановлений у вашій системі, ви можете пропустити крок встановлення та використовувати бібліотеку (arfima) так само, як ми робимо для бібліотеки astsa.

Порогові моделі використовуються в кількох різних сферах статистики, а не лише в часових рядах. Загальна ідея полягає в тому, що процес може поводитися по-різному, коли значення змінної перевищують певний поріг. Тобто може застосовуватися інша модель, коли значення перевищують порогове значення, ніж коли вони нижче порогового значення. Наприклад, при застосуванні лікарської токсикології може бути, що всі дози нижче порогової кількості є безпечними, тоді як токсичність зростає, оскільки доза збільшується вище порогової. Або в дослідженні чисельності популяції тварин популяція може повільно збільшуватися до граничного розміру, але потім може швидко зменшуватися (через обмежений вміст їжі), коли популяція перевищує певний розмір.

Порогові моделі - це окремий випадок моделей перемикання режимів (RSM). У моделюванні RSM різні моделі застосовуються до різних інтервалів значень деяких ключових змінних.

У розділі 5.4 нашого тексту розглядаються порогові авторегресивні моделі (TAR) для одновимірних часових рядів. У моделі TAR моделі AR оцінюються окремо через два або більше інтервали значень, визначених залежною змінною. Ці моделі AR можуть мати або не мати однакового порядку. Для зручності часто вважають, що вони одного порядку.

У тексті розглядається лише одне порогове значення, так що існуватимуть дві окремі моделі AR - одна для значень, які перевищують порогову величину, і одна для значень, які цього не роблять. Труднощі полягають у визначенні потреби в моделі TAR, пороговому значенні, яке слід використовувати, та порядку (порядку) моделей AR. Однією з особливостей даних, що модель TAR може працювати, є те, що темпи збільшення та/або зменшення можуть відрізнятися, коли значення перевищують якийсь рівень, ніж коли значення нижче цього рівня.

Оцінка порогового рівня є більш-менш суб'єктивною. Багато аналітиків досліджують кілька різних порогових рівнів, намагаючись забезпечити відповідність даним (як вимірюється значеннями MSE та загальними ознаками залишків). Порядок (и) моделі AR може також бути експедицією спроб і помилок, особливо коли вбудованою моделлю даних може бути не AR. Як правило, аналітики починають з того, що, на їх думку, може бути вищим, ніж потрібно, а потім зменшують замовлення за необхідності.

Розділ 5.4 тексту охоплює порогові моделі та містить гарний приклад. У цьому уроці ми обговоримо приклад і надамо код R. Серія для прикладу - це щомісячні показники смертності від грипу в США протягом 11 років (n = 132). Через епідемічну природу грипу поведінка серії значно відрізняється, коли показники перевищують певне порогове значення, ніж коли він нижче значення.

Першим кроком (завжди) є побудова даних. Далі наведено графік часових рядів даних.

Відповідно до вихідних даних, ми спостерігаємо різке збільшення та зменшення в певні періоди. Після деяких експериментів автори вирішили використовувати окремі моделі AR (4) для двох регіонів: дані, що мають першу різницю, більшу або рівну 0,05, та дані, що слідують за першою різницею, меншу ніж 0,05. Модель добре підходить, як свідчать наступні графіки - ACF та PACF залишків та графік, що порівнює фактичну першу різницю з прогнозованими першими різницями. У графіку порівняння фактичних та передбачуваних значень передбачені значення знаходяться вздовж червоної пунктирної лінії.

R R Код для прикладу

Код R для прикладу наведено нижче. У команді ts.intersect команди lag (,) створюють лаги, а матриця, що виводиться, не буде містити рядків із відсутніми значеннями. У коді ми робимо регресійну відповідність моделі AR (4) для всіх даних, щоб встановити змінні, які будуть використовуватися в окремих режимних регресіях.

Пакет tsDyn у R спростив цей код у кілька кроків:

Якщо ми не надаємо порогового значення для цього варіанту, setar здійснює пошук по сітці, щоб вибрати поріг (.036):