Модель геосинхронного релятивістського прогнозування потоку електронів на основі нейронної мережі

Atmospheric and Environmental Research, Inc., Лексінгтон, штат Массачусетс, США

Група 95, Лабораторія Лінкольна MIT, Лексінгтон, штат Массачусетс, США

Дирекція космічних кораблів, Науково-дослідна лабораторія ВПС, Hanscom AFB, штат Массачусетс, США

Інститут наукових досліджень, Бостонський коледж, Честнат-Хілл, штат Массачусетс, США

Atmospheric and Environmental Research, Inc., Лексінгтон, штат Массачусетс, США

Група 95, Лабораторія Лінкольна MIT, Лексінгтон, штат Массачусетс, США

Дирекція космічних кораблів, Науково-дослідна лабораторія ВПС, Hanscom AFB, штат Массачусетс, США

Інститут наукових досліджень, Бостонський коледж, Честнат-Хілл, штат Массачусетс, США

Анотація

[1] Розроблена багатошарова модель прямої нейронної мережі для прогнозування> 2 МеВ потоку електронів на геосинхронній орбіті. Модель використовує як вхідні дані 10 послідовних днів історичних значень електронного потоку та 7 послідовних днів щоденних підсумованих значень планетарного індексу Kp з двома нейронами в одному прихованому шарі. Обговорюється розробка моделі, в якій досліджуються розмір інтервалу навчального набору та період перепідготовки. Показано, що проблеми, пов'язані з насиченням нейронів, які обмежують здатність мережі до узагальнення, обходять шляхом щоденного режиму перепідготовки. Ефективність моделі оцінюється за період 1998–2008 рр. Та порівнюється з результатами, отриманими за допомогою моделі REFM. Продемонстровано, що модель нейронної мережі працює досить добре щодо моделі REFM для цього періоду часу, забезпечуючи середню ефективність прогнозування для 6-місячних тестових інтервалів 0,71, 0,49 та 0,31 для прогнозів на 1 день, 2 дні та 3 дні відповідно.

1. Вступ

[2] Добре відомо, що випромінювання заряджених частинок шкодить операціям космічних кораблів [ Ши та Розумний, 1998]. На додаток до небезпеки для здоров’я, яку космічні мандрівники випромінює радіаційне середовище, електронні компоненти космічних кораблів можуть бути пошкоджені, що призведе до тимчасової або навіть повної втрати функції [ Рейган та співавт., 1983; Вренн, 1995]. Передбачення випадків, коли рівні радіації навколо космічного корабля, ймовірно, можуть спричинити проблеми, є необхідним кроком у розробці стратегії захисту космічних активів. Радіаційне середовище на геосинхронній орбіті (GEO) представляє особливий інтерес через велику кількість супутників, що населяють цей регіон. Тому було зроблено багато спроб прогнозувати потік електронів високої енергії на ГЕО [ Нагай, 1988; Бейкер та співавт., 1990; Кунс і Горні, 1991; Стрінгер та ін., 1996; Нагай та ін., 1999; Лі та ін., 2001; Лі, 2004; Rigler та співавт., 2004; Ухорський та ін., 2004; Мійосі та Катаока, 2008; Тернер і Лі, 2008]. Методи, що використовуються в цих моделях прогнозування, варіюються від статистичних моделей даних, таких як лінійні фільтри передбачення та нейронні мережі, до моделей на основі фізики, що характеризуються радіальною дифузією.

2. Теоретичні основи

2.1. Модель та навчальний алгоритм

2.2. Попередня обробка даних

[5] До навчання мережі були вжиті конкретні кроки для того, щоб дані були у відповідному вигляді для презентації в мережі. Серед бажаних характеристик даних є властивість, що локальні варіації малих значень даних не повинні бути менш значними, ніж локальні варіації при великих значеннях даних. Для даних про потік електронів (які будуть докладно описані в розділі 3) це було досягнуто значною мірою шляхом прийняття логарифму даних. Прогалини в даних заповнювались за допомогою схеми поліноміальної інтерполяції другого порядку для розробки моделі.

2.3. Обмеження мережевої структури

3. Дані

[8] При розробці моделі нейронної мережі були використані два набори даних, а саме> дані електронного потоку GOES> 2 МеВ та дані планетарного індексу Kp [ Майо, 1980], обидва доступні на веб-сайті космічної фізики (SPIDR) (http://spidr.ngdc.noaa.gov/spidr/), що здійснюється Національним центром геофізичних даних (NGDC). Для кожного супутника GOES отримували середні добові дані електронного потоку, а також підсумовували 3-годинні дані індексу Kp, щоб отримати загальне добове значення. На малюнку 2 показано доступність даних про потік електронів> 2 МеВ від SPIDR для супутників GOES з моменту створення програми GOES. Розробка моделі, проведена Лінг [2000] використовував дані GOES до кінця 1997 року.

р a a Супутник, що відповідає даним ординат.
х b b Супутник, що відповідає даним абсцис.
м c c ухил, що виникає внаслідок прилягання колоди (р) = м журнал (х) + b.
b d d The р перехоплення припасування.
σ 2 е e Середнє квадратичне відхилення журналу даних від журналу нормованих даних.

ІДЕ 8	ІДЕ 9	0,935	−0,224	0,0353
ІДЕ 8	ІДЕ 10	0,963	−0,350	0,0646
ІДЕ 8	ІДЕ 11	0,943	0,048	0,00613
ІДЕ 8 ф f Нормалізація з 1 травня 1995 року по 30 червня 2006 року.	ІДЕ 12	1.03	−0,260
ІДЕ 10 ф f Нормалізація з 1 травня 1995 року по 30 червня 2006 року.	ІДЕ 12	1.07	0,0937	0,0476
ІДЕ 8 г. g Нормалізація з 1 липня 2006 року по 31 грудня 2008 року.	ІДЕ 12	1.05	−0,720
ІДЕ 10 г. g Нормалізація з 1 липня 2006 року по 31 грудня 2008 року.	ІДЕ 12	1.09	−0,384	0,0963

a Супутник, що відповідає даним ординат.
b Супутник, що відповідає даним абсцис.
c ухил, що виникає внаслідок прилягання колоди (р) = м журнал (х) + b.
d The р перехоплення припасування.
e Середнє квадратичне відхилення журналу даних від журналу нормованих даних.
f Нормалізація з 1 травня 1995 року по 30 червня 2006 року.
g Нормалізація з 1 липня 2006 року по 31 грудня 2008 року.

[10] Добре відомо, що дані електронного потоку> 2 МеВ для супутників GOES можуть бути забруднені протонами в періоди сильного потоку протонів. Для початкової розробки моделі, що передбачає оптимізацію структури мережі та параметрів навчання (фаза 1), цю проблему значною мірою було обійдено шляхом вибору часів, коли середній 7-денний потік протону був меншим ніж 1 пфу. Для даних, що використовуються для оцінки ефективності моделі, дані трактувались як відсутні у часи високого потоку протонів, визначається як, коли середній потік протону> 30 МэВ усіх супутників GOES, що надають дані, перевищував 50 пфу.

4. Розробка моделі

[13] Наступним етапом у розробці моделі було поточне подавання потоку електронів з використанням поточних та історичних значень потоку електронів на додаток до підсумованих даних індексу Kp для введення в мережу. Це було зроблено для того, щоб побачити, наскільки ефективною може бути мережа у створенні результату, який є таким самим, як один із його входів, і можливо виявлення будь-яких проблем у процесі навчання та тестування. Результати цих зусиль показали, що оптимальна мережева структура була приблизно такою ж, як визначена або з метрики передбачення навчального набору, або з метрики передбачення тестового набору. Поведінка продуктивності мережі при підвищеній підготовці шляхом визначення більш високих рівнів точності мінімізації середньої квадратичної помилки мережі відповідало очікуванням, оскільки посилена підготовка покращила продуктивність мережі як для навчальних, так і для тестових наборів.

[14] Розробка одноденної моделі прогнозування потоку електронів стала завершальним етапом розробки моделі. Для цього завдання кількість зразків навчального набору було встановлено на 180, що відповідає першим 180 дням 1994 року, а інтервал тестового набору прийнято за перші 4 місяці 1995 року. Вхідні нейрони складалися з фіксованої кількості 10 нейронів, що відповідає 10 днів потоку електронів плюс змінна кількість нейронів для підсумованих даних Kp-індексу. Кількість підсумованих нейронів Kp дозволяла змінюватися від 0 до 20 під час пошуку оптимальної мережевої структури, а кількість нейронів в одному прихованому шарі змінювалася залежно від того, що кількість ступенів свободи, що відносяться до параметрів мережевої структури до кількості навчальних зразків було більше нуля. Параметр завершення навчання, що визначає рівень точності, на якому закінчується навчання, варіювався від 0,025% до 0,5% від максимально допустимої середньоквадратичної похибки мережевого виходу.

5. Ефективність моделі

[18] В якості перевірки впровадження тривалості навчального набору на 1 рік було проведено порівняння між мережами, які навчаються з різними розмірами навчальних наборів. На рисунку 5 показано ефективність прогнозування прогнозів електронного потоку на 1 день, 2 дні та 3 дні як функцію часу для періоду 1997–2008 рр., Обчислених за 6-місячними даними набору тестів для інтервалів, що безпосередньо слідують за даними навчального набору. Для навчання мереж використовувались навчальні комплекти розміром 6 місяців та 1 рік, обидва з періодом перепідготовки 6 місяців. Середня ефективність прогнозування для мереж, які мають розміри навчальних наборів на 6 місяців, становить 0,58 (0,29, 0,017) для прогнозів на 1 день (2 дні, 3 дні). Середня ефективність прогнозування для мереж, що мають розмір навчального набору на 1 рік, становить 0,67 (0,41, 0,17) для прогнозів на 1 день (2 дні, 3 дні). Очевидно, що мережі, навчені даними даних за 1 рік, дають набагато кращі результати, як показано на малюнку 6, який показує потік електронів як функцію часу для інтервалу випробувань з 1 січня 2002 року по 30 червня 2002 року. Також показаний індекс Dst, отриманий з Веб-сайт SPIDR для позначення рівня геомагнітної активності.

[19] Однак, більш уважне вивчення фактичних прогнозів у порівнянні з даними виявляє цікаву поведінку. На рисунку 7 показано потік електронів як функція часу для випробувального інтервалу з 1 липня 2003 року по 31 грудня 2003 року, інтервал, в якому мережі, що навчаються за 1 рік даних, працювали погано щодо більшості інших інтервалів часу. Протягом усього інтервалу бувають випадки, коли прогнози досягають верхньої межі, яка особливо виражена для прогнозів на 2 дні та 3 дні, де спостерігаються регіони “рівних вершин”. Небажання мереж виробляти вихід, що перевищує спостережувані верхні межі, є показником насиченості нейронів. Це трапляється, коли дані, що використовуються для навчання мережі, не репрезентативні для сукупності, яка використовується для формування прогнозів, а отже, обмежують здатність мережі узагальнювати.

[22] Перенавчання моделі щодня усуває ефекти насичення нейронів, що спостерігаються в результатах для мереж, що мають 6-місячний період перепідготовки. 10 показані прогнози потоку електронів як функція часу для тестового інтервалу з 1 липня 2003 року по 31 грудня 2003 року, в якому використовувався навчальний набір розміром 2 роки. Порівнюючи результати, показані на рисунку 7, з результатами, показаними на рисунку 10, очевидно, що збільшення розміру навчального набору нічого не робить для усунення насичення нейронів. Щодня перекваліфікуючи мережі, дані тестового набору, швидше за все, будуть представлені даними, які використовувались для їх підготовки, і тенденції в даних стають менш впливовими у здатності негативно впливати на прогноз.

6. Підсумок

[25] Починаючи з моделі нейронної мережі, що має структуру та параметри навчання, визначені Лінг [2000] була розроблена модель для прогнозування> 2 МеВ потоку електронів на ГЕО з використанням новіших даних. Розмір навчального комплексу на 2 роки був встановлений як достатній для складання прогнозів на 1 день, 2 дні та 3 дні. Було продемонстровано, що проблем насичення нейронів можна уникнути шляхом щоденної перекваліфікації моделі. Ефективність моделі для прогнозування 11-річних даних з 1998 по 2008 рр. Оцінювали шляхом порівняння результативності ефективності прогнозування з ефективністю, отриманою за допомогою моделі NOAA/SPWC REFM для прогнозування електронної хвилі на той же період часу. Показано, що модель нейронної мережі працює надзвичайно добре щодо моделі REFM, особливо для прогнозів на 2 та 3 дні. Модель може прогнозувати потік електронів навіть під час інтенсивних штормів, таких як шторм "Хелловін" 2003 року. Тільки час покаже, чи буде модель працювати однаково добре, як прогресує поточний сонячний цикл. Проводиться робота з налаштування моделі FLUXPRED для прогнозування в режимі реального часу в рамках програми Лабораторії прогнозування космічної погоди ВПС (SWFL), що дозволить додатково оцінити ефективність моделі.

Подяка

[26] Ми вдячні Террі Онсагеру з NOAA/SWPC за надання коду моделі REFM. А.Г.Л. визнає підтримку з контракту AFRL FA8718‐05 ‐ C ‐ 0036.

Опис імені файлу

swe390-sup-0001-t01.txtпояснювальний текстовий документ, 722 B

Таблиця з розділенням табуляцією 1.

Зверніть увагу: Видавець не несе відповідальності за зміст або функціональність будь-якої допоміжної інформації, наданої авторами. Будь-які запити (крім відсутнього вмісту) слід направляти до відповідного автора статті.