МЕТОД БУСТИНГУ ГЕТЕРОСКЕДАСТИЧНИХ МОДЕЛЕЙ ДЛЯ ПРОГНОЗУВАННЯ КОНЦЕНТРАЦІЙ ПИЛУ САХАРИ В АТМОСФЕРНОМУ ПОВІТРІ УКРАЇНИ
DOI:
https://doi.org/10.31649/2307-5376-2024-2-28-38Ключові слова:
штучний інтелект, часові ряди, гетероскедастичні моделі, GARCH, ARIMA, SARIMAX, бустинг моделей машинного навчання, пил Сахари, якість атмосферного повітря, екологічний моніторинг, прогнозування забруднення, дрібнодисперсний пил, PM1, EcoCity, ансамблеві моделі, машинне навчанняАнотація
У статті представлено новий метод бустингу гетероскедастичних моделей та його прикладне застосування на прикладі прогнозування концентрацій пилу Сахари в атмосферному повітрі України. Останнімчасом спостерігається підвищена частота переносу дрібнодисперсного пилу з пустелі Сахара через Середземне море на територію Європи, зокрема – в Україну. Це явище ускладнює прогнозування якості атмосферного повітря через руйнування усталених закономірностей забруднення, оскільки додаються нові чинники, які потребують спеціальних моделей для адекватного опису. Особливий метеорологічний режим поширення пилу Сахари дозволяє припустити, що дисперсія залишків моделі ARIMA може бути випадковим процесом і для її опису доцільно використовувати гетероскедастичні моделі, такі як GARCH. Проте, традиційні GARCH-моделі є ефективними лише за наявності одного домінуючого випадкового процесу. У разі додавання декількох таких процесів, традиційні моделі втрачають ефективність.
У цій роботі запропоновано застосування бустингового підходу для побудови ансамблевих моделей, що, на відміну від наявного, включають кооперацію дерев рішень та гетероскедастичних моделей, для моделювання складних гетероскедастичних процесів. Запропонований метод, як це прийнято для бустингових моделей, ґрунтується на ітеративному процесі підбору моделей, де кожна наступна модель враховує похибки попередньої. Для перевірки ефективності методу використано дані громадського моніторингу атмосферного повітря EcoCity, зокрема дані по Вінницькій області за показником PM1, які вказують на періоди, коли концентрація дрібнодисперсного пилу Сахари в атмосферному повітрі області досягала особливо аномальних значень.
Доведено, що процес поширення пилу Сахари у Вінницькій області є гетероскедастичним. Побудовано моделі SARIMAX та типові GARCH-моделі з використанням Python-бібліотек statsmodels та arch. Виявлено, що модель ARIMA демонструє, на диво, кращі результати у порівнянні з класичними GARCH-моделями з різними параметрами, що свідчить про недостатню ефективність цих GARCH-моделей. Запропонований метод бустингових гетероскедастичних моделей дозволяє досягти значно більшої точності за усі ці моделі на усьому діапазоні значень, окрім значення найбільшої аномалії, яке передбачити неможливо. А отже, розроблений у статті метод прогнозування є ефективним підходом для розв’язання складних задач прогнозування, прикладом яких є прогнозування якості атмосферного повітря під час поширення пилу Сахари в Україні.
##submission.downloads##
-
PDF
Завантажень: 40