Згладжування неповних рядів даних станцій екологічного моніторингу з використанням прогнозних моделей
Abstract
У статті розглядається проблема неповних рядів даних при аналізі даних станцій екологічного моніторингу, її вплив на достовірність отриманих результатів та прогностичну придатність вхідних даних, а також методи згладжування даних, що дозволяють мінімізувати негативний вплив пропусків даних.
Відсутність даних в ряді може проявлятись на практиці як хибні нульові значення, які можуть призводити до суттєвих відхилень, а також як відсутні дані, що в деяких випадках приховують тенденції зміни динаміки ряду. При цьому, аналітик може не знати про присутність пустих або нульових значень, що, в результаті, призводить до хибних висновків або прогнозів.
Методи згладжування за допомогою простої ковзної середньої та екстраполяції дозволяють підвищити якість вхідних даних, та, як результат, підвищити прогностичну якість отриманих прогнозних моделей.
Використання локальних прогнозів для заповнення пропущених значень дозволяє отримати найбільш точні результати замість відсутніх даних, і, як результат, підвищити прогностичну якість розроблюваних прогнозних моделей. Точність результатів отриманих замість відсутніх даних перевіряється розрахунком основних статистичних показників ряду з пустими значеннями та повного ряду. Розрахунок параметрів моделей прогнозування для заповнення пустих інтервалів може здійснюватись на основі попередніх даних або тенденції всього ряду.
Отримані в даному дослідженні результати можуть бути використані у подальшому для заповнення неповних рядів при аналізі даних станцій екологічного моніторингу або інших рядів даних, що використовуються для прогнозування або аналітичних розрахунків.