|
Дослідники Світового центру даних «Геоінформатика і сталий розвиток» при КПІ ім. Ігоря Сікорського на основі методології Форсайту здійснили друге прогнозне моделювання ймовірних фаз подальшого розвитку коронавірусної інфекції в Україні.
На короткотерміновому часовому горизонті (до одного тижня) найбільш ймовірним є продовження лінійного характеру поширення коронавірусу в Україні (перебування в стані «плато», на що вказало перше дослідження київських політехніків з окремими «сплесками», як це спостерігалося 17, 23, 30 квітня та 2 травня 2020 року. На середньостроковому часовому горизонті (до кінця серпня 2020 року) процес поширення коронавірусу в Україні може пройти такі фази. До третьої декади травня 2020 року найбільш ймовірним буде наростання пандемії із змінним характером (лінійне зростання може тимчасово переходити в експоненціальне і навпаки). Це пояснюється найгіршим в Європі дотриманням режиму карантину (мобільність автомобільного та пішого пересування в Україні 1.5-3 рази вища ніж в країнах Європи), найнижчим в Європі відсотком проведених тестів на коронавірус (в 3,5-8 разів нижчим ніж в Європі), одним з найвищих в Європі відсотком інфікованих лікарів (19,1% від загальної кількості хворих) та деякими іншими несприятливими факторами. Протягом третьої декади травня найбільш ймовірним може бути пік пандемії. Повільне згасання пандемії коронавірусу може відбуватися протягом найтеплішої пори року в Україні, з кінця травня до кінця серпня 2020 року, по мірі поступового набуття населенням колективного імунітету, покращенням роботи системи охорони здоров’я, підвищенням соціальної відповідальності і свідомості населення. Протягом осінньо-зимового періоду 2020-2021 років не виключена поява другої хвилі пандемії. ФОРСАЙТ COVID-19: СЕРЕДНЯ ФАЗА РОЗВИТКУ Зміст 1. Особливості середньої фази розвитку коронавірусу в Україні 2. Аналіз територіальної нерівномірності госпіталізації хворих на території України 3. Короткотермінові прогнози розповсюдження COVID-19 в середній фазі розвитку пандемії 3.1. Застосування багатошарових нейронних мереж типу BackPropagationдля прогнозування захворювання COVID-19 3.2. Штучна нейронна мережа з нейронами типу SigmPL(SigmoidPiecewiseLinear) для короткострокового прогнозування кількості хворих COVID-19 в Україні 4. Прогнозування розвитку пандемії коронавірусу на середньостроковому часовому горизонті 4.1. Прогнозування кількості хворих в Україні на COVID-19 з використанням класичної експоненційної моделі 4.2.Прогнозування розвитку пандемії COID-19 з використанням методу подібності в математичному моделюванні Висновки Посилання Команда проекту 1. Особливості середньої фази розвитку коронавірусу в Україні Україна входить у третій місяць боротьби з пандемією коронавірусу. Заходи, які було вжито урядом країни, в цілому дозволили суттєво уповільнити процес стрімкого розповсюдження хвороби і знизити важкі наслідки від неї, як це спостерігалося в деяких країнах Європи і США. Тому перше форсайтне дослідження Світового центру даних «Геоінформатика і сталий розвиток» від 04.04.2020 показало, що для України функція швидкості змінювання кількості випадків COVID-19 набуває свого максимуму на 51-52 день від першого зареєстрованого хворого, а саме на другу половину квітня 2020 року. Після досягнення цього максимуму, в наслідок жорстких карантинних заходів в країні, мав би відбутися «злам» попередньої тенденції і розпочатися зниження швидкості зростання кількості випадків захворювання (функція кількості захворювань на COVID-19 мала змінити характер з експоненціального на лінійний). В цілому, в третій декаді квітня 2020 року так це і відбулося (рис. 1). Рисунок 1. Щоденна кількість зареєстрованих випадків захворювань громадян України на коронавірус Разом з тим, оптимістичні очікування припинення розвитку розповсюдження коронавірусу в кінці квітня – на початку травня 2020 року, які висловлювалися як представниками офіційної влади, так і рядом експертів, включаючи експертів Світового центру даних «Геоінформатика і сталий розвиток», можуть дещо змінитися в гіршому напряму у зв’язку з наступними факторами:
Зазначені дані публікуються щодня і відображають переміщення населення різних країн і регіонів світу на картах Apple Maps у порівнянні з відповідними показниками на базову дату 13 січня 2020 року. Ці дані надсилаються з пристроїв користувачів картографічного сервісу Apple і репрезентують тільки частину населення, яке використовує прилади та сервіси компанії. Тому ці дані не репрезентують поведінку населення в цілому, але дають досить важливу оцінку динаміки мобільності людей. Рисунок 2. Зміна динаміки мобільності населення України та інших країн Європи під час карантинних заходів (посилання) За цими даними зменшення автомобільної мобільності під час карантину в Україні склало в середньому до 60%, пішої мобільності до 45%. Для порівняння, в Іспанії за цей же час автомобільна мобільність знизилася до 20% та до 10% мобільність пішого пересування, в Італії – до 23% та 15%, Польщі до 40% і 25% відповідно. Таким чином, під час карантину мобільність автомобільного та пішого пересування в Україні 1.5-3 рази вища ніж в обраних для порівняння країнах Європи. Це вказує на менш ефективне додержання карантинних заходів в Україні у порівнянні з обраними країнами Європи, що не дає змогу очікувати високої ефективності подолання пандемії коронавірусу, і як наслідок, відтермінування в часі бажаних результатів від введених обмежень. 2. Аналіз територіальної нерівномірності госпіталізації хворих на території України Аналіз кількості госпіталізованих хворих на COVID-19 в Україні вказує на значну територіальну нерівномірність їх розподілу в різних регіонах і різних населених пунктах країни (рис. 3). Ці диспропорції обумовлені особливостями комунікації населення в різних регіонах України, різними релігійними традиціями, нерівномірністю міграційних потоків, регіональними особливостями протидії та боротьби з епідемією. Середній темп приросту хворих за останній тиждень для України становив 7%. У середньому по країні госпіталізовано близько 37% хворих, від усіх інфікованих, решта 63% перебувають в режимі самоізоляції. Разом з тим, в різних регіонах і населених пунктах України спостерігалася значна нерівномірність цього приросту і відповідно кількості госпіталізованих хворих. Так, відношення кількості хворих до загальної кількості населення в різних регіонах і населених пунктах України коливається від 0,47 хворих на 10.000 осіб на Сході і Півночі України до 17-18 хворих на 10.000 осіб в Західних і Центральних регіонах України. Зокрема, в Центральній частині країни переважну кількість хворих сконцентровано в містах та обласних центрах з населенням понад 100 тис. осіб. У Західній Україні високу кількість хворих виявлено, як в обласних центрах, так і в невеликих населених пунктах міського типу, до яких відбулося повернення великої кількості мігрантів з Європи. Рисунок 3. Розподіл госпіталізованих хворих на COVID-19 в населених пунктах України (посилання) Порівняння кількості госпіталізованих хворих до загальної кількості апаратів штучної вентиляції легень вказує на можливість виникнення небезпечної ситуації в різних населених пунктах України (рис. 4). Рисунок 4. Різниця між кількістю госпіталізованих хворих та апаратами ШВЛ в лікарнях України (посилання) Ґрунтуючись на наведених даних про суттєву неоднорідність розповсюдження COVID-19 в Україні необхідно зробити певні застереження стосовно прогнозування цього процесу та вибору моделей і методів для такого прогнозування. Перш за все ці застереження необхідно зробити стосовно широкого класу так званих «детермінованих» моделей, включаючи різноманітні поліноміальні моделі, відомі епідеміологічні моделі класу SIR («сприйнятливі – інфіковані – видужалі», англ. Susceptible— Infected— Recovered) в вигляді систем звичайних диференціальних рівнянь та варіацій цих моделей, таких, як:
Клас «детермінованих» моделей перестає працювати в разі неоднорідності популяції (наприклад, різної щільністі населення в різних районах), різних шляхів передачі інфекції та наявності факторів випадковості і суттєвої нестаціонарності досліджуваних процесів. Тому, будь які прогнози, отримані для України, з її характерними ознаками неоднорідності та нестаціонарності процесів розповсюдження коронавірусу на основі використанням вищезгаданого класу моделей не можуть вважатися коректними, а певні співпадіння прогнозованих даних можуть мати випадковий, для певних часових відрізків, характер. Звичайно, «детерміновані» моделі можуть застосовуватися до порівняно невеликих територій з суттєво однорідними умовами розповсюдження епідемії із застереженням, що результати прогнозування носять гіпотетичний характер. 3. Короткотермінові прогнози розповсюдження COVID-19 у середній фазі розвитку пандемії Для здійснення короткотермінових прогнозів розповсюдження COVID-19 в середній фазі розвитку пандемії (на часовий горизонт, що не перевищує один тиждень) скористаємося апаратом нейромереж. З цією метою застосуємо:
Кожен з цих підходів має свої переваги і недоліки, на чому буде зроблено наголос в ході їх застосування. 3.1. Застосування багатошарових нейронних мереж типу Back Propagation для прогнозування захворювання на COVID-19 Для прогнозування поширення вірусу SARS-CoV-2 використано багатошарову нейронну мережу типу Back Propagation [1]. Ця мережа відповідно до теореми про універсальну апроксимацію для нейронної мережі Back Propagation [2] може апроксимувати будь-яку неперервну нелінійну обмежену функцію від n змінних Y = F (x1, x2, ..., xn). Таку її властивість було використано для побудови моделі короткострокового прогнозу (5-7 днів) поширення COVID-19. Структуру нейронної мережі наведено на рис. 5, де (Input) – вхідний шар, куди подається вектор вихідних даних X = {x1, x2, ..., xn}; (Hidden) – прихований шар (насправді може бути кілька прихованих шарів); (Output) – вихідний шар Y = {y1, y2, ..., ym). Прихований шар складаєтья з 10 нейронів. Рисунок 5. Структура нейронної мережі Back Propagation Кількість входів даної мережі – два. В якості входів обрано поточне і попереднє значення кількості інфікованих з лагом -1: x(t), x(t-1). Для навчання нейронної мережі використовується механізм «ковзного вікна», довжина якого складає 6 точок даних. На цих даних відбувається навчання зазначеної мережі, після чого виконується прогноз на заданий інтервал вперед. Далі вікно пересувається на одну позицію вибірки даних і процес навчання мережі і прогнозування продовжується. Критерій навчання мережі, з довільним числом прихованих шарів наступний (посилання): де di - реальне значення i-ої точки вибірки; yI(w) - прогнозоване значення нейронної мережі Back Propagation з ваговою матрицею w для i-ї точки; M - обсяг вибірки. Таким чином, критерій E(w) являє собою середній квадрат помилки апроксимації. Для оцінки точності прогнозу використовувався критерій середньої абсолютної помилки у відсотках MAPE (mean percentage absolute error): Функції активації для нейронів прихованого шару і нейрона вихідного шару однакові і являють собою функцію типу «сигмоід»: Для мінімізації критерію E (w) використовувався алгоритм навчання нейронної мережі Левенберга - Марквардта, що являє собою поліпшений алгоритм градієнтного спуску. Прогноз здійснювався методом ковзного вікна на 1,2,3 і 5 кроків вперед. Кількість виходів даної мережі дорівнює 1: y = x (t + k), де k -горизонт прогнозування, k= 1,2,3,4,5. Прогноз поширення COVID-19 в Україні і в м. Києві на 5-денний період часу вперед (з 01.05.20 по 05.05.20) наведено в таблиці 1. Середня абсолютна похибка у відсотках виконаного прогнозу складає MAPE = 2.215%. Таблиця 1. Прогноз захворюваності в Україні і м. Києві на 5 днів вперед
3.2. Штучна нейронна мережа з нейронами типу SigmPL(SigmoidPiecewiseLinear) для короткострокового прогнозування кількості хворих COVID-19 в Україні Найчастіше поведінка прогнозованого процесу може кілька разів суттєво змінюватися протягом спостережуваного періоду, що робить неможливим описати процес однією моделлю. Часовий ряд розповсюдження коронавірусу SARS-CoV-2 є суттєво нестаціонарним (рис. 6). У зв’язку з цим для розв'язання задач прогнозування таких процесів доцільно використовувати методи з регуляризацією, засновані на використанні алгоритму м’якої кластеризації. Зазначені властивості притаманні штучній нейронній мережі з нейронами типу SigmPL (Sigmoid Piecewise Linear) [3]. Скористаємося цією мережею для короткострокового прогнозування (з горизонтом прогнозування до одного тижня) кількості хворих на COVID-19 в Україні. Вихідними даними для прогнозування є відкриті дані МОЗ України щодо кількості підтверджених хворих, кількості летальних наслідків та кількості людей, які видужали від інфекції COVID-19. Рисунок 6. Нестаціонарний характер часового ряду розповсюдження коронавірусу в Україні Оскільки часовий ряд (рис. 6) є нестаціонарним та має експоненціальний тренд для покращення прогнозуючих якостей моделей виконано трансформацію даних за такою формулою: В результаті отримано трансформований часовий ряд, який наведено на рис. 7. Рисунок 7. Трансформований часовий ряд розповсюдження коронавірусу в Україні Перші 35 значень даного ряду обрано до навчальної вибірки, дані, що залишилися – до тестової. Як видно з графіку трансформованого ряду він все ще є нестаціонарним і з великою ймовірністю складається з декількох потенційних умовних розподілів – отже, є доцільним застосування методів, адаптованих під ці умови. Для порівняння було побудовано три різних прогнозуючих моделі, які приймають на вхід три попередніх значення трансформованого часового ряду і прогнозують його наступне значення – тобто прогнозами цих моделей є співвідношення , використовуючи яке разом зі значенням x(t) можна отримати фінальне значення прогнозу . Для розв'язання задачі прогнозування запропоновано метод прогнозування з регуляризацією, заснований на використанні алгоритму м’якої кластеризації та штучних нейронів нового типу SigmPL. Порівнювалися наступні моделі:
Після налаштування параметрів моделей (окрім «наївної» моделі, що не потребує налаштування параметрів) було отримано наступні значення похибки моделей на тестових даних:
Отже, штучна нейронна мережа з нейронами типу SigmPLмає найменшу похибку у порівнянні з іншими моделями. Її використання для прогнозування кількості підтверджених хворих на COVID-19 на наступні 6 днів дало такі результати: 01 травня 2020 року – 11101 Підтвердження хворих 02 травня 2020 року – 11986 Підтвердження хворих 03 травня 2020 року – 13112 Підтвердження хворих 04 травня 2020 року – 14536 Підтвердження хворих 05 травня 2020 року – 16324 Підтвердження хворих 06 травня 2020 року – 18559 Підтвердження хворих. Консервативніший прогноз, який отримано як зважене середнє декількох моделей виглядає так: 01 травня 2020 року – 11049 Підтвердження хворих 02 травня 2020 року – 11824 Підтвердження хворих 03 травня 2020 року – 12759 Підтвердження хворих 04 травня 2020 року – 13884 Підтвердження хворих 05 травня 2020 року – 15238 Підтвердження хворих 06 травня 2020 року – 16866 Підтвердження хворих. Результати короткострокового прогнозування кількості хворих на COVID-19 в Україні на наступний тиждень, отримані з використанням багатошарової нейронної мережі типу Back Propagationта штучної нейронної мережі з нейронами типу SigmPL наведено на рис. 8. Бачимо, що мережа Back Propagation вказує на більш спокійний, лінійний характер розвитку пандемії на часовому відрізку 01.05.20 – 06.05.20, в той час, як нейронна мережа з нейронами типу SigmPL вказує на можливе продовження експоненціального характеру розвитку цього процесу. Експерти Світового центру даних «Геоінформатика і Сталий розвиток» схиляються до другого сценарію розповсюдження короновірусу в Україні (експоненційне зростання). Рисунок 8. Короткостроковий прогноз кількості інфікованих вірусом SARS-CoV-2 на часовому відрізку 01.05.20 – 06.05.20 4. Прогнозування розвитку пандемії коронавірусу на середньостроковому часовому горизонті Під середньостроковим часовим горизонтом будемо розуміти відрізок часу до чотирьох місяців, починаючи з 01.05.2020. Для здійснення прогнозування на цьому часовому горизонті скористаємося двома методами:
4.1. Прогнозування кількості хворих в Україні на COVID-19 з використанням класичної експоненційної моделі Відповідно до цієї моделі прогнозується число хворих на кожен день. Воно дорівнює загальній кількості хворих мінус кількість тих, хто видужав і мінус кількість померлих людей. Позначимо: t[i] = щоденні відмітки часу; x[i] = число активних випадків хвороби в цей день. Розглянемо функції: Зробимо заміни: Знайдемо потрібні коефіцієнти a, b, c для вихідної функції Підставивши ці коефіцієнти в рівняння, отримаємо експоненційну модель прогнозу: Результати прогнозування числа хворих на коронавірус в Україні на основі використання моделі (3) наведено на рис. 9 і в таблиці 2. Рисунок 9. Прогнозування кількості хворих на коронавірус в Україні Таблиця 2. Прогнозування кількості людей, хворих на коронавірус в Україні з використанням моделі (3)
Виходячи з отриманих даних прогнозування можливий сценарій подальшого розвитку пандемії COVID-19 в Україні (середньостроковий сценарій 1) складається з наступних фаз: 1. Поточний розвиток пандемії COVID-19
2. Пік пандемії
3. Згасання епідемії
4.2. Прогнозування розвитку пандемії COID-19 з використанням методу подібності в математичному моделюванні На першому кроці застосування цього методу здійснювався вибір країни (країн) – прототипів, характер розвитку пандемії в яких є найбільш наближеним до характеру розвитку цього процесу в Україні. З цією метою було застосовано кореляційно-регресійний аналіз для порівняння головних показників України з відповідними показниками країн Європи. Країни для порівняння вибиралися виходячи з таких показників:
В результаті застосування цих критеріїв для порівняння з Україною було обрано 11 країн Європи (таблиця 3). Таблиця 3. Кореляційно-регресійний аналіз
Розглянуто такі набори даних:
Дослідження спрямовувалось на оцінювання подібності даних для України до даних 11 країн Європи, обраних для порівняння. Для показників P1-P4 обраховано відповідні коефіцієнти кореляції ri,j, де i=1..4; j=1..11; значення P5 нормовано відносно значення показника для України за формулою: З використанням наявних даних і введених критеріїв P1-P5 було обраховано індекс подібності: (таблиця 3). На основі використання обрахованого індексу подібності та групи таких показників, таких як населення країни, щільність населення країни, територіальна наближеність країни Європи до України, в якості країн-прототипів для виконання прогнозного моделювання було обрано Польщу і Румунію (рис. 10). Рисунок 10. Вибір країн-прототипів для України На основі використання середньозважених значень зареєстрованої кількості випадків COVID-19 в країнах-прототипах (Румунії та Польщі) побудовано наступну прогнозну модель для України: де t –кількість днів від початку епідемії в Румунії. Результати прогнозного моделювання подальшого розповсюдження коронавірусної хвороби в Україні наведено в таблиці 4. Таблиця 4. Результати прогнозного моделювання подальшого розповсюдження коронавірусної хвороби в Україні на основі порівнянь з країнами-прототипами
Порівняння результатів прогнозного моделювання розповсюдження коронавірусу в Україні, отриманих з використанням класичної експоненціальної моделі і методу подібності в математичному моделюванні на середньостроковому часовому інтервалі показує, що обидва ці методи дають близькі за характером розвитку досліджуваних процесів результати. Враховуючи, що зазначене прогнозне моделювання виконано з використанням двох різних незалежних методів, можемо вважати, що виявлені в результаті цього дослідження тенденції розвитку короновірусу в Україні характеризуються певною ступінню адекватності. Висновки:
Посилання:
Науковий керівник проекту: М.З. Згуровський. Команда проекту: О.С. Войтко, Н.В. Горбань, І.М. Джигирей, Б.Р. Дудка, К.В. Єфремов, Ю.П. Зайченко, П.О. Касьянов, М.М. Перестюк, І.О. Пишнограєв, В.В. Путренко, В.М. Синєглазов Додатково: ФОРСАЙТ COVID-19: Вплив на економіку і суспільство |
Контакт: тел.: (044) 290-41-24 (044) 290-41-24 (*122) факс: (044) 290-41-24 м. Київ, вул. Смілянська, 4 Карта проїзду e-mail: inf@euroosvita.net |
При повному або частковому відтворенні інформації посилання на euroosvita.net обов'язкове у вигляді відкритого для пошукових систем гіперпосилання.
euroosvita.net не несе відповідальності за інформацію отриману з інших сайтів |