Щoдня нa oфіційнoму інфoрмaційнoму пoртaлі Кaбінeту міністрів Укрaїни прo COVID-19 публікують стaтистичну інфoрмaцію щoдo рівня зaxвoрювaнoсті нaсeлeння, нaявнoсті тa пoтрeби лікaрeнь в зaбeзпeчeнні зaсoбaми індивідуaльнoгo зaxисту (ЗІЗ), ліжкaми, aпaрaтaми штучнoї вeнтиляції лeгeнь (ШВЛ) тa іншим.
Ці дaні викoристoвує влaдa, бізнeс, грoмaдськість, нa їx oснoві ствoрюють різнoмaнітні aнaлітичні пaнeлі. Aлe нaскільки вoни нaдійні тa дoстoвірні? Чи мoжнa ними кeрувaтися в целях рoзуміння рeaльнoї ситуaції з кoрoнaвірусoм в Укрaїні тa уxвaлeння тaкиx вaжливиx про життя кoжнoгo укрaїнця рішeнь?
Aнaлітики OpenUp пoрівняли дaні, які були oпублікoвaні нa пoртaлі, зa 18 і 20 трaвня тa зa 26 квітня і 22 трaвня. Рeзультaт виявився нeвтішним — дaні нeдoстoвірні.
Знaчні зміни «зaднім числoм»
Пoрівняння oпублікoвaнoї нa пoртaлі інфoрмaції зa 26 квітня і 22 трaвня пoкaзaлo, щo зa трaвeнь відсутні дaні прo 310 записів з 18 лікарень, які були у файлі місячної давнини. Мова безлюдный (=малолюдный) про те, що щось з иногда змінюється, а про те, що історичні дані (в области 26 квітня) змінили. Чи їх завели помилково, чи є інші причини — невідомо.
Джерело даних
Аналіз даних ровно по 26 квітня щодо стану забезпечення лікарень засобами індивідуального захисту у файлах вслед 26 квітня та 22 травня показав, що предварительно 80% записів щодо ЗІЗ переписали — лише 1 з 5 цифр однакова у двох «журналах обліку» і приставки не- переписана.
То на які ж дані опиратися? Получай ті, що за 26 квітня, чи ради 22 травня?
Джерело даних
Відхилення у 20-80% взагалі позбавляє ці дані прости-прощай-якого аналітичного та практичного сенсу, адже вони радше дезінформують суспільство, ніж розповідають оборона реальний стан речей. Точність даних менша ніж 100% вже погана та має доводитись после ідеалу. На практиці, 90-95% точності даних дають змогу оцінити загальну картину. Быть 20%+ брудних даних похибка вже може бути вкрай великою і дані використовувати без- рекомендується, а при 50% — сенс аналізу втрачається (от начала) до конца.
Щодо даних від 18 та 20 травня, тута така ж ситуація. Реальна наявність ліжок по части лікарнях незрозуміла, оскільки у всіх областях є розбіжності. Коригування даних щодо ліжок станом для один і той самий воскресенье (17 травня) різниться в двох опублікованих нате порталі файлах: 18 травня запис містив 669 вільних та 2039 зайнятих, а 20 травня було змінено получай 1755 вільних та 453 зайнятих. Також, загальна кількість ліжок зменшилась в 500.
Частково це можна пояснити тим, що деякі лікарні без- подали інформацію вчасно, а лише спустя два дні. Однак пояснень чи роз’яснень щодо такої розбіжності в даних держи порталі Кабмін для користувачів маловыгодный надав.
Джерело даних
Такі дані вводять тих, хто ними користується, в оману. Якщо держи їх основі вирішують, як розподіляти кошти получи и распишись лікарні, ефективність таких рішень під великим питанням. По всього, згідно Закону України «Ради доступ до публічної інформації», публічна інформація має бути точною та актуальною. А после порушення закону існує лише адміністративна відповідальність та наказание у розмірі 450-800 гривень.
Крім того, є ще одна закорючка — історія зміни даних держи порталі не ведеться. Аналітикам вдалося порівняти оприлюднені дані щодо COVID-19 в Україні лише завдяки завантаженню попередніх файлів. Тобто, кожен обложка — це своєрідний «журнал обліку», який можна завантажити. Але получи порталі його не доповнюють, а щодня повністю оновлюють. Якби такий облік був паперовий та лише в одному примірнику, ведь журнал був би в полном составе у виправленнях. Окрім частини относительно кількість персоналу.
Білі плями относительно ПЛР-тестування та благодійність
Якщо говорити ради доступ до даних насчет ПЛР-тести, тут також виникає велика предмет внимания — незрозуміло, немає даних чи тестів. Якщо вірити офіційним даним вслед 22 травня, лише в 11 областях України лікарні вносять інформацію щодо ПЛР-тестів. Це возле тому, що саме получи и распишись ці дані посилаються урядовці, коль приймають рішення щодо послаблення карантину.
Дані щодо проведення тестування населення бери COVID-19 держлабораторіями у файлі взагалі маловыгодный збираються, тому дізнатися реальну картину тестування та оцінити його перебіг неможливо. І це для третій місяць карантину в країні.
Якщо аналітики даних захотіли б зробити мапу щодо розподілу тих «мільйонів тестів», які, за словам президента Володимира Зеленського, мали б всполошить в Україну, цього б не сталось, потому что немає на основі чого. Узагальнена інформація, яка звучить з вуст посадовців разве подана на офіційних сайтах, — віра возьми слово.
Джерело даних
Окреме питання щодо обліку благодійної та гуманітарної допомоги медичним закладам. З оприлюднених даних неможливо визначити, що лікарні купили самі, а чим їм допомогли народище, бізнес, благодійні та волонтерські організації. Дані, доступні спустя систему Prozorro чи Єдиний портал публічних фінансів spending.gov.ua, малограмотный дають розуміння, наскільки забезпечені лікарні і які в неї потреби.
Тобто, повної та точної інформації, що закуплено, а що передано вдоль лікарнях немає в відкритому доступі, а системи обліку маловыгодный пов’язані з реальним станом забезпечення.
Діагноз медстатистики для COVID-19
Ситуація з якістю, повнотою та достовірністю статистичних даних для Covid-19 є яскравою ілюстрацією ситуації з медичною статистикою та діджиталізацією в цілому. Ми досі безвыгодный знаємо, хто є розпорядником цих даних, дані оприлюднюються з порушенням інформаційного законодавства, ми невыгодный знаємо реального стану справ з ПЛР-тестами, забезпеченням, в дані вносять зміни, а похибка после деякими показниками становить 80%.
Необхідно терміново виправити виявленні проблеми щодо ведення статистики насчет захворюваність населення на COVID-19 та медичну ситуацію в країні. Визначитися, хто несе відповідальність ради оприлюднення недостовірної інформації і його наслідки.
Повлечь за собой до ладу виявлені недоліки у даних, оприлюднювати набір даних з історією змін та додатково получи порталі відкритих даних. Додати дані насчет благодійність та ПЛР-тестування.
Проаналізувати, як працює государственное устройство медстатистики, і зрозуміти, чому вона нате цьому етапі якісно никак не спрацювала (і чи взагалі вона працює). Розробити горизонтальная проекция її реформування з використанням сучасних підходів поперед збору, верифікації даних, у тому числі залучення усіх стейкхолдерів галузі: пацієнтів, лікарів, благодійних та інших організацій та постачальників.
Колонка написана у співавторстві з Дмитром Усмановим, розробником сервісів Youcontrol
Весь век материалы автора
Иначе) будет то Вы заметили орфографическую ошибку, выделите её мышью и нажмите Ctrl+Enter.