Короткий опис (реферат):
Розглянуто питання збирання, верифікації та узагальнення великої кількості експертних оцінок про наявний стан вод, наявні екологічні проблеми та впливові фактори, які збільшують ризик недосягнення екологічних цілей кожним масивом вод під час розроблення програм заходів планів управління річкового басейну (ПУРБ), спрямованих на досягнення чи стабілізацію доброго екологічного стану води у масивах вод цього басейну. Задача ускладнюється великою кількістю таких масивів вод, оскільки зібрати достовірну інформацію про об’єкти, розташовані у кожному з них, вкрай важко. Розв’язати це питання дозволить створення веб-системи з картою масивів вод і залученням великої кількості експертів із місцевих жителів, небайдужих до проблем свого довкілля. Проте, тоді виникає проблема перевірки достовірності оцінок цих експертів, враховуючи їх різну кваліфікацію, досвід роботи, різне бачення цілей ПУРБ, та проблема як їх зіставляти, щоб визначити найвразливіші регіони за різними критеріями. Для цього запропоновано вимагати від експертів не просто експертні оцінки на основі єдиних довідників варіантів можливих відповідей, а й посилання на текстові веб-ресурси, які підтверджують їх оцінки. А потім аналізувати наскільки ці джерела дійсно підтверджують кожну оцінку щодо відповідного типу проблеми для певного регіону. Авторами розглянуті різноманітні підходи для зіставлення експертних оцінок як на основі нечітких множин, так і за допомогою технологій машинного навчання та опрацювання природної мови (англ. — Natural Language Processing (NLP)). Розглянуто аналоги розроблювальної авторами системи.
Розроблено метод виявлення та верифікації пріоритетних екологічних проблем у масивах вод басейну річки за нечіткими експертними оцінками, з урахуванням ймовірностей того, що процитовані експертом текстові матеріали дійсно відповідають зазначеній проблемі. Ці ймовірності визначаються з використанням моделей NLP-технологій. Охарактеризовано етапи функціонування експертної інформаційної веб-системи для реалізації запропонованої технології, яка дозволить одночасно зібрати максимально достовірну і детальну інформацію про об’єкти масивів вод та прискорити її опрацювання і ранжування. Наведено приклад реалізації інформаційної веб-системи виявлення пріоритетних екологічних проблем у масивах вод басейну річки Південний Буг. Наведено приклади обчислення достовірності експертних оцінок із застосуванням авторської програми на Python на основі NLP-моделі BERT і логістичної регресії до реальної текстової інформації.